خبراء عرب يُقدمون بالرباط خلاصات أبحاثهم حول حوسبة اللغة العربية

الرئيسية » إعلام وتكنولوجيا » خبراء عرب يُقدمون بالرباط خلاصات أبحاثهم حول حوسبة اللغة العربية

على مدى يومين اجتمع مؤخرا بالرباط خبراء من دول عربية وأجنبية من تخصصات مختلفة في مجال البحث في اللغة العربية، وتدارسوا فيما بينهم آخر ما توصلت إليه الأبحاث الرامية إلى جعل اللغة العربية تواكب عالم التقنية والحوسبة؛ وفي جو علمي صريح وضع هؤلاء الإصبع على مكن الخلل الذي يعيق لغة الضاد ويجعلها غير قادرة على التحول إلى تشفير وبالتالي قابليتها للقراء آليا بشكل سليم، وهو ما يتطلب المزيد من البحث والدعم لهذه اللغة العربية الطبيعية التي لها من الإمكانات ما يجعلها قاردة على رفع التحدي والدخول في عالم الحوسبة جنبا إلى جنب مع باقي اللغات الأخرى

حوسبة اللغة العربية

في لقاء علمي صريح أقيم مؤخرا بالعاصمة المغربية وقف مجموعة من الباحثين في مجال اللغة العربية على مكامن ضعف لغتنا العربية التي تجعلها غير قادرة على مواكبة العصر الذي تسيطر عليه التقنية والتكنولوجيا؛ إنه ضعف جعل البعض يدق ناقوس الخطر محذرا من مغبة التراخي في تقديم الدعم اللازم للغة الضاد حتى تستطيع مسايرة ومجاراة نظيراتها الأخريات من لغات العالم.

وضعية اللغة العربية لا تبعث على الارتياح وهي في “منعطف خطير”، هذا ما خلص إليه استنتاج خبير عربي، شارك في الندوة الرابعة للمعالجة الآلية للغة العربية، التي نظمتها مؤخرا جامعة محمد الخامس-السويسي ومعهد الدراسات والأبحاث للتعريب، وذلك بسبب عدم إيلاء الاهتمام اللازم وغياب الدعم الكفيل بجعل اللغة العربية قادرة على رفع التحدي وبالتالي وُلوجها التقنية وخاصة منها الحوسبة، وهي الإمكانية التي لن تتأتى لها إلا عندما تصبح لغة قابلة للتشفير والتحويل إلى أرقام.

ويبدو أن “الأدوات التقليدية”، على حد وصف متدخلين آخرين في الندوة، والتي يقصدون بها مسألة حركات التشكيل (الشكل) التي تميز اللغة العربية عن باقي لغات العالم الأخرى، وكذا قواعد الصرف والنحو والبلاغة والإملاء، تعتبر إحدى العوائق الأكثر إشكالا التي تحول دون تحويل اللغة العربية إلى لغة مقروؤة آليا من طرف الحاسوب، وهو ما يعيق بالنتيجة قدرة محركات البحث العالمية، في الشبكة العنكبوتية، ولاسيما محرك موقع “غوغل” الشهير على قراءة هذه اللغة.

وبحسب هؤلاء الخبراء العرب، الذين بالمناسبة منهم من يحاضر في أعرق جامعات بريطانيا والولايات المتحدة الأمريكية، ومنهم من يُدرس بمختلف الجامعات والمعاهد العربية ومنها المغربية، فإن وحده الدعم اللازم لمزيد من الأبحاث حول اللغة العربية، هو القادر على جعلها قابلة لهذا التشفير. إنه التشفير الآلي الذي يمكن أن يتم عندما يستطيع الباحثون إيجاد أدوات “بديلة” للأدوات “التقليدية”؛ ويبدو أن ذلك ليس بالأمر الهين مادام أن العرب أنفسهم منهم من لا يستطيع القيام بقراءة سليمة للغته عندما يتم التخلي عن حركات التّشكيل مثلا.

العربية..والتحديات !

خلال الندوة المذكورة تعاقبت مختلف المداخلات حول مواضيع ومحاور مختلفة منها بالخصوص؛ تطوير الموارد اللسانية وتنميطها ومعيرتها واستغلالها (المتن العربي، المعجم العربي)، واستغلال الموارد اللسانية في تطبيقات حوسبة اللغة العربية، وموضوع التوليد والتحليل الآليان للصرف والتركيب والدلالة والتداوليات والخطاب، وتقييم ومقارنة الموارد اللسانية وتطبيقات حوسبة اللغة العربية، ومحور استغلال حوسبة اللغة العربية في التطبيقات الصناعية، والتلخيص الآلي للنصوص العربية، وأنظمة استرجاع الوثائق ومحركات البحث وأنظمة المساءلة، وغيرها من المواضيع والمحاور التي كانت تصب كلها في اتجاه البحث عن إمكانات اللغة العربية ومكامن ضعفها أمام التقنية الجديدة واستعمال الحاسوب.

وبرأي الباحث في إحدى جامعات ولاية كاليفورنيا الأمريكية، الدكتور علي فرغلي، فإن التشكيل (حركات الشكل) باللغة العربية تُعَد إحدى العقبات أمام اندماج اللغة العربية في عوالم الحوسبة والآلة، بحيث أن هذه الحركات التشكيلية علاوة على قواعد النحو، التي تجعل الحركات التشكيلية تغير من معنى الكلمات ومكانتها بالجُمل، وهو ما ليس له مقابل باللغات الأخرى، تجعل الحاسوب عاجزا عن فهمها وقراءتها وبالتالي تحويلها رقميا بطريقة سليمة، وهو ما يؤثر بالنتيجة على مفهوم كلام مكتوب باللغة العربية عندما تتم ترجمته آليا.

ورأى فرغلي العامل أيضا في مؤسسات أمريكية مختلفة تُعنى بمجال البحث اللغوي، أن اللغة العربية لها من المزايا الشيء الكثير الذي يجعلها قادرة على مواجهة التطور التكنولوجي، على اعتبار أنها لغة طبيعية، ولذلك فإن على العرب الاهتمام أكثر بالحث اللغوي لجعل لغتهم تتوفر على آليات للمعالجة وعلى أدوات بديلة وقابلة للقراءة حاسوبيا، وهو ما يتطلب مقاربة علمية دقيقة تقوم على معطيات إحصائية، لأن من شأن ذلك وحده أن يكون قمينا بجعل اللغة قابلة للتشفير.

وفي ورقة الباحث علي فرغلي، الذي كان المتدخل الرئيس بالندوة، نجد أن اللسانيين الحاسوبيين عبروا مؤخرا عن تحفظهم على الاعتماد الحصري على مقاربة التعلم الآلي، وإهمال مساهمة المقاربات الرمزية، وفي هذا الشأن تأثرت البحوث في اللسانيات الحاسوبية العربية بالنماذج السائدة في مجال معالجة اللغة الطبيعية.

وعرَض فرغلي لما وصفها “مظاهر القوة والضعف” في كلا المقاربتين، بتقديم أمثلة من اللغة العربية بوصفها لغة طبيعية، مع العلم أن اللغة العربية تتقاسم عددا من الخصائص مع لغات أخرى مثل اللغة الإنجليزية. ومع ذلك فإن خصوصيتها تكمن من حيث تاريخها، وطبيعة بنيتها الداخلية، وارتباطها الوثيق بالإسلام والثقافة العربية ومسألة الهوية. ولذلك فإن أي نظام معالجة آلية للغة العربية لا يأخذ خصوصية هذه اللغة بعين الاعتبار يكون غير كاف.

وللوقوف أكثر عند قدرة اللغة العربية على التشفير، قام الباحث بتحليل لغوي لمجموعة من المدونات، بحيث تعتمد مناهج التصورات الرمزية على أدوات بلاغية ولغوية لتحليل النص؛ ويتعلق الأمر هنا برصد العلاقات الدلالية والبلاغية القائمة بين مختلف وحدات النص، إذ لا يمكن تطبيق هذه المناهج إلا بتحليل مسبق ومعمق لمدونة الدراسة التي تقوم عليها الدراسات اللغوية.

وفي هذا السياق قام الباحث بالولايات المتحدة الأمريكية، علي فرغلي، بتحليل معمق لمدونة متكونة من خمس مائة مقال صحفي، مكنته من رصد مجموعة من العلامات اللغوية (المتكونة من مؤشرات بلاغية وعلامات صرفية)، والعلاقات البلاغية التي تهدف إلى ربط مختلف وحدات المقال ببعضها البعض قصد إعادة تشكيل النص على نحو هرمي. وتم تنظيم هذه المؤشرات والعلامات اللغوية وفق أطر بلاغية وقواعد صرفية.

من خلال الدراسة المعمقة لمجمل مقالات المدونة موضوع الدراسة تبين أن بعض المؤشرات البلاغية والعلامات الصرفية تكون على قدر كبير من الأهمية من حيث إسهامها في تحديد العلاقات البلاغية التي تربط بين مختلف وحدات النص، ويتمثل دور هذه المؤشرات البلاغية التي تُكون الأطر البلاغية، في الربط أولا بين أصغر جزئين (قطاعيين) متتاليين في النص، أحدهما يكون نواة –جزء أساسي من النص من أجل التناسق- والآخر يكون نواة أوفرعا –جزء اختياري- وثانيا في تحديد نوع العلاقة البلاغية التي تربط بينهما، بينما يتمثل دور العلامات الصرفية التي تكون القواعد الصرفية، في إثراء وإصلاح  العلاقات البلاغية المكتشفة.

وتم تصنيف هذه المؤشرات البلاغية والعلامات الصرفية وفقا للعلامات البلاغية لتكون لدينا، في كل علاقة بلاغية، مجموعة من العلامات اللغوية متعددة الأصناف (أسماء، أفعال، أدوات ربط، إلخ..) وتقوم دائما بنفس الوظائف الدلالية، وهي تصنف إلى نوعين؛ مؤشرات محفزة ومؤشرات إضافية؛ حيث إن المؤشرات المحفزة تعلن عن مفاهيم أساسية، بينما المؤشرات الإضافية يتم البحث عنها في مساحة محددة انطلاقا من المؤشر المحفز وتستعمل سياقيا لتأكيد العلاقة البلاغية التي أكدها المؤشر المحفز أو نفاها.

وفيما يخص التحليل الصرفي فإن الهدف الرئيس من هنذه المرحلة من البحث، يقول الباحث العربي فرغلي، كان هو تحديد الخصائص الصرفية من صفات نحوية والعدد والجنس لكل كلمة، مقسمة وفقا إلى الجزء الثابت والأجزاء المضافة من سوابق ولواحق ودواخل؛ فنظام “RST Analyse” يستعين في هذه الخطوة بالمحلل الصرفي MORPH-2 للنصوص العربية وغير المشكولة. وللإشارة فإن MORPH-2 يعتمد في تحليله الصرفي على معجم متكون من 3266 وحدة من صيغة ثلاثية ورباعية معتمدة في اللغة العربيةن ويقوم هذا المحلل على طريقة تدعيم الكلمات بعلامات تبرز صنفها وفئتها: اسم أو فعل أو حرف، وزمن وقوع الفعل (ماض، مضارع، أو حاضر)، إلى غير ذلك من الخصائص الصرفية والمعلومات النحوية كالعدد والجنس. وتقدم هذه المرحلة، كنتيجة، نص المصدر في شكل (XML) مدعم بعلامات تحيط بكل كلمة مكونة لكل قطاعات النص المقسمة وفقا للمرحلة السابقة.

تقنيات الويب..واللغة

وحول “آفاق استخدام أدوات الويب 2.0 في تعزيز أنشطة مجتمع تعلم اللغة العربية الافتراضي  لمرحلة التعليم الجامعي من وجهة نظر خبراء المجال”، تحدثت أوراق كل من الباحث محمد عايض القحطاني، والباحث عامر بن مترك البيشي، والباحث سعيد بن فنيس الشهراني، من كلية التربية في بيشة بجامعة الملك خالد، حيث هدفت الدراسة إلى التعرف على آفاق استخدام أدوات الويب 2.0 (Web 2.0 Tools) في تعزيز أنشطة مجتمع تعلم اللغة العربية الافتراضي لمرحلة التعليم الجامعي من وجهة نظر خبراء المجال، من خلال محاولة الإجابة عن عدد من الأسئلة من قبيل؛ ما دور استخدام أدوات الويب 2.0 في تعزيز البناء الاجتماعي لمجتمع تعلم اللغة العربية الافتراضي لمرحلة التعليم الجامعي من وجهة نظر خبراء المجال؟ وما هو دور استخدام أدوات الويب 2.0 في تعزيز عمليات إدارة المعرفة في مجتمع تعلم اللغة العربية الافتراضي لمرحلة التعليم الجامعي من وجهة نظر خبراء المجال؟ ثم ما دور استخدام أدوات الويب 2.0 في إيجاد بيئة إلكترونية قابلة للاستخدام من قبل أعضاء مجتمع تعلم اللغة العربية الافتراضي لمرحلة التعليم الجامعي من وجهة نظر خبراء المجال؟ وغيرها من الأسئلة الأخرى التي حاول الخبراء الإجابة عنها.

وأظهرت نتائج الدراسة التي قام بها هؤلاء أن جميع المستجوبين تقريبا وافقوا بشدة أو وافقوا على أن أدوات الويب 2.0  (web 2.0 Tools ) تساعد في تعزيز أنشطة مجتمع تعلم اللغة العربية الافتراضي لمرحلة التعليم الجامعي في المجالات التالية: تعزيز البناء الاجتماعي لمجتمع التعلم، وتعزيز المشاركة المتبادلة في التواصل والتفاعل بين أعضاء مجتمع التعلم، وتعزيز المشاركة المتبادلة في التواصل والتفاعل بين أعضاء مجتمع التعلم، وتعزيز عمليات إدارة المعرفة في مجتمع التعلم، ودعم نماذج التعلم التشاركي والمستقل، وتنويع مصادر المعرفة لأعضاء المجتمع اللغوي؛ إضافة إلى تعزيزها لأنشطة مجتمع تعلم اللغة العربية من خلال توفير نوع من الأمن والخصوصية لأعضاء المجتمع، إضافة لتميزها بسهولة وقابلية الاستخدام؛ وأخيرا تضمنت الدراسة عددا من التوصيات والمقترحات، وألقت الضوء أيضا على تقنيات الويب 2.0 وآلية توظيفها.

في الحاجة إلى فهرسة وبناء معجم عربي حاسوبي..

في ورقة بعنوان “الفهرسة الدلالية للنصوص العربية” لكل من الباحثين بخوش عبد العالي ويمينة تليلي غياسة من الجزائر، يرى الباحثان أن الهدف من ورقتهما هو تحديد كلمات تمثل الفكرة الرئيسية لفقرة أو لنص معين.

ولفهرسة النصوص العربية يقترح الباحثان نموذجا يعتمد على الأشعة المفهومية؛ هذه الأشعة تهدف -بحسبهما- إلى تمثيل جملة الأفكار المحتواة في مقطع نصي (كلمة، جملة، نص)، إذ أن هذا النموذج يستند على المفهوم اللغوي الحديث “نظرية الحقول الدلالية”، بالاعتماد على العلاقات الدلالية (الترادف، التضاد، الاشتمال..) الموجودة بين كلمات نص عربي.

واستنادا للسمات الدلالية لهذه الكلمات، يبين الباحثان مراحل وإجراءات تكوين قاعدة بيانات للحقول الدلالية للنص، ويوظفا هذه الحقول لتشكيل “فضاء شعاعي”، ثم يقوما في دراستهما بحساب مركبات أشعة معاني المقاطع النصية في هذا الفضاء الشعاعي باستعمال طريقة القياسات التشابهية، وأخيرا يتم استعمال هذا النموذج لفهرسة نصوص عربية.

ويقصد الباحثان بـ”فهرسة النص” عملية تسمح بتمثيل نص أو مقطع نصي بكلمة أو مجموعة من الكلمات لاستعمالها في ما بعد في عملية البحث عن هذا النص، ولإيجاد هذه الكلمات يتبع الباحثان مجموعة من الخطوات، منها بالخصوص؛ استخراج السمات الدلالية المشتركة بين الكلمات المكونة للنص، وحساب مركبات الشعاع الممثل لمعنى الكلمة التي سماتها الدلالية هي السمات المشتركة بين الكلمات المكونة للنص، وحساب المسافة الزاوية بين الشعاع الممثل لمعنى هذه الأخيرة وباقي الأشعة الممثلة لباقي معاني الكلمات المكونة للنص، بحيث الكلمة الممثلة بالشعاع الأقرب هي الكلمة تمثل فهرسا للنص، ووضع هذه الكلمة ورقم النص الموافق لها في جدول.

ويختم الباحثان ورقتهما بالقول أن موضوع الفهرسة الدلالية في اللغة العربية موضوع جديد في حقل الدراسات الأكاديمية، لذا لم يحض بالبحث الكافي؛ وبأن النتائج المتوصل إليها تعتبر مرضية إلى حد ما وقابلة للتجسيد خاصة إذا ساهم المختصون في علم اللسانيات واللغة العربي عموما في الجانب المتعلق بتخصصهم ولاسيما الحقول والسمات الدلالية للكلمات في اللغة العربية.

وتحت عنوان “البناء الدلالي للمعجم العربي الحاسوبي”، تحدثت ورقة الباحث المغربي أحمد بريسول الأستاذ المحاضر بمعهد الدراسات والأبحاث للتعريب التابع لجماعة محمد الخامس السويسي، قدم الباحث هندسة لبناء معجم عربي حاسوبي لمعجم الصور الدلالية قادر على ترميز كم هائل من المعلومات الدلالية.

وفي ورقته البحثية يعرض الباحث لنموذج نساج عام لمعجم الصور الدلالية لترميز كم هائل من المعلومات الدلالية. وتتمثل خاصيته الأساسية في كفايته لضبط الأبعاد المختلفة لمعنى الكلمة. وتفترض الورقة أن المفردات الأساسية في معجم الصور الدلالية ترتكز على توسيع بنية الخصائص (qualia structure) لبنية الأنماط الدلالية/ التصورية.

وتتضمن بنية الخصائص، بحسب الورقة، أربعة أدوار مختلفة تجيب على أسئلة مختلفة تتعلق بخصائص الوحدة المعجمية:

أ‌)  الدور الصوري Formal role  يقدم المعلومة التي تميز ذاتا داخل مجموعة واسعة من الذوات.

ب‌)  الدور المكوني constitutive role  يعبر عن تنوع علاقات تخص التكوين الداخلي لذات معينة.

ت‌)  الدور الغائي Telic role يخص الوظيفة أو الغاية النمطية لذات معينة.

ث‌)  الدور المنفذي Agentive role  يعبر عن أصل أو مصدر ذات معينة.

وتلعب هذه الأبعاد الأربعة دورا بارزا في تحديد السلوك اللغوي لمعاني المفردات، وكذلك في تفسير الإواليات التوليدية على أساس الإبداع المعجمي..

ويضيف الباحث في دراسته أنه يتم استعمال بنية الخصائص في معجم الصور الدلالية بوصفها تركيبا أساسا (Basic syntax) لبناء معاني الكلمة؛ ويمكن أن ينظر إلى كل دور بوصفه عنصرا مستقلا أو بعدا لمفردة بالنسبة للوصف الدلالي. وهكذا، فمن الافتراضات الأساسية التي يقوم عليها معجم الصور الدلالية اختلاف معاني الكلمات على أساس تركيبها الداخلي. ويمكن وصف هذا التركيب على أساس أنطولوجيا قائمة على أبعاد مختلفة؛ فبعض الكلمات يمكن أن توصف بواسطة أنماط بسيطة تعني أنها ورثت معلومتها من عجرة أم واحدة فقط في الأنطولوجيا. وتكون بعض الكلمات الأخرى جد معقدة لأنها ترث المعلومة من أكثر من عجرة أم تبعا لمبدأ التوارث المتعامد.

نورالدين اليزيد

شارك:

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *