«البيانات والذكاء الاصطناعي» بمؤتمر مجمع اللغة العربية

أ.د.محسن رشوان (الخبير بالمجمع)
أ.د.محسن رشوان (الخبير بالمجمع)

واصل مؤتمر مجمع اللغة العربية بالقاهرة برئاسة أ.د.عبدالوهاب عبدالحافظ (رئيس المجمع) انعقاد جلساته الأربعاء 26 من أبريل 2024م تحت عنوان "اللغة العربية وتحديات العصر: تصورات، واقتراحات، وحلول"؛ حيث ناقش أعضاء المؤتمر في جلسته المغلقة أعمال لجنة أصول اللغة، والمصطلحات المقدمة من لجنة النفط.

اقرأ أيضًا| «صور المحتوى الرقمي العربي على الإنترنت» بمؤتمر مجمع اللغة العربية

وفي جلسته العلنية التي رأسها وأدارها أ.د.محمد رجب الوزير (عضو المجمع) ألقى أ.د.محسن رشوان (الخبير بالمجمع) بحثًا بعنوان "البيانات والذكاء الاصطناعي " بيَّن فيه أن من المجالاتِ المذهلةِ التي قدَّمها الذكاءُ الاصطناعي في ثورته التي ملأت الدنيا وشغلت الناس تقنيات معالجةُ اللغات الطبيعية. وهذه التقنيات تقوم على ثلاثة أركان أساسية تمثل جملة متماسكة في تقديم التقنيات والتطبيقات، فالركن الأول هو البيانات وفرة ودقة، والركن الثاني هو الأساس الرياضي الذى تبني عليه خوارزمية التعلم وخاصة ما يسمى التعلم العميق، والركن الثالث هو وفرة العتاد المناسب من الحواسيب والتى تعمل بالتوازي. البيانات تمثل الزاد الذي يأخذ معظم الوقت والجهد تجميعا وإعدادًا.


وأضاف د.رشوان قائلًا: إذا كنا نقر بأن العالم قفز قفزات هائلة في معالجة اللغات الطبيعية، فعلينا أيضا أن نعترف بأن اللغة العربية لم تأخذ ما تستحقه في هذه التقنيات؛ بسبب تحديات كبرى يواجهها التعلم العميق عند تعامله مع اللغة العربية، تحديات تتعلق بطبيعة اللغة نفسها التي تتعقد بنيتها الصرفية والتركيبية وما يتبع ذلك من تحديات علم الدلالة.


وقدَّم د.رشوان مقارنة بين تطوير بعض التقنيات للغة العربية مع نظيرتها باللغة الإنجليزية؛ حيث تبيَّن أننا نحتاج لكمية أكبر من البيانات لتصل دقة التقنية لنفس المستوى، فمثلا لتطوير تقنية للتعرف على الكلام وفي تخصص محدد مثل مجال الأعمال وجدنا أن اللغة الإنجليزية تحتاج لنحو 64 ألف كلمة للوصول إلى لتغطية تصل لنحو 99% من الكلمات المستخدمة في هذا المجال. بينما للغة العربية احتجنا لنحو 500 ألف كلمة للوصول لنفس مستوى التغطية. 


وبيَّن د.رشوان أن التحديات التي تواجه الذكاء الاصطناعي لا تقتصر على طبيعة اللغة العربية فقط، بل هناك عوامل أخرى مثل قلة الباحثين المدربين مع ندرة في البيانات الجاهزة كما وكيفيا للتعامل مع الآلة وغيرها من العوامل.


وأضاف د.رشوان أن تجهيز البيانات يمر بعدة مراحل تبدأ بالتخطيط وتحديد المقصود ثم جمع البيانات وتنظيفها وترميزها وانتهاء بالتقييم والاختبارات، وفي كل مرحلة هناك تفاصيل كثيرة بطبيعة الحال. وأمام المتعاملين مع البيانات عدة تحديات منها الاحتياج لكم كبير جدًّا لاحتياج النماذج اللغوية الضخمة، ثم إعداد بيانات اضافية لعمل اختبارات متعددة لكشف مواطن القوة والضعف في النماذج المولدة. وثمة مهمة أخرى ظهرت مع ظهور النماذج اللغوية الضخمة مثل الشات جي بي تي وغيرها وهى ظاهرة الانحياز فيما تولده من إجابات ضد دين أو جنس أو لون من البشر، وهنا لابد من إعداد اختبارات لكشف مدى التحيز ثم كيفية معالجته والتخلص منه، وأن الحاجة ماسة وضرورية لتطوير تقنيات تجيب على أسئلة البشر وتقوم بالتلخيص والترجمة وتحويل النص إلى صوت والعكس، وتحويل الصور إلى نص والعكس وغيرها من التطبيقات التي تسهل على الناس حياتهم.


واختتم د.رشوان بحثه بقوله: "إن ما نشهده الآن هو محاولة لمحاكاة العقل الذي خلقه الله، ورغم التفوق في المحاكاة فإن العجز ما زال ظاهرا أما صنع الله الذي أتقن كل شيء، وأحكم خلق الإنسان الذي ما زالت كثير من دقائقه ألغازا حيرت العلماء. لو أردنا بأحدث تقنيات العصر تصميم معمل يقارب ما لدى الانسان من مخ بشري لاحتجنا لأكثر من عشرين تريليون دولار وحجم ووزن ملايين المرات أكبر من حجم ووزن المخ البشري".