هل يتكلم الحاسوب العربية؟

مقالات رأي و تحليلات الاثنين ١٠/أبريل/٢٠١٧ ٠٤:٣٠ ص
هل يتكلم الحاسوب العربية؟

أدريان بريدجووتر
مرت تقنية التعرف على الكلام بمراحل تقدم سريعة في السنوات الأخيرة، إذ بدأنا نرى ظهور الأنظمة التي تعمل بلغة شبه طبيعية على غرار تطبيق سيري من شركة أبل وأليكسا من أمازون وكورتانا من مايكروسوفت. و«المساعد الافتراضي» قادر على التواصل لفظيا مع المستخدم وهو آخذ في التطور السريع.

يُعتبر جعل الحواسيب تفهم اللغة الطبيعية من بين التحديات العديدة التي تواجه تطوير هذه التقنيات، وغالبا ما توازي صعوبة فهم الكلام المنطوق صعوبة تعويض الكلام المفقود. يذهب حاليا التقنيون العاملون على تطوير تعرف الحاسوب على الكلام إلى أن البشر يفوِّتون كلمة أو كلمتين من كل 20 كلمة يسمعونها. وعلى هذا المنوال، فإن الإنسان العادي يفوِّت 100 كلمة من كل محادثة تستغرق خمس دقائق.

بطبيعة الحال، العقل البشري مبرمج لملء الفراغات بشكل مبهر جدّاً، إذ إننا قادرون بالفطرة على تعويض مواضع النقص في المحادثات لأن لدينا مستوى أعلى من الوعي بالسياق يسمح لنا بفهم الأشياء حتى في حال سماعنا نصف ما يقال فقط.
ولكن هل يمكنك تخيل مدى صعوبة ذلك على الحاسوب؟ كما نعلم، فإن «عقل» الحاسوب لا يعرف سوى ما نخبره به، لذلك يستحيل من الناحية النظرية أن نحصل منه على أكثر مما زودناه به. وحتى وقت قريب، لم «تفهم» البرمجيات أي متغيِّر أو سياق خارجي غير موجود داخل الأجهزة التي تعمل بها.
سبب صعوبة التعرف على الكلام باللغة العربية: تزداد صعوبة الأمور في الواقع عندما نتناول مسألة التعرف على الكلام باللغة العربية. واللغة العربية واحدةٌ من اللغات الرسمية الست للأمم المتحدة، ويتحدث بها اليوم أكثر من 400 مليون شخص. وبما أن تقنيات التعرف على الكلام وما يُعرف بتقنية فهم اللغات الطبيعية (NLU) تعمل حاليا على إيجاد حل للفروق الاصطلاحية الدقيقة في اللغات واللهجات.. ما مدى صعوبة «تكلم» الحاسوب باللغة العربية وما الذي يجعلها تحديا خاصا؟
التحدي الأساسي لا ينبع من اللهجات واللكنات العربية المتعددة، بل ينبع في الواقع من أن تصميم «المحركات» البرمجية للتعرف على الكلام يكون في البداية عادة باللهجات الإنجليزية أو غيرها من الألمانية أو الهندوأوروبية أو اللاتينية. ثم تضاف اللغة العربية لاحقا.
صممت شركات مثل شركة آرتيفيشال سولوشنز ومقرها السويد محركات برمجية للتعرف على الكلام تتمتع ببنية مركزية تصنف الأفعال والصفات والأسماء وأجزاء الكلام الأخرى المشتركة بين جميع اللغات. وبالاستعانة بهذا المحرك الأساسي، يمكن للشركة تصميم «حزم اللغات» وفي نهاية المطاف حزم اللهجات.
وكما تبدأ كل لغات الشرق الأوسط باللغة العربية الفصحى، يمكننا بعد ذلك تعزيز البرنامج لمعالجة لهجات مختلفة، على سبيل المثال لمعرفة الفرق بين الجيم المصرية غير المعطشة «الصوت g» والجيم اللبنانية أو الخليجية المعطشة «الصوت Ʒ» في الكلمات.

الفروق الدقيقة في اللغة

يقول نيلز لينك، المدير الأول للبحوث المؤسسية في شركة نيوانس كوميونيكيشنز للتعرف على الكلام: «بوجه عام، يمكن أن تقوم أنظمة التعرف التلقائي على الكلام وفهم اللغة الطبيعية بمعالجة اللغة العربية مثل أي لغة أخرى. ولكن «اللغة العربية» هي اللغة الأم لعائلة كاملة من اللهجات أو اللغات الفرعية».
يوضح نيلز أن شركته تقدم إصدارا «قياسيا» باللغة العربية وخيارا آخر باللهجة الأردنية. والأمر المثير للاهتمام هو قدرة نيوانس كوميونيكيشنز على تطبيق ذكاء التعلم الآلي على ما يسمى بـ»المصنِّف» لاكتشاف لهجة المتكلم تلقائيا والتحويل إلى النموذج المناسب.
تعد أنظمة التعلم الآلي متواضعة نسبيا مقارنة بالدماغ البشري. فالناس غالبا ما يخبرونك بأنهم متأكدون 100 % من حقيقة ما، أما «دماغ» التعلم الآلي فسيخبرنا بالنسبة المئوية لدرجة الصحة التي يعتقد أنه حققها وفي الوقت نفسه يعمل على أن يصبح أذكى. ولهذا السبب غالبا ما تسمع البرمجيات الصوتية الآلية المستخدمة بالهاتف تقول لك: «أعتقد أنك ربما تريد المنتج س» أو «أعتقد أنك تقول ص»، وهلم جرا. وهذا أمر مهم في الشرق الأوسط لأن تقنية تتبع الصوت آخذة في النمو.

الخدمات المصرفية

يقول رئيس وحدة الأعمال الاستراتيجية في الشرق الأوسط وأفريقيا بشركة سيرفيون المتخصصة في إدارة تجارب الزبائن أنيل كومار: «إننا نشهد ذيوع شعبية الذكاء الاصطناعي (AI) وتقنية التعرف على الكلام في العالم العربي، وخاصة في مجال الخدمات المصرفية في الشرق الأوسط وخدمات «بصمة الصوت ككلمة مرور». ومع مرور الوقت، فإن التقنية التي تستطيع التعرف على أنماط الصوت الدقيقة و«فهمها» سيكون لها عظيم الأثر على جميع مجالات خدمة الزبائن والعمليات التجارية في المنطقة».
يضيف أنيل كومار: «إن تقنيات التعرف على الكلام باللغة العربية والذكاء الاصطناعي والتعلم الآلي تؤثر تأثيرا كبيرا في المجالات التي ندرك أننا لا يمكن أن نبرمج كل شيء بها مسبقا. تركنا الآلة تتعلم بنفسها وتضبط من دقائق التعرف على الكلام عن طريق جمع البيانات من تفاعلات الزبائن. بعد ثلاثة أشهر من «التعلم» الآلي والضبط الدقيق، لمسنا بالفعل تحسنا يزيد على 80 % في الدقة في تطبيقاتنا الأخيرة، وهذا بالتأكيد أفضل مما يستطيع الكثير من البشر تقديمه».

الأبجدية العربية.. طفرة في الاستنباط

كما علمنا، فإن التعلم الآلي يساعد في الاستعانة بتقنية التعرف على الكلام باللغة العربية على نطاق أوسع في العالم الواقعي لأنه يساعدنا في التغلب على أوجه عدم الاتساق في الكلمات المنطوقة. ولكن لن يكون الأمر بتلك السهولة أبدا! وأحد التحديات التي قد نواجهها دائما مع اللغة العربية هي أن نظام الكتابة (الأبجدية) يتكون فقط من الحروف الساكنة ويجب على القارئ أن «يستنبط» حروف العلة.
يوضح بينوا برارد، رئيس قسم اللغات في شركة «سبيتش ماتيكس» للتعرف على الكلام: «اعتدنا تماما على هذا في العالم الواقعي، ولكن توجد مشكلة لأن برنامج التعرف على الكلام يتطلب، في مرحلة ما، الربط بين النطق والهجاء. وهذا يعني أن العملية ستكون أصعب دائما إذا توافرت معلومات أقل عن الهجاء».
والخبر السار هو أننا نتغلب كل هذه التحديات، وأن التعرف على الكلام باللغة العربية والذكاء الاصطناعي يتطوران بسرعة. وهناك المزيد من الأخبار السارة رغم أن اللغة العربية تُكتب من اليمين إلى اليسار بعكس العديد من تسلسلات الحاسوب المستخدمة لفهم الكلام العربي، إذ تُكتب من اليسار إلى اليمين.
وكما يوضح بينوا برارد، بالنسبة للآلة فإن التسلسل عملية لا خلاف عليها، لذلك عكس الاتجاه ليس بالأمر العسير. لكن ينبغي توضيح أن هذه العملية ليست كصورة المرآة المعكوسة، بل هناك العديد من التفاصيل التي ينبغي الاحتراس لها.

تكوين الكلمات العربية

يقول بينوا برارد في النهاية: «وأخيرا وليس آخرا، علم الصرف العربي علم ثري ومتعمق، فنهايات الكلمات تتغير تبعا للجنس والعدد ووظيفة الكلمة في الكلام. ويمكن تكوين الكلمات بإلحاق أدوات التعريف وحروف الجر وأدوات الربط بالكلمة التالية».
هل يمكن لتكوين الكلمات العربية بالإضافة إلى التحديات المتعلقة بأبجدية اللهجات أن تكون نقطة الضعف التي لا سبيل لعلاجها في التعرف على الكلام باللغة العربية؟ كلا! لكن هذه التحديات تساعد في شرح السبب وراء صعوبة التعرف على الكلام باللغة العربية والسبب أننا ما زلنا نعمل على تحسين هذه التقنيات. من المهم تسريع العمل على هذه التقنية، فإننا ندرك أن الصوت هو واجهة المستخدم المستقبلية ويمكن أن نرى بوضوح أنظمة الذكاء الاصطناعي التي ستعتمد على قدرات اللغة الطبيعية شبه المثالية. ورغم أن اللغة العربية تتخلف الآن عن اللغة الإنجليزية، فإن المطورين يعملون الآن على حل التحديات الخاصة باللغة العربية.
هل يتكلم الحاسوب اللغة العربية؟ قليلا... ولكنه سيتحسن كثيرا عما قريب.

متخصص في شؤون تطوير البرمجيات

وإدارة المشاريع والتكنولوجيا