نهج جديد لنقل حرفي للجهد المنخفض باستخدام RNNs
قام فريق من الباحثين في جامعة كيبيك في مونتريال وجامعة فيتنام الوطنية هوشي مينه (VNU-HCM) مؤخراً بتطوير منهج للترجمة الآلية على أساس الشبكات العصبية المتكررة (RNNs). يستلزم التحويل الصوتي الترجمة الصوتية للكلمات في لغة مصدر معينة (مثل الفرنسية) إلى كلمات مكافئة في لغة مستهدفة (مثل الفيتنامية).
عن طريق التحويل الصوتي ، يتم تحويل كلمة فردية إلى كلمة مكافئة صوتياً في نظام كتابة آخر. يعتمد هذا التحويل عادة على مجموعة كبيرة من القواعد التي يحددها اللغويون ، والتي تحدد كيفية محاذاة الصوتيات ، مع مراعاة أصل الكلمة والنظام الصوتي للغة الهدف .
في السنوات الأخيرة ، طور الباحثون العديد من مناهج التعلم العميق للترجمة الآلية ، والتي تم العثور عليها كبديل قيم للنهج الإحصائية الموجودة. حفزت هذه النتائج الواعدة فريق الباحثين في جامعة du Quebec a Montreal و VNU-HCM على تطوير منهج تعليمي عميق من أجل الترجمة الصوتية للماكينة.
يستخدم أسلوبهم الشبكات العصبية المتكررة (RNNs) ، حيث وجد أنها مفيدة بشكل خاص للتعامل مع المشاكل المماثلة. ولاحظ الباحثون أن معظم الأساليب الحديثة لفن الحرف إلى صوتيات كانت تعتمد في المقام الأول على استخدام تعيينات حروف الفونيم ، بينما لا تحتاج RNNs إلى أي معلومات محاذاة.
وأوضح الباحثون في ورقتهم التي نشرت في مكتبة إيه سي إم ديجيتال: "تعتبر نماذج جرافيمي إلى صوت من المكونات الرئيسية في التعرف التلقائي على الكلام وأنظمة تحويل النص إلى كلام" . "مع أزواج اللغات منخفضة الموارد التي لا تحتوي على معاجم النطق المتاحة والمتطورة بشكل جيد ، تكون نماذج حروف الفونم إلى الصوت مفيدة بشكل خاص. هذه النماذج مبنية على محاذاة أولية بين مصدر الحروف وتسلسلات الهدف الصوتي."
في دراستهم ، قدم الباحثون طريقة جديدة لتحقيق الترجمة الآلية منخفضة الموارد ، والتي تستخدم نماذج قائمة على RNN ومعلومات المحاذاة لتسلسل الإدخال. وبالنظر إلى كلمة ما في لغة معينة غير موجودة في قاموس النطق ثنائي اللغة ، يمكن لنظامها التنبؤ تلقائيًا بتمثيله الصوتي في اللغة المستهدفة.
"مستوحى من أساليب الترجمة المتتالية المرتكزة على الشبكات العصبية المتسلسلة ، يقدم البحث الحالي نهجًا يطبق تمثيل محاذاة لتسلسل الإدخال وتضمين المصدر المصدر والهدف المسبق للتغلب على مشكلة التحويل الصوتي لزوج لغوي منخفض الموارد "وأوضح الباحثون في ورقتهم.
يجمع هذا الأسلوب الجديد بين العديد من تقنيات التعلم العميق والشبكة العصبية ، بما في ذلك أجهزة فك التشفير المشفرة وآليات الانتباه وتمثيل المحاذاة لتسلسل الإدخال والمصدر الذي تم تدريبه مسبقًا والتضمينات المستهدفة. قيم الباحثون طريقتهم في مهمة الترجمة الصوتية التي تتضمن أزواج اللغة الفرنسية-الفيتنامية منخفضة الموارد ، وحققت نتائج واعدة جدا.
وكتب الباحثون "أظهر التقييم والتجارب الفرنسية والفيتنامية أنه باستخدام قاموس النطق ثنائي اللغة الصغير المتاح لتدريب نماذج الترجمة ، تم الحصول على نتائج واعدة".
وفقا للباحثين ، كانت دراستهم من بين أول من قاموا بتحليل اللغة الفيتنامية في مهمة نقل الحروف باستخدام RNNs. وحققت طريقتهم نتائج ملحوظة ، متفوقة بذلك على أحدث الأساليب القائمة على الإحصاء والمتعددة المستويات القائمة على الإحصاء.
يمكن للنظام الجديد الذي ابتكره الباحثون أن يتعلموا بشكل فعال وتلقائي الأنظمة اللغوية من قواميس النطق الثنائية ثنائية اللغة. على الرغم من أن دراستهم طبقت بشكل خاص على مهام الترجمة بالفرنسية والفيتنامية ، إلا أنها يمكن أن تمتد إلى أي أزواج لغة أخرى منخفضة الموارد التي يتوفر بها قاموس النطق ثنائي اللغة.
وكتب الباحثون في ورقتهم "في العمل المستقبلي ، نعتزم اختبار نهجنا المقترح باستخدام قاموس نطق ثنائي اللغة أكبر ، بالإضافة إلى دراسة مقاربات أخرى ، مثل شبه المراقبة أو عدم الإشراف". "نعتزم أيضًا التحقيق في نقل التعلم باستخدام مهام أو لغات البرمجة اللغوية العصبية الأخرى في إعدادات منخفضة الموارد."
ليست هناك تعليقات: