"ميتا" تطلق نموذج ذكاء اصطناعي لتقليد الأصوات البشرية

يهدف نموذج "ميتا" للذكاء الاصطناعي إلى تقديم تجربة صوتية طبيعية وأكثر تعبيرًا.

أعلنت شركة "ميتا" الأمريكية إطلاق نموذج الذكاء الاصطناعي الجديد "Spirit LM" لتوليد الأصوات، وتقليد الأصوات البشرية. ويُعنى نموذج "ميتا" الجديد بمعالجة التحديات المتعلقة بالنماذج المتعددة الوسائط في الذكاء الاصطناعي، ويعتمد على نموذج لغوي مدرب سابقًا يحتوي على 7 مليارات معلمة.

كما يتميز هذا النموذج "بقدرته على معالجة الصوت بنحو مختلف عن النماذج التقليدية التي تعتمد على تقنيات تعرف الكلام تلقائيًا (ASR)". وبحسب بيان "ميتا" فإن هذا النموذج يهدف إلى "تقديم تجربة صوتية طبيعية وأكثر تعبيرًا، مما يشكل خطوة متقدمة في تطوير الروبوتات الذكية القادرة على التواصل الصوتي بنحو أكثر تعقيدًا وواقعية".

أشار إلى أن النهج التقليدي يؤدي إلى فقدان الكثير من التعبيرات الطبيعية في الصوت، في حين يعتمد "Spirit LM" على استخدام رموز الفونيم "الوحدات الصوتية"، والنغمات ودرجات الصوت لتجاوز هذه القيود.

تمكّن هذه المميزات هذا النموذج من إنتاج أصوات طبيعية، والتعلم من مهام جديدة تشمل تعرف الكلام، وتحويل النص إلى صوت، وتصنيف الكلام. وحتى اللحظة يتوفر نموذج "ميتا" كمشروع مفتوح المصدر للمطورين والباحثين لاستخدامه وتطويره، ويتوقع أن يستخدم مستقبلًا ضمن تطبيقات "ميتا"، مثل "واتساب" و"إنستغرام" و"فيسبوك"، وهو ما يتيح للمستخدمين التفاعل مع الذكاء الاصطناعي عبر محادثات صوتية طبيعية مليئة بالتعبيرات

.يأتي هذا في ظل السباق المحموم بين شركات التكنولوجيا والمعلومات والدردشة، للاستفادة من تقنيات الذكاء الاصطناعي لتقديم تجارب فريدة للمستخدمين.

مواضيع مرتبطة

Yalla AI... ذكاء صناعي بالعربية!

تقدّم Yalla AI مجموعة شاملة من الأدوات المصممة لخدمة الأفراد والشركات على امتداد منطقة غرب آسيا.

Footnotes: «تيك توك» تعزّز الإشراف المجتمعي على المحتوى

تعتمد آلية عمل Footnotes على نظام تصنيف يُعرف بـ«الجسر»، وهو نظام مصمَّم لتعزيز الاتفاق بين المستخدمين..

ميزة جديدة تتيح ربط حساب واتساب بإنستغرام

لتفعيل هذه الميزة الجديدة، يجب أن يكون المستخدم جزءًا من "WhatsApp Beta

كلمات مفتاحية

ميتا