"ميتا" تطلق نموذج ذكاء اصطناعي لتقليد الأصوات البشرية

يهدف نموذج "ميتا" للذكاء الاصطناعي إلى تقديم تجربة صوتية طبيعية وأكثر تعبيرًا.

أعلنت شركة "ميتا" الأمريكية إطلاق نموذج الذكاء الاصطناعي الجديد "Spirit LM" لتوليد الأصوات، وتقليد الأصوات البشرية. ويُعنى نموذج "ميتا" الجديد بمعالجة التحديات المتعلقة بالنماذج المتعددة الوسائط في الذكاء الاصطناعي، ويعتمد على نموذج لغوي مدرب سابقًا يحتوي على 7 مليارات معلمة.

كما يتميز هذا النموذج "بقدرته على معالجة الصوت بنحو مختلف عن النماذج التقليدية التي تعتمد على تقنيات تعرف الكلام تلقائيًا (ASR)". وبحسب بيان "ميتا" فإن هذا النموذج يهدف إلى "تقديم تجربة صوتية طبيعية وأكثر تعبيرًا، مما يشكل خطوة متقدمة في تطوير الروبوتات الذكية القادرة على التواصل الصوتي بنحو أكثر تعقيدًا وواقعية".

أشار إلى أن النهج التقليدي يؤدي إلى فقدان الكثير من التعبيرات الطبيعية في الصوت، في حين يعتمد "Spirit LM" على استخدام رموز الفونيم "الوحدات الصوتية"، والنغمات ودرجات الصوت لتجاوز هذه القيود.

تمكّن هذه المميزات هذا النموذج من إنتاج أصوات طبيعية، والتعلم من مهام جديدة تشمل تعرف الكلام، وتحويل النص إلى صوت، وتصنيف الكلام. وحتى اللحظة يتوفر نموذج "ميتا" كمشروع مفتوح المصدر للمطورين والباحثين لاستخدامه وتطويره، ويتوقع أن يستخدم مستقبلًا ضمن تطبيقات "ميتا"، مثل "واتساب" و"إنستغرام" و"فيسبوك"، وهو ما يتيح للمستخدمين التفاعل مع الذكاء الاصطناعي عبر محادثات صوتية طبيعية مليئة بالتعبيرات

.يأتي هذا في ظل السباق المحموم بين شركات التكنولوجيا والمعلومات والدردشة، للاستفادة من تقنيات الذكاء الاصطناعي لتقديم تجارب فريدة للمستخدمين.

مواضيع مرتبطة

أستراليا تتجه لحظر الأطفال من استخدام منصات التواصل الاجتماعي

يؤيد زعماء جميع الولايات الأسترالية الثماني وأقاليم البر الرئيسي الأسترالية الخطة بالإجماع،

"واتسآب" يطلق ميزة جديدة لتسهيل المراسلات الصوتية في الأماكن الصاخبة

مع أكثر من ملياري مستخدم في العالم، يتيح "واتسآب" للمستخدمين الآن تحويل رسائلهم الصوتية إلى نص مكتوب

كلمات مفتاحية

ميتا