تعاون جديد لإطلاق أكبر مجموعة بيانات صوتية

في خطوة جديدة لدعم أبحاث الذكاء الاصطناعي، أعلنت مجموعة MLCommons غير الربحية، بالتعاون مع منصة Hugging Face، عن إصدار واحدة من أكبر مجموعات البيانات الصوتية العامة في العالم، تحت اسم "Unsupervised People’s Speech".

تتضمن مجموعة البيانات الجديدة أكثر من مليون ساعة من التسجيلات الصوتية، تغطي 89 لغة على الأقل، بهدف تحسين تكنولوجيا معالجة الكلام واللغة الطبيعية، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".

ووفقًا لـ MLCommons، فإن المشروع يسعى إلى تطوير نماذج الذكاء الاصطناعي، لا سيما للغات ذات الموارد المحدودة، وتحسين التعرف على اللهجات المختلفة.

1 February 2025