حوادث وقضايا

ميتا تصدر مجموعة أدوات AI تنشئ صوتًا من النص

تسهل ميتا Meta على الفنانين ومصممي الصوت إنتاج الصوت باستخدام الذكاء الاصطناعي فقط. أصدر مالك Facebook مجموعة أدوات AudioCraft مفتوحة المصدر تضم ثلاثة نماذج حالية تعمل بالذكاء الاصطناعي لإنشاء أصوات من الأوصاف النصية. ينتج AudioGen و MusicGen على التوالي مؤثرات صوتية وموسيقى ، بينما يقوم EnCodec بضغط الأصوات لإنتاج نتائج عالية الجودة. قد يكون لدى الموسيقي أو مصمم الصوت كل ما يحتاجونه لتأليف المقطوعات الموسيقية.

يتضمن الإصدار نماذج AudioGen المدربة مسبقًا لأولئك الذين يرغبون في البدء بسرعة ، وسيتمكن المصلحون من الوصول إلى كود AudioCraft بالكامل وترجيح النموذج. يقول ميتا إن الظهور الأول مفتوح المصدر يمنح المحترفين والباحثين فرصة لتدريب النماذج باستخدام بياناتهم الخاصة. تستخدم جميع النماذج المدربة مسبقًا مواد عامة أو مملوكة لبيانات التعريف ، لذلك لا توجد فرصة لوجود نزاعات بشأن حقوق النشر.

تصف شركة التكنولوجيا AudioCraft بأنها طريقة لجعل صوت AI التوليدي أبسط وأكثر سهولة. حيث كانت الصور والنصوص المنتجة بواسطة الذكاء الاصطناعي شائعة ، يعتقد ميتا أن الصوت قد تأخر “قليلاً”. تميل المشاريع الحالية إلى أن تكون معقدة وغالبًا ما يتم إغلاقها. من الناحية النظرية ، تمنح المجموعة الجديدة المبدعين الفرصة لتشكيل نماذجهم الخاصة وتوسيع ما هو ممكن.

هذا ليس الذكاء الاصطناعي الوحيد المفتوح لتحويل النص إلى صوت في السوق. افتتحت Google نموذج MusicLM الخاص بها في مايو. نظام Meta أيضًا غير مصمم للمستخدمين العاديين – ستظل بحاجة إلى أن تميل تقنيًا لاستخدام AudioCraft بشكل صحيح. تقول الشركة إن هذا أكثر من أجل البحث. يحاول المطورون أيضًا تحسين الأداء وطرق التحكم لهذه النماذج ، وتوسيع إمكاناتهم.

حتى في حالتها الحالية ، قد تشير AudioCraft إلى مستقبل دور الذكاء الاصطناعي في الموسيقى. على الرغم من أنك لن ترى بالضرورة فنانين يستخدمون الذكاء الاصطناعي ليحلوا محل إبداعاتهم بالكامل (حتى المجربين مثل Holly Herndon لا يزالون مشاركين بشكل كبير) ، فإنهم يحصلون على المزيد من الأدوات التي تتيح لهم إنشاء مسارات دعم وعينات وعناصر أخرى بجهد ضئيل نسبيًا.