«سورا».. ثورة للذكاء الاصطناعي تحوِّل النصوص إلى فيديو
أعلنت شركة «أوبن ايه آي» صاحبة برنامج «تشات جي بي تي» وبرنامج الصور «دال-اي» DALL-E، عن إطلاق ميزة جديدة باسم «سورا» Sora.
وتستخدم سورا في إنشاء مقاطع فيديو واقعية، تجرى من خلال إدخال نص، يصل مدته إلى دقيقة واحدة، فبمجرد إدخال طلب نصّي، يتم إنشاء الفيديو عن طريق الذكاء الاصطناعي، وفق وكالة «فرانس برس».
شركة «أوبن ايه آي» تتعاون مع «مايكروسوفت» لإنشاء منصة جديدة
تعاونت شركة «أوبن ايه آي» الناشئة مع «مايكروسوفت»، لإطلاق منصة جديدة والتي تستند على أبحاث سابقة أجريت على برنامجي «دال-اي» و«جي بي تي»، وعرضت من خلالها مقاطع فيديو شرحت طريقة إنشائها، بالرغم من أنها مازالت قيد الاختبار.
وشرحت الشركة عبر موقعها الإلكتروني فكرة إطلاق البرنامج الجديد، والذي يستطيع إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة «مع الحفاظ على الجودة المرئية واحترام طلب المستخدم».
وأضافت أن «بإمكان (سورا) إنشاء مشاهد معقدة تضمّ شخصيات عدة وأنواعاً محددة من الحركات وتفاصيل دقيقة»، وهذه إحدى طرق الذكاء الاصطناعي الحديثة والتي تعمل على إنشاء فيديو من مجموعة صورة ثابتة، أو توسيع مقاطع الفيديو الموجودة، بحسب «أوبن ايه آي».
رئيس شركة «أوبن ايه آي» يطرح أحدث أدوات الذكاء الاصطناعي
وأعلن رئيس «أوبن ايه آي» سام ألتمان عبر شبكة حسابه الشخصي على موقع التدوينات «إكس» أن الشركة ستتيح هذه الميزة الجديدة من أجل الاستخدام لعدد محدود من مبتكري المحتوى، في إطار مرحلة تجريبية.
وأيضا قام بدعوة مستخدمي المحتوى إلى تقديم المقترحات التي تتعلق بإنشاء مقاطع الفيديو من أجل عرضها وأبرزها على المنصة، ومن بين هذه المقترحات نرى أن هناك مقطع يطهر كلبان وسط الثلج، في منطقة جبلية شهيرة.
ويظهر فيديو أخر لحيوان وهمي يطير، نصفه بطة ونصفه تنين، خلفه مشهد رائع لغروب الشمس، ويحمل على ظهره حيوان قداد (هامستر) يرتدي ملابس رياضية.
مميزات إطلاق أداة سورا الجديدة
تتشكل أداة «سورا أحد البرامج القادرة على فهم ومحاكاة العالم الحقيقي»، بحسب الشركة أوبن ايه آي، التي أعلنت أنها تتمني حصول هذه الميزة على شعبية كبيرة مثل شات جي بي تي، فهي على حد وصفهم «خطوة مهمة في تحقيق الذكاء الاصطناعي العام».
وبالرغم من أنه نظام شديد الاستقلالية، يستطيع أن يقوم بمهام تفوق قدرات البشر في معظم المهام المربحة اقتصاديا، ولكن نبهت الشركة على وجود بعض العيوب التي ظهرت حالياً في النموذج الذي تم إطلاقه عبر المنصة.
ومن أبرزها الالتباس بين اليسار واليمين أو عدم القدرة على الحفاظ على الاستمرارية البصرية طوال الفيديو، وقالت الشركة عن هذه العيوب «قد يأكل جزءاً من قطعة بسكويت، لكنّ آثار القضمة قد لا تظهر على قطعة البسكويت» في مشهد ثانٍ من مقطع الفيديو.
ولكن بالرغم من هذا أكدت الشركة على أن مسألة الأمن ستكون أساسية في ما يتعلق بهذه الأداة، فسوف تقوم بتنظيم عمليات محاكاة لتحديد حدود المنصة بشكل أفضل.
وأضافت «أوبن ايه آي»: «سنعمل على إشراك صناع السياسات والمعلمين والفنانين في مختلف أنحاء العالم لفهم مخاوفهم وتحديد حالات الاستخدام الإيجابي لهذه التكنولوجيا الجديدة».
شركات التكنولوجيا تقدم تطبيق text-to-video
وهذه ليست الميزة الأولى التي تظهر في مجال الذكاء الاصطناعي، فسبق وحاولت العديد من شركات التكنولوجيا الرائدة في مجال التقنيات، من إطلاق نماذج عن تطبيقات مماثلة تسمى text-to-video ومنها شركة «ميتا» و«غوغل» و«رَنواي إيه آي».
والتي لاقت رواج كبير بين الرواد وبالرغم من المميزات العديدة التي تقدمها هذه البرامج إلا أنها إلى الآن لم ترقى إلى مستوي التي حصلت عليه أدوات الذكاء الاصطناعي الأخرى مثل شات دي بي تي.
أقرا أيضا:الأقراط الذكية تهز عرش الساعات والخواتم وتحدث ثورة في عالم التكنولوجيا