تكنولوجيا

جوجل تكشف عَنْ نموذج Veo لتوليد مقاطع الفيـديو بالذكاء الاصطناعي سام تكنولوجيا_

أعلنت شركة جوجل نموذج الذكاء الاصطناعي التوليدي Veo الذى يمكنه توليد مقاطع فيديـو عاليه الْجَوْدَةُ استنادًا الي المطالبات النصية الخاصة بالمستخدمين، وذلك ضوء فعاليات مؤتمر المطورين Google I/O 2023.

وتزعم جوجل ان نموذج Veo لديه القدرة على فهم اللغة الطبيعية والدلالات البصرية على نحو متقدم، لإنشاء اى فيديـو يدور فى أذهان المستخدمين.

ويمكن إنشاء مقاطع فيديـو عبر نموذج Veo لمدة تزيد على دقيقة وبدقة قدرها 1080 بكسلًا، وهو قادر أيضًا على فهم التقنيات السينمائية والبصرية، مثل مفهوم النهائي الزمني، وفقًا لما ذكرته جوجل.

وتعاونت جوجل مع صانع الأفلام دونالد جلوفر واستوديوهات Gilga لإظهار قدرات نموذج Veo فى محاكاة فيزياء العالم الحقيقي، وهو ما ظهر فى مقطع فيديـو ترويجي نشرته الشركة عبر YouTube.

وسيكون نموذج Veo متاحًا اليـوم ضوء أداة VideoFX مـن جوجل لبعض منشئي المحتوى، وستُضاف أيضًا الي YouTube Shorts ومنتجات أخرى تابعة للشركة.

وأعلنت جوجل أيضًا نموذج Imagen 3، وهو نموذج متطور لتحويل النص الي صورة، وتزعم الشركة أنه النموذج “الأعلى جودة” لتحويل النص الي صورة، وأنه يرصد درجة مذهلة مـن التفاصيل، وصورًا واقعية نابضة بالحياة، وعددًا أقل مـن الأخطاء.

وأضافت جوجل ان نموذج Imagen 3 بات يتعامل مع النصوص على نحو افضل، وأنه أصبح أكثر ذكاءً فى فهم التفاصيل فى المطالبات الطويلة.

ومن جانب اخر، فإن المجتمع التقني يتشوق الي تجربة النماذج الجديدة مـن جوجل، ومقارنة أدائها بأداء نماذج شركة OpenAI المنافسة التى تمتلك نموذج Sora لتحويل النص الي فيديـو، ونموذج DALL-E 3 لتحويل النص الي صور.



مقالات ذات صلة

زر الذهاب إلى الأعلى