Kling اپلیکیشن هوش مصنوعی جدید از چین
Sora هنوز برای عموم در دسترس نیست، اما به نظر میرسد یک مدل دیگر تبدیل متن به ویدیو در تیتر خبرها باشد.
شرکت چینی Kuaishou Technology که به پلتفرم معروف ویدیوی کوتاه است، از مدل تبدیل متن به ویدئو به نام Kling رونمایی کرده است.
برخلاف Sora، به نظر میرسد Kling در طریق لیست انتظار در دسترس کاربران قرار گرفته است.
فیلمهای با کیفیت بالا تولید کنید
Kling از فناوری مشابه Sora استفاده میکند و میتواند ویدیوهای HD 1080p تولید کند که تا دو دقیقه طول بکشد.
این مدل میتواند حرکات واقع گرایانه در مقیاس بزرگ ایجاد کند که اساساً ویژگیهای جهان فیزیکی را تقلید میکند. گفته میشود که Kling بر اساس معماری Diffusion Transformer ساخته شده است و میتواند پیامهای متنی را به تصاویر و ویدیوهای زنده تبدیل کند.
مدل Kling از بازسازی 3 بعدی پیشرفته صورت و بدن با استفاده از فناوری 3D VAE این شرکت استفاده میکند و به کاربران امکان میدهد ویدیوهایی با نسبتهای مختلف بسازند.
تبدیل متن به ویدئو
این شرکت یک ویدئوی نمایشی منتشر کرد که توانایی کلینگ را برای ایجاد یک ویدیو تا دو دقیقه با سرعت 30 فریم بر ثانیه نشان میداد.
اما سورا فقط قادر به ایجاد ویدیوهای یک دقیقهای است. بر اساس نمونههای ارسال شده در ایکس (توییتر سابق)، به نظر می رسد ویدیوهای ایجاد شده توسط Kling به طور دقیق ویژگیهای فیزیکی دنیای واقعی را تقلید میکنند.
لازم به ذکر است که Kling تنها مدل متن به ویدئو از چین نیست.
در ماه آوریل، Vidu AI را منتشر کرد که یک مدل متن به ویدیو که قادر به تولید ویدیوهای 16 ثانیهای با کیفیت 1080p است.
Sora تاخیر داشت
OpenAI در میدان رقابت با بازیکنان موجود مانند Runway و Pika Labs روبرو است که هر دو در حال تقویت بازی در هوش مصنوعی هستند.
همچنین رقبای جدیدی مانند Haiper، LTX Studio و Higgsfield وجود دارند که هر کدام رویکردهای متفاوتی را برای ویدیوهای هوش مصنوعی اتخاذ میکنند و حتی گوگل نیز یک مدل Veo جدید دارد.
لازم به ذکر است که پس از رونمایی OpenAI از Sora در فوریه گذشته، شاهد استفاده از تعداد فزایندهای از سازندگان از آن بودیم، از جمله 5 کارگردان برنده جایزه که قرار است هفته آینده فیلمهای کوتاه ساخته شده توسط Sora را به نمایش بگذارند.
با وجود این، هنوز به طور گسترده در دسترس عموم نیست. حقیقت این است که تاخیر OpenAI فنی نیست بلکه به دلیل ایمنی است.
این شرکت میگوید که میخواهد اطمینان حاصل کند که این مدل از هوش مصنوعی نمیتواند برای به دست آوردن اطلاعات گمراهکننده یا اهداف مخرب قبل از ارسال آن به عموم مردم استفاده شود.
این مطلب از سایت ایتنا گردآوری شده است.
منبع: ایتنا