ادعای گوگل: جمینای ۷۰۰ بار قدرتمندتر از هوش مصنوعی OpenAI
«جمینی۱.۵ » حاصل نوآوری های خستگی ناپذیر گوگل در حوزه «پردازش زبان طبیعی»(NLP) است. NLP شاخه ای هوش مصنوعی مرتبط با درک و تولید زبان انسان است. گوگل مدعی است جمینی۱.۵ می تواند تا یک میلیون توکن ورودی معادل ۴ میلیون کاراکتر یا ۸۰۰ هزار واژه را کنترل کند. این رقم ۷۰۰ بار بیشتر از رکورد جی پی تی-۴ (رکورد دار قبلی این حوزه) است که قادر به پردازش ۱۲۸ هزار توکن است.
چنین آمار و ارقامی بدان معنا است که جمینی ۱.۵ می تواند متون طولانیتر و پیچیدهتر مانند رمان، مقالات یا سخنرانی ها را درک و تولید و همزمان هماهنگی و کیفیت را حفظ کند. از سوی دیگر جمینی ۱.۵ می تواند داده های ورودی چند وجهی مانند متن، عکس، صوت و ویدئو را مدیریت و بازده هایی در هریک از این فرمت ها تولید کند. به عنوان مثال جمینی ۱.۵ می تواند با توجه به یک ویدئوکلیپ به سوالات پاسخ دهد یا براساس متن شعری بسازد.
علاوه بر آنچه گفته شد جمینی ۱.۵ یک مدل نیست بلکه خانواده ای از مدل های هوش مصنوعی است که نیازهای مختلفی دارند و برای مقاصد متفاوتی به کار می روند. جمینی ۱.۵ پرو یک مدل چند منظوره ترین وسیع به حساب می آید که از نظر عملکرد با جمینی ۱.۰ اولترا قابل مقایسه است. اما قدرت رایانشی کمتری را به کار می گیرد. این آن را برای موارد استفاده در دنیای واقعی کارآمدتر و مقیاس پذیرتر می کند. جمینی ۱.۵ پرو همچنین نخستین مدلی است که از تکنیک جدیدی به نام Mixture-of-Experts (MoE)(ترکیب کارشناسان) استفاده می کند. این امر به آن اجازه میدهد تا بهجای آنکه در هر بار جستجو کل مدل به کار گرفته شود، بخش های مرتبط انتخاب شوند.
این مطلب از سایت ایتنا گردآوری شده است.
منبع: ایتنا