اخبار سایت

دیپ‌سیک (DeepSeek): استارتاپ چینی که نحوه آموزش مدل‌های هوش مصنوعی را تغییر می‌دهد




دیپ‌سیک V3 با استفاده از معماری جدیدی که برای آموزش مقرون به صرفه طراحی شده، تنها به ۲.۷۸ میلیون ساعت جی‌پی‌یو نیاز داشت. این زمان به طور قابل توجهی کمتر از ۳۰.۸ میلیون ساعت جی‌پی‌یو مورد نیاز متا برای آموزش مدل Llama 3.1 است.

این خبر را در ایران وب سازان مرجع وب و فناوری دنبال کنید

این مطلب از سایت ایتنا گردآوری شده است.

منبع: ایتنا

دکمه بازگشت به بالا