به گزارش خبرآنلاین، شنبه گذشته در اقدامی غیرمنتظره، متا از خانواده جدید مدلهای هوش مصنوعی خود با نام Llama 4 رونمایی کرد. این مجموعه شامل سه مدل اصلی Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth است که همگی با حجم عظیمی از دادههای متنی، تصویری و ویدئویی آموزش دیدهاند.
ویژگیهای کلیدی مدلهای جدید
معماری Mixture of Experts (MoE): برای اولین بار در خانواده Llama استفاده شده که باعث افزایش کارایی محاسباتی میشود.
پارامترهای چشمگیر: مدل Behemoth با 288 میلیارد پارامتر فعال و نزدیک به 2 تریلیون پارامتر کلی
پنجره متنی گسترده: مدل Scout توانایی پردازش تا 10 میلیون توکن را دارد.
بهبود پاسخدهی به سوالات حساس: کاهش خودداری از پاسخگویی به موضوعات بحثبرانگیز اجتماعی و سیاسی.
رقابت با غولهای فناوری: بر اساس تستهای داخلی متا، مدل Maverick در برخی زمینهها از جمله کدنویسی، استدلال و پردازش تصویر از رقبایی مانند GPT-4o گوگل و Gemini 2.0 پیشی گرفته است. با این حال، هنوز با مدلهای پیشرفتهتری مانند GPT-4.5 و Gemini 2.5 Pro فاصله دارد.
محدودیتهای استفاده
ممنوعیت استفاده برای شرکتهای مستقر در اتحادیه اروپا به دلیل قوانین سختگیرانه حریم خصوصی
نیاز به مجوز خاص برای شرکتهایی با بیش از 700 میلیون کاربر ماهانه
در حال حاضر قابلیتهای چندوجهی فقط در آمریکا و به زبان انگلیسی فعال است
چالشهای فنی: مدل Behemoth که هنوز منتشر نشده، به سختافزارهای بسیار قدرتمندی نیاز دارد. این در حالی است که مدل Scout قابلیت اجرا روی یک کارت گرافیک Nvidia H100 را دارد.
واکنش به انتقادات سیاسی: متا ادعا میکند Llama 4 نسبت به نسخههای قبلی تعادل بهتری در پاسخ به موضوعات حساس سیاسی پیدا کرده است. این تغییر در حالی رخ داده که برخی نزدیکان به ترامپ، از جمله ایلان ماسک، مدلهای هوش مصنوعی موجود را به تمایل به چپ گرایی متهم کردهاند.
دسترسی: در حال حاضر مدلهای Scout و Maverick از طریق وبسایت Llama و پلتفرم Hugging Face در دسترس هستند، در حالی که Behemoth همچنان در مرحله آموزش قرار دارد. متا اعلام کرده که دستیار هوش مصنوعی خود در واتساپ، مسنجر و اینستاگرام را در 40 کشور به Llama 4 مجهز کرده است.
آینده Llama: به گفته متا، این تازه آغاز راه برای خانواده Llama 4 است و شاهد پیشرفتهای بیشتری در آینده خواهیم بود. با این حال، هنوز هیچ یک از این مدلها به سطح مدلهای استدلالی (reasoning models) مانند o1 و o3-mini شرکت OpenAI نرسیدهاند.
***
عرضه «GPT-5» به تعویق افتاد
«اوپنایآی» اعلام کرد که عرضه مدل هوش مصنوعی مورد انتظار «GPT-5» را به تعویق انداخته است.
به گزارش ایسنا به نقل از تک کرانچ، شرکت «اوپنایآی»(OpenAI) پس از لغو عرضه مدل هوش مصنوعی استدلالی «o3» در ماه فوریه، اکنون میگوید قصد دارد هم o3 و هم یک جانشین نسل بعدی موسوم به «o4-mini» را طی چند هفته دیگر عرضه کند.
«سم آلتمن»(Sam Altman)، مدیرعامل اوپنایآی روز جمعه در پلتفرم ایکس اعلام کرد این تغییر مسیر به مدل آینده «GPT-5» مربوط میشود که این شرکت پیشتر گفته بود یک مدل یکپارچه با قابلیتهای استدلالی است.
آلتمن نوشت: ما میتوانیم GPT-5 را بسیار بهتر از آنچه در ابتدا تصور میکردیم، بسازیم. ما همه چیز را سختتر از حد تصور خود دیدیم و میخواهیم مطمئن شویم که ظرفیت کافی را برای حمایت از تقاضای بیسابقه داریم.
آلتمن اضافه کرد که اوپنایآی انتظار دارد GPT-5 را طی چند ماه آینده عرضه کند. این زمان دیرتر از زمانی است که در ابتدا پیشبینی میشد.
بر اساس اطلاعاتی که اوپنایآی درباره GPT-5 منتشر کرده است، این شرکت قصد دارد دسترسی نامحدود به چت GPT-5 را در تنظیمات استاندارد و مشروط به آستانه سوءاستفاده ارائه دهد. مشتریان نسخه «چتجیپیتی پلاس»(ChatGPT Plus) میتوانند GPT-5 را در سطح بالاتری از هوش اجرا کنند. این در حالی است که مشترکان برنامه «چتجیپیتی پرو»(ChatGPT Pro) میتوانند GPT-5 را با سطح هوشی بالاتری به اجرا درآورند.
اوپنایآی با فشار فزاینده از سوی رقبایی مانند شرکت چینی «دیپسیک»(DeepSeek) روبهرو است که یک رویکرد باز را برای راهاندازی مدلها اتخاذ کردهاند. برخلاف راهبرد اوپنایآی، این رقبا مدلهای خود را برای آزمایش و در برخی موارد تجاریسازی در دسترس جامعه هوش مصنوعی قرار میدهند.
اوپنایآی علاوه بر o3، o3 pro، o4-min و GPT-5 قصد دارد اولین مدل زبانی باز خود از زمان GPT-2 را طی ماههای آینده معرفی کند. آلتمن اخیرا گفت که این مدل دارای قابلیت استدلال خواهد بود و در معرض ارزیابیهای ایمنی بیشتری قرار خواهد گرفت.