انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است نگاه سیاسی

بزرگنمايي:

آریا جوان - دیجیاتو / این مدل جدید باوجود اندازه کوچک‌تر عملکردی بهتر از DeepSeek R1 دارد.
متا همچنان درگیر پاسخ به پرسش‌ها و انتقادات درباره خانواده مدل‌های جدید Llama 4 است اما شرکت انویدیا با معرفی مدل زبان بزرگ (LLM) متن‌باز و قدرتمند، توجه‌ها را به خود جلب کرده است. این مدل که Llama-3.1 Nemotron Ultra نام دارد، بر پایه نسخه قبلی مدل‌های Llama-3.1-405B-Instruct متا توسعه یافته و به گفته انویدیا، عملکردی نزدیک به برترین مدل‌های موجود دارد.
مدل Llama-3.1-Nemotron-Ultra-253B-v1 با 253 میلیارد پارامتر برای وظایفی مانند استدلال پیشرفته، پیروی از دستورات و ایفای نقش دستیار هوش مصنوعی طراحی شده است.
این مدل نخستین‌ بار مارس در کنفرانس سالانه GTC انویدیا معرفی شده بود و اکنون کامل و متن‌باز در پلتفرم Hugging Face در دسترس قرار گرفته است. کد مدل، وزن‌ها و داده‌های پس از آموزش آن نیز عمومی منتشر شده‌اند.

آریا جوان

بازار

مدل جدید انویدیا با استفاده از فرایند جستجوی معماری عصبی (NAS) توسعه یافته که در آن نوآوری‌هایی مانند حذف لایه‌های توجه، شبکه‌های Fused feedforward و فشرده‌سازی متغیر در ساختار مدل اعمال شده‌اند. این معماری به گونه‌ای طراحی شده که مدل با کاهش مصرف حافظه و منابع محاسباتی، همچنان کیفیت خروجی بالایی ارائه دهد و بتوان آن را فقط با 8 کارت گرافیک H100 اجرا کرد.
علاوه‌بر H100، این مدل با معماری‌های پیشرفته‌تر انویدیا مانند B100 و Hopper نیز سازگار بوده و در حالت‌های دقت BF16 و FP8 عملکرد مطلوبی دارد.
انویدیا برای ارتقای توانایی‌های مدل از فرایند پس‌آموزش چندمرحله‌ای بهره برده که شامل آموزش نظارت‌شده در حوزه‌هایی مانند ریاضی، تولید کد، چت و استفاده از ابزارها بوده است. همچنین برای بهبود عملکرد در دنبال‌کردن دستورات و توانایی استدلال، از الگوریتم GRPO (بهینه‌سازی نسبی سیاست گروهی) استفاده شده است.
عملکرد مدل جدید انویدیا در برابر رقبا

مدل جدید انویدیا در آزمون‌های معتبر مختلف عملکرد خیره‌کننده‌ای داسته است. برای مثال، در آزمون MATH500، عملکرد مدل از 80.40 درصد در حالت عادی به 97 درصد در حالت استدلال افزایش یافته است. همچنین در آزمون AIME25، امتیاز آن از 16.67 درصد به 72.50 درصد و در LiveCodeBench از 29.03 درصد به 66.31 درصد رسیده است.
این مدل در پاسخ به پرسش‌های عمومی (GPQA) در حالت استدلال فعال به امتیاز 76.01 درصد دست یافته که از DeepSeek R1 (با امتیاز 71.5 درصد) پیشی گرفته است. همچنین در آزمون IFEval برای پیروی از دستورات، امتیاز 89.45 درصد در برابر 83.3 درصد رقیب ثبت شده و در LiveCodeBench نیز اندکی بهتر عمل کرده است.
البته باید توجه کرد که مدل DeepSeek R1 در برخی آزمون‌های ریاضی سنگین همچنان بهتر عمل می‌کند، ازجمله در AIME25 با امتیاز 79.8 درصد برابر 72.50 درصد مدل انویدیا.
این مدل از زبان‌های متعددی ازجمله انگلیسی، آلمانی، فرانسوی، ایتالیایی، پرتغالی، هندی، اسپانیایی و تایلندی پشتیبانی می‌کند و برای کاربردهایی مانند چت‌بات، ساخت عامل‌های هوش مصنوعی، تولید کد و تولید با روش بازیابی-افزوده (RAG) قابل‌استفاده است.

چهارشنبه ۲۰ فروردين ۱۴۰۴ - ۲۰:۳۱:۱۱
۱۳ بازديد
آریا جوان

https://www.aryajavan.ir/Fa/News/1480528/

تصاویر آخرالزمانی از طوفان شن در بغداد

چرا ذهن ما شلوغ می‌شود؟

چهره ها/ محمدرضا گلزار نوشت: پُز نیست، سبک زندگیمه!

مسجد چوبی و حصیری تورسینا در اتیوپی

آخرين مطالب

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است نگاه سیاسی

نظرات شما

ساير مطالب

تغییر طراحی منو تنظیمات اندروید؛ رنگی‌تر و جذاب‌تر از قبل

قابلیت برخاست و فرود عمودی جنگنده پیشرفته اف-35 بی

ویدئویی از دوربین یک آمبولانس در هلند

دردسرهای همیشگی افراد عینکی

حرکات نمایشی و خطرناک خودروی کوییک در خیابان‌های زاهدان/ ویدئو

احمد مهران‌فر نقشش در «خجالت نکش» و «پایتخت» را شبیه بهم ایفا کرد؟

چهره ها/ محمدرضا گلزار: خوشگل‌ها از من تعریف می‌کنند!

درخشش جهانی شطرنج در آغاز سال جدید

کدام قانون داد کارتال را در آورد

محرز پس از نه سال بهترین بازی‌اش را تکرار کرد!

خشم کریستیانو رونالدو از شکست تلخ النصر

مدافع اینتر از بایرن مونیخ عذرخواهی کرد

دبیر فدراسیون: IOC وزنه‌برداری را محدود می‌کند

جیمی کاراگر: تاتنهام به سندروم تن‌هاخ دچار شده است!

سیلوا راضی است اما بارسلونا نه!

ماهواره ناهید 2 تا دو ماه آینده پرتاب می‌شود

ساعت و محل مذاکره ایران و آمریکا در رم مشخص شد

حیات عالمانه به بیان آیت الله جوای آملی

درخشش بیمه دی در خدمات‌رسانی به ایثارگران؛ رتبه اول توانگری و پرداخت به‌روز مطالبات درمانی

داستان سیمرغ و جنگ با تقدیر/ پرنده ای که می خواست سرنوشت دختر و پسر را عوض کند/ قسمت دوم

درآمد عجیبی که صداوسیما از «پایتخت» به جیب زد!

چهره ها/ «شری» پایتخت با این عکس جذاب خودنمایی کرد

آنچلوتی قصد کناره‌گیری ندارد

نصف بازیکنان استقلال با خداحافظی هواداران را خوشحال کنند!

درگذشت شاگرد سابق برانکو بر اثر تصادف در کرواسی!

رکورد مهمی که پرسپولیس از دست داد

پاسخ سفت و محکمی که بیرانوند می‌دهد

نیمار یک ماه خانه‌نشین شد

کرمی که بی‌اجازه روی مخ همه می‌رود

نحوه ساخت گوشواره مرواریدی

روایت خبرنگار اعزامی صداوسیما از جزئیات و زمان آغاز دور دوم مذاکرات

سلیمی نمین: پزشکیان مثل روحانی مذاکره را به برگی برای افزایش قدرت تبدیل نکرد

پیش‌بینی وضعیت جوی، دریایی و دمایی استان هرمزگان در روز شنبه 30 فروردین 1404

درآمد 45 هزار میلیارد تومانی تلویزیون از سریال پایتخت

مایکروسافت گیفت‌کارت رایگان به گیمرهای ایکس‌باکس هدیه می‌دهد

تقویم تاریخ/ روز آزمایشگاه و علوم آزمایشگاهی

فال روزانه شنبه 30 فروردین 1404

بنظر شما لاله مرزبان به آقای خواننده شباهت دارد؟

طاهرزاده: مدیران پرسپولیس بازیکنان تاریخ مصرف گذشته را به خدمت گرفته‌اند

چهارصدمین گل لیگ به تور پرسپولیس چسبید!

شافعی: تفکرات کارتال به درد پرسپولیس نمی‌خورد

شایان مصلح مرد همه فن حریف ذوب‌آهن!

ساخت شمع دریایی شیک و زیبا

وزیر خارجه ایتالیا: رم میزبان گفت‌وگوهای سطح بالا برای تسهیل یک راه‌حل مثبت خواهد بود

روایت شنیده‌نشده از عقد اخوت سردار حجازی با سردار سلیمانی و سیدحسن نصرالله

تفال/ ای دل آن دم که خراب از می گلگون باشی

حکمت/ اهمیت کوتاه سخن گفتن

فال حافظ شنبه 30 فروردین 1404

5 نکته از «پایتخت» که احتمالا برایتان غریب باشد

سرمربی السد: قهرمان شدیم، این بهترین حس است!

تبليغات