آریا جوان

آخرين مطالب

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است نگاه سیاسی

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است
  بزرگنمايي:

آریا جوان - دیجیاتو / این مدل جدید باوجود اندازه کوچک‌تر عملکردی بهتر از DeepSeek R1 دارد.
متا همچنان درگیر پاسخ به پرسش‌ها و انتقادات درباره خانواده مدل‌های جدید Llama 4 است اما شرکت انویدیا با معرفی مدل زبان بزرگ (LLM) متن‌باز و قدرتمند، توجه‌ها را به خود جلب کرده است. این مدل که Llama-3.1 Nemotron Ultra نام دارد، بر پایه نسخه قبلی مدل‌های Llama-3.1-405B-Instruct متا توسعه یافته و به گفته انویدیا، عملکردی نزدیک به برترین مدل‌های موجود دارد.
مدل Llama-3.1-Nemotron-Ultra-253B-v1 با 253 میلیارد پارامتر برای وظایفی مانند استدلال پیشرفته، پیروی از دستورات و ایفای نقش دستیار هوش مصنوعی طراحی شده است.
این مدل نخستین‌ بار مارس در کنفرانس سالانه GTC انویدیا معرفی شده بود و اکنون کامل و متن‌باز در پلتفرم Hugging Face در دسترس قرار گرفته است. کد مدل، وزن‌ها و داده‌های پس از آموزش آن نیز عمومی منتشر شده‌اند.

آریا جوان


بازار


مدل جدید انویدیا با استفاده از فرایند جستجوی معماری عصبی (NAS) توسعه یافته که در آن نوآوری‌هایی مانند حذف لایه‌های توجه، شبکه‌های Fused feedforward و فشرده‌سازی متغیر در ساختار مدل اعمال شده‌اند. این معماری به گونه‌ای طراحی شده که مدل با کاهش مصرف حافظه و منابع محاسباتی، همچنان کیفیت خروجی بالایی ارائه دهد و بتوان آن را فقط با 8 کارت گرافیک H100 اجرا کرد.
علاوه‌بر H100، این مدل با معماری‌های پیشرفته‌تر انویدیا مانند B100 و Hopper نیز سازگار بوده و در حالت‌های دقت BF16 و FP8 عملکرد مطلوبی دارد.
انویدیا برای ارتقای توانایی‌های مدل از فرایند پس‌آموزش چندمرحله‌ای بهره برده که شامل آموزش نظارت‌شده در حوزه‌هایی مانند ریاضی، تولید کد، چت و استفاده از ابزارها بوده است. همچنین برای بهبود عملکرد در دنبال‌کردن دستورات و توانایی استدلال، از الگوریتم GRPO (بهینه‌سازی نسبی سیاست گروهی) استفاده شده است.
عملکرد مدل جدید انویدیا در برابر رقبا


مدل جدید انویدیا در آزمون‌های معتبر مختلف عملکرد خیره‌کننده‌ای داسته است. برای مثال، در آزمون MATH500، عملکرد مدل از 80.40 درصد در حالت عادی به 97 درصد در حالت استدلال افزایش یافته است. همچنین در آزمون AIME25، امتیاز آن از 16.67 درصد به 72.50 درصد و در LiveCodeBench از 29.03 درصد به 66.31 درصد رسیده است.
این مدل در پاسخ به پرسش‌های عمومی (GPQA) در حالت استدلال فعال به امتیاز 76.01 درصد دست یافته که از DeepSeek R1 (با امتیاز 71.5 درصد) پیشی گرفته است. همچنین در آزمون IFEval برای پیروی از دستورات، امتیاز 89.45 درصد در برابر 83.3 درصد رقیب ثبت شده و در LiveCodeBench نیز اندکی بهتر عمل کرده است.
البته باید توجه کرد که مدل DeepSeek R1 در برخی آزمون‌های ریاضی سنگین همچنان بهتر عمل می‌کند، ازجمله در AIME25 با امتیاز 79.8 درصد برابر 72.50 درصد مدل انویدیا.
این مدل از زبان‌های متعددی ازجمله انگلیسی، آلمانی، فرانسوی، ایتالیایی، پرتغالی، هندی، اسپانیایی و تایلندی پشتیبانی می‌کند و برای کاربردهایی مانند چت‌بات، ساخت عامل‌های هوش مصنوعی، تولید کد و تولید با روش بازیابی-افزوده (RAG) قابل‌استفاده است.

لینک کوتاه:
https://www.aryajavan.ir/Fa/News/1480528/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

حواشی جنجالی و درگیری های باورنکردنی بازی نفت آبادان و شهرداری نوشهر

کارشناسی داوری بازی استقلال و پیکان

جباری در نقش ژنرال؟ داستان قلعه نویی با جباری تکرار می شود؟

درویش: نظری جویباری گفت استقلال 1900 میلیارد بدهی دارد، ما هم صد یا دویست میلیارد بدهی داریم

کارشناسی داوری بازی نفت آبادان و شهرداری نوشهر

حواشی جنجالی بازی نساجی و گل گهر

هادی شکوری: چون بازیکنان استقلال در هتل سیروس دین محمدی را دیدند پیش از بازی به سمت او نرفتند

کارشناسی داوری بازی نساجی و گل گهر

صحبت های خداداد عزیزی درباره جنجال های وی ای آر در بازی فولاد و تراکتور

خداداد عزیزی: من سپر بلای بازیکنان تراکتور هستم تا اجازه ندهم حاشیه وارد باشگاه بشود

شوخی پیامکی سید مهدی رحمتی با خداداد عزیزی

هادی شکوری مربی استقلال: بازیکنان پتانسل و کیفیت بالایی دارند و واقعا دلم سوخت که جایگاه باشگاه این است

صحبت های هادی شکوری درباره تاثیر فنی و روحی مجتبی جباری روی بازیکنان استقلال

واکنش یحیی گل محمدی به شایعات نقل و انتقالاتی فولاد

صحبت های خداداد عزیزی درباره درگیری لفظی با یحیی گل محمدی

واکنش یحیی گل محمدی به شایعه پیشنهاد مربیگری استقلال و پرسپولیس در نیم فصل

خداداد عزیزی: چه کسی گفته است بازیکنی که سی میلیارد می گیرد باید فحش ها را تحمل کند

صحبت های یحیی گل محمدی درباره درگیری لفظی با خداداد عزیزی

کارشناسی داوری ملوان - سپاهان

یحیی گل محمدی سرمربی فولاد: برای برد مقابل تراکتور به میدان آمدیم

حواشی بازی ملوان و سپاهان

اینفوگرافیک هفته گذشته فوتبال ایران

حواشی جنجالی بازی فولاد یک - دو تراکتور

کارشناسی داوری بازی فولاد و تراکتور

آنچلوتی سرمربی برزیل تا جام جهانی

یک گیمر ژاپنی توانست در 15 دقیقه نسخه سوییچ 2 از Zelda: BotW را تمام کند!

آیا جانشین آیفون 16e سال آینده از راه می‌رسد؟

زندگی بزرگان/ شهیدی که به خاطر یک مادر قید تیم ملی را زد!

آزمایش عجیب شیخ بهایی!

این مدرسه می‌تواند ما را همنشین فرشته‌ها کند!

سرایت فساد از خواص به مردم و سرایت صلاح از مردم به خواص

داوران جشنواره کن معرفی شدند

انتقاد تند میثاقی به فدراسیون و سازمان لیگ

تعریف و تمجید میثاقی از علیرضا بیرانوند

کنایه میثاقی به قطع شدن VAR در فولاد آره‌نا

میثاقی: رأی شجاع اصلا عادلانه نبود

توضیحات خبیری در مورد قطعی VAR مقابل تراکتور

یحیی یک فصل دیگر در فولاد!

توضیحات خسروی درمورد وقفه طولانی بازی فولاد-تراکتور

گفتگو بی‌پرده با حبیبی‌نژاد، ستاره تازه شناخته شده لیگ!

قطع برق تمرین اتلتیکومادرید را خراب کرد!

مقام سابق ارتش اسرائیل در واکنش به اظهارات ترامپ: به نظر می‌رسد شکاف‌ها میان اسرائیل و آمریکا درباره مسئله ایران در حال گسترش است

پیام تسلیت روحانی برای حادثه بندر شهید رجایی

پزشکیان باکو را به مقصد تهران ترک کرد

تایید محکومیت 214 میلیون دلاری بحرین؛ لاهه به نفع ایران رای داد

نسخه ویژه «اچ‌ام‌دی فیوژن» و «اچ‌ام‌دی 3210» در رنگ‌های آبی و اناری بارسلونا عرضه شد

وقتی هوتن شکیبا و رضا عطاران همبازی بودند

از من ترسیدی بادیگارد آوردی

پژمان بازغی مهمان رسانه تصویری «آن» شد

چهره ها/ عکس پربازدید از دیدار 2 بازیگر سریال خانه‌ به دوش