آریا جوان

آخرين مطالب

آپدیت 2025 دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد فناوری

آپدیت 2025 دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد
  بزرگنمايي:

آریا جوان - زومیت / دیپ‌سیک نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ V3 را تحت مجوز متن‌باز MIT و با قدرت بیشتر از نسخه‌ی قبلی منتشر کرد.
دیپ‌سیک، استارتاپ پرحاشیه‌ی چینی، نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ DeepSeek-V3 را تحت مجوز متن‌باز (اوپن‌سورس) MIT منتشر کرد.
نسخه‌ی جدید در سکوت خبری منتشر شده و دیپ‌سیک هیچ بیانیه‌ای را در دسترس رسانه‌ها قرار نداده است. به‌علاوه، فایل Readme مدل جدید، فعلاً خالی است (این فایل معمولاً شامل مخازنی از کد و توضیحات مربوط‌ به تغییرات مدل می‌شود).
بازار
دیپ‌سیک V3، مدل زبانی بزرگ متن‌باز، زمستان سال گذشته در دسترس قرار گرفت و قلب تپنده‌ی دیپ‌سیک R1 به‌حساب می‌آید (R1 مدلی استدلالی است که دیپ‌سیک را بر سر زبان‌ها انداخت و حواشی گسترده‌ای را ایجاد کرد).
دیپ‌سیک V3 مدلی همه‌منظوره است که به‌طور خاص برای وظایف استدلالی بهینه نشده است، بااین‌حال می‌تواند مسائل ریاضی را حل کند و کد بنویسد.
تا به امروز، مدل V3 تحت یک مجوز سفارشی متن‌باز در دسترس بود؛ بااین‌حال به‌لطف تغییرات جدید، مدل قدرتمند دیپ‌سیک از این پس تحت مجوز MIT ارائه می‌شود. بدین ترتیب توسعه‌دهندگان می‌توانند بدون هیچ‌ محدودیتی، از این مدل هوش مصنوعی در پروژه‌های تجاری استفاده کنند و حتی سراغ اصلاح‌کردنش بروند.
کارشناسان می‌گویند مدل جدید دیپ‌سیک قدرتمندتر از نمونه‌ی قبلی شده است و منابع سخت‌افزاری کمتری را درگیر می‌کند.
اکثر مدل‌های زبانی بزرگ و پیشرفته، صرفاً با کارت‌های گرافیک کلاس دیتاسنتر پتانسیل اصلی خودشان را به‌نمایش می‌گذارند. اونی هانون، دانشمند تحقیقاتی تیم یادگیری ماشین اپل، می‌گوید که نسخه‌ی جدید دیپ‌سیک V3 را روی مک استودیو اجرا کرده و این مدل توانسته است در هر ثانیه تقریباً 20 توکن خروجی ارائه دهد که بسیار قابل توجه به نظر می‌رسد.
مک استودیو مورد استفاده، قوی‌ترین نمونه‌ی آن کامپیوتر بود و درحال‌حاضر حدود 9٬500 دلار قیمت دارد. دانشمند اپل می‌گوید اجرای دیپ‌سیک روی مک استودیو نیازمند یک‌سری تکنیک خاص ازجمله کوانتش چهار بیتی بود. این تکنیک که برای بهینه‌سازی مدل‌های زبانی بزرگ استفاده می‌شود، میزان درگیرشدن حافظه را کم می‌کند و تأخیر را پایین می‌آورد، اما بهای استفاده از آن، کاهش دقت خروجی است.
ظاهراً نسخه‌ی جدید دیپ‌سیک V3 در زمینه‌ی کدنویسی عملکرد بهتری نسبت‌ به مدل قبلی دارد. بر اساس یک تست غیررسمی و مستقل، دیپ‌سیک V3 جدید به امتیاز 60 درصد در بنچمارک دست پیدا کرد که چند درصد بهتر از نسخه‌ی قبلی است. البته دیپ‌سیک V3 جدید ضعیف‌تر از مدل استدلالی Qwen-32B ظاهر شد. V3 با وجود تمامی بهبودهایش همچنان در پشت سر مدل پرچمدار R1 قرار می‌گیرد.
مدل زبانی دیپ‌سیک V3 شامل 671 میلیارد پارامتر است، اما به هنگام پاسخ به پرسش‌ها تنها 37 میلیارد از آن‌ها را استفاده می‌کند. این ساختار غیرمنتظره، به دیپ‌سیک V3 امکان می‌دهد که عملکرد مناسب را با منابع سخت‌افزاری کمتر از سایر مدل‌های زبانی ارائه دهد (مدل‌های دیگر معمولاً تمامی پارامترهایشان را فعال می‌کنند).
دیپ‌سیک می‌گوید V3 بهینه‌تر از R1 است و هزینه‌های نهایی سازمان‌ها را پایین‌تر می‌آورد. نسخه‌ی اولیه‌ی دیپ‌سیک V3 بر پایه‌ی دیتاستی از 14٫8 تریلیون توکن آموزش داده شد.

لینک کوتاه:
https://www.aryajavan.ir/Fa/News/1474608/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

نینتندو سوییچ 2 نسخه‌ بهبودیافته‌ بازی‌های Switch را دریافت می‌کند

در واکنش به گاف امنیتی مقامات آمریکا، آمار دانلود پیام‌رسان سیگنال رشد کرد

با قابلیت جدید Chatgpt جادوی استودیو جیبلی در دستان شماست!

پیام خاخام اعظم بر ضد صهیونیسم در برنامه محفل

غوغای دختربچه های شیرین اهل رشت در محفل

حاج احمد این بار با لباس یمنی

تلاوت طوفانی نوجوان مازندرانی در برنامه محفل

یمنی‌ها چطور مسلمون شدن!

روایت تلخ کمال شرف از فجایع غیرانسانی علیه مردم یمن

من مو رو از ماست می کشم

کلاس علی‌آباد رو یه تنه بالا برد

خوشبخت‌ترین دختر دنیا

چهره ها/ قابی از زوج جذاب سریال «در انتهای شب» در فرانسه

ارسطو همش دنبال برق و بورقه

اخرش من میشم گوشت قربانی

با عبور از امباپه؛ ایسکو بازیکن ماه لالیگا شد

شمع‌سازی آسان، فقط آب و روغن نیاز دارید!

آغاز گفتگوهای ایران و سه کشور اروپایی درباره رفع تحریم‌ها در ژنو

کورنینگ گوریلا گلس سرامیک رسماً معرفی شد؛ نسل جدید شیشه محافظ صفحه‌نمایش

آیفون تاشو به لولای فلز مایع برای مقاومت بیشتر مجهز خواهد شد

ماجرای عجیب شفا پیدا کردن جوان غنایی با توسل به امام رضا (ع)

فلسفه لباس خاص عالم غنایی

تلاوت دلنشین «أمن یجیب» توسط حامد شاکرنژاد

اشک‌های عالم غنایی با هدیه متبرک

تلاوت احمد ابوالقاسمی

تلاوت سوره مبارکه بقره توسط حامد شاکرنژاد

وقتی پژمان جمشیدی مهدوی کیا رو سرکار میزاره!

سخنان صریح شهرام شکیبا با مردم در برنامه «هلال» شبکه یک

چهره ها/ استوری جالب بازیگر زیبای سریال آبان

ماسکرانو: مسی به‌خوبی تمرین کرده و فردا برمی‌گردد

با هر وسیه ای که دوست داری گلسر درست کن

ایران، نقض آتش‌بس اسرائیل در لبنان را محکوم کرد

ترامپ با تکرار ادعاها: ترجیح می‌دهم مسائل را با ایران حل‌وفصل کنیم

تاریخ عرضه بازی Shadow Labyrinth مشخص شد

کاربران واتساپ اکنون می‌توانند به استتوس خود در این پیام‌رسان موسیقی اضافه کنند

تلاوت زیبای حامد شاکرنژاد

ریشه قرآنی انقلاب

تلاوت دوست داشتنی یک خانم کوچولو

هدیه حامد شاکرنژاد به مهمان غنایی

سوالی از خاخام اعظم یهودی: کودک کشی در تورات اومده ؟

پیرمردی که در قدیم اذیتش میکردم به شکل هیولای ترسناکی به سمتم اومد

از دردسر تا خنده! «دایناسور»کمدی جدید نورورزی

تمام زندگیم مثل یک فیلم سینمایی از جلوی چشمام گذشت

چهره ها/ پای بهتاش سریال پایتخت به هالیوود باز شد!

قستم بیست و هفتم «زندگی پس از زندگی» : حق مردم

میودراگ بوژوویچ، سرمربی استقلال: بازی فردا برای ما اهمیت دارد

بوژوویچ: رضاوند و سلیمی را برای بازی فردا نخواهیم داشت

بوژوویچ: وقفه ای که برای ما پیش آمد و ملی پوشان را نداشتیم خوب نبود

بوژوویچ: تغییرات مدام کادرفنی ذهن بازیکنان را بهم ریخته است

واکنش بوژوویچ به حضور مجتبی جباری در کادرفنی