آریا جوان

آخرين مطالب

آپدیت 2025 دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد فناوری

آپدیت 2025 دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد
  بزرگنمايي:

آریا جوان - زومیت / دیپ‌سیک نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ V3 را تحت مجوز متن‌باز MIT و با قدرت بیشتر از نسخه‌ی قبلی منتشر کرد.
دیپ‌سیک، استارتاپ پرحاشیه‌ی چینی، نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ DeepSeek-V3 را تحت مجوز متن‌باز (اوپن‌سورس) MIT منتشر کرد.
نسخه‌ی جدید در سکوت خبری منتشر شده و دیپ‌سیک هیچ بیانیه‌ای را در دسترس رسانه‌ها قرار نداده است. به‌علاوه، فایل Readme مدل جدید، فعلاً خالی است (این فایل معمولاً شامل مخازنی از کد و توضیحات مربوط‌ به تغییرات مدل می‌شود).
بازار
دیپ‌سیک V3، مدل زبانی بزرگ متن‌باز، زمستان سال گذشته در دسترس قرار گرفت و قلب تپنده‌ی دیپ‌سیک R1 به‌حساب می‌آید (R1 مدلی استدلالی است که دیپ‌سیک را بر سر زبان‌ها انداخت و حواشی گسترده‌ای را ایجاد کرد).
دیپ‌سیک V3 مدلی همه‌منظوره است که به‌طور خاص برای وظایف استدلالی بهینه نشده است، بااین‌حال می‌تواند مسائل ریاضی را حل کند و کد بنویسد.
تا به امروز، مدل V3 تحت یک مجوز سفارشی متن‌باز در دسترس بود؛ بااین‌حال به‌لطف تغییرات جدید، مدل قدرتمند دیپ‌سیک از این پس تحت مجوز MIT ارائه می‌شود. بدین ترتیب توسعه‌دهندگان می‌توانند بدون هیچ‌ محدودیتی، از این مدل هوش مصنوعی در پروژه‌های تجاری استفاده کنند و حتی سراغ اصلاح‌کردنش بروند.
کارشناسان می‌گویند مدل جدید دیپ‌سیک قدرتمندتر از نمونه‌ی قبلی شده است و منابع سخت‌افزاری کمتری را درگیر می‌کند.
اکثر مدل‌های زبانی بزرگ و پیشرفته، صرفاً با کارت‌های گرافیک کلاس دیتاسنتر پتانسیل اصلی خودشان را به‌نمایش می‌گذارند. اونی هانون، دانشمند تحقیقاتی تیم یادگیری ماشین اپل، می‌گوید که نسخه‌ی جدید دیپ‌سیک V3 را روی مک استودیو اجرا کرده و این مدل توانسته است در هر ثانیه تقریباً 20 توکن خروجی ارائه دهد که بسیار قابل توجه به نظر می‌رسد.
مک استودیو مورد استفاده، قوی‌ترین نمونه‌ی آن کامپیوتر بود و درحال‌حاضر حدود 9٬500 دلار قیمت دارد. دانشمند اپل می‌گوید اجرای دیپ‌سیک روی مک استودیو نیازمند یک‌سری تکنیک خاص ازجمله کوانتش چهار بیتی بود. این تکنیک که برای بهینه‌سازی مدل‌های زبانی بزرگ استفاده می‌شود، میزان درگیرشدن حافظه را کم می‌کند و تأخیر را پایین می‌آورد، اما بهای استفاده از آن، کاهش دقت خروجی است.
ظاهراً نسخه‌ی جدید دیپ‌سیک V3 در زمینه‌ی کدنویسی عملکرد بهتری نسبت‌ به مدل قبلی دارد. بر اساس یک تست غیررسمی و مستقل، دیپ‌سیک V3 جدید به امتیاز 60 درصد در بنچمارک دست پیدا کرد که چند درصد بهتر از نسخه‌ی قبلی است. البته دیپ‌سیک V3 جدید ضعیف‌تر از مدل استدلالی Qwen-32B ظاهر شد. V3 با وجود تمامی بهبودهایش همچنان در پشت سر مدل پرچمدار R1 قرار می‌گیرد.
مدل زبانی دیپ‌سیک V3 شامل 671 میلیارد پارامتر است، اما به هنگام پاسخ به پرسش‌ها تنها 37 میلیارد از آن‌ها را استفاده می‌کند. این ساختار غیرمنتظره، به دیپ‌سیک V3 امکان می‌دهد که عملکرد مناسب را با منابع سخت‌افزاری کمتر از سایر مدل‌های زبانی ارائه دهد (مدل‌های دیگر معمولاً تمامی پارامترهایشان را فعال می‌کنند).
دیپ‌سیک می‌گوید V3 بهینه‌تر از R1 است و هزینه‌های نهایی سازمان‌ها را پایین‌تر می‌آورد. نسخه‌ی اولیه‌ی دیپ‌سیک V3 بر پایه‌ی دیتاستی از 14٫8 تریلیون توکن آموزش داده شد.

لینک کوتاه:
https://www.aryajavan.ir/Fa/News/1474608/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

این ترانه فریاد نسل آزادی‌خواه شد

اپل تاریخ برگزاری WWDC 2025 را اعلام کرد

تلاوت آیه 117 سوره مبارکه توبه توسط سیدحسنین الحلو

احساس شرمندگی می‌کنیم!

تسویه حساب شخصی نقی و ارسطو در مافیا بازی خانوادگی

نقی ظرفیت حذف در بازی مافیا رو هم نداشت

وقتی خبر خواستگاری از سارا شنوایی نقی رو برگردوند

قسمت بیست و چارم زندگی پس از زندگی؛ مردی که در غسالخانه زنده شد

جشن همراه با آب‌پاشی بازیکنان تیم ملی در کنفرانس خبری قلعه‌نویی

افاضلی، مشاور سرمربی تیم ملی: 2 بار برگشت به بازی نشان توانمندی ماست

علیرضا بیرانوند: یعنی چه روز خوب و بد؟! من به خودم ایمان دارم

قلعه‌نویی: الان استرس‌مان کمتر شده و می‌توانیم به جوان‌ها بیشتر بازی بدهیم

مهدی طارمی: صحبت‌های قلعه‌نویی جو خوبی در تیم راه انداخته است

روایتی از فعالیت 6 ماهه دولت پزشکیان

دیدار پزشکیان با پدر شهید آل‌هاشم

ترامپ: ایران به هر صورت باید با ما مذاکره کند

پاسخ به یک شبهه درباره دخالت رهبری در برنامه‌ریزی اقتصادی

پرچمدار بعدی اوپو باتری بسیار بزرگ‌تری خواهد داشت

حسگر اثرانگشت در اندروید 16 بدون روشن کردن صفحه‌نمایش کار خواهد کرد

نسخه‌ای کمیاب از Apple-1 با قیمت 375 هزار دلار فروخته شد

تاشدنی‌های جدید سامسونگ با بتای سوم One UI 7 به ویژگی Audio Eraser مجهز می‌شوند

خاطره‌ای تلخ از شکنجه های رژیم بعثی

یه تنه برای خدا کار کن

تهران پاک‌ و تمیز زیر ابرها

تلاوت دلنشین قاری جوان بوشهری

تلاوت طوفانی آیات 1 تا 3 سوره غافر توسط سید طه حسینی

قانون بدون کار فرهنگی بی فایده است!

روایت داستان آن 23 نفر در محفل

به حرف حاج‌قاسم گوش نکردم!

تلاوت ماندگار دوره نوجوانی سید طه حسینی

در کل کل ازدواج ارسطو پای داماد جدید نقی هم وسط اومد!

دیدن خواب افراد مختلف در زندگی به چه معناست؟

فلور نظری در آغوش شکوفه‌های آلمانی ژست گرفت

جناب خان «سام درخشانی» رو درگیر حسادت خودش کرد

خبر زن گرفتن ارسطو همه خانواده رو شوکه کرد

بازخوانی ترانه مشهور خارجی توسط جناب خان!

اثبات عدم اعتیاد نقی در بنگاه املاک درسرساز شد

نقی خبر برگشت شنوایی شو بخاطر جایزه کشتی مخفی کرد!

صحبتهای علی قلی‌زاده در پایان بازی ایران و ازبکستان

نبی، سرپرست تیم ملی: اگر بازیکنان از فرصت‌ها استفاده می‌کردند، حق‌شان بیشتر از اینها بود

پیام تبریک وزیر ورزش: تیم ملی فوتبال سرمایه ارزشمند مردم است

ماشاریپوف، اورونوف و بازیکنان ازبکستان بدون صحبت با خبرنگاران استادیوم را ترک کردند

بیرانوند: اشک‌های امروز را باید در بازی پرسپولیس و تراکتور می‌ریختم

ماسک‌های صورت مناسب فصل بهار

عراقچی با رئیس مجلس ملی ارمنستان دیدار کرد

واکنش پزشکیان به صعود ایران به جام جهانی؛ قالیباف پیام صادر کرد

کنایه سنگین سخنگوی دولت اصلاحات به مجلس هفتمی‌ها

سامسونگ قیمت مانیتور Odyssey 3D را اعلام کرد؛ تماشای محتوای سه‌بعدی بدون عینک

انفاق در کنار نام تو معنی دیگری دارد!

مدح روح نواز اهل بیت (ع) در محفل