هزینه 1/6 میلیارد دلاری و 50 هزار تراشه انویدیا برای توسعه دیپسیک
نگاه سیاسی
بزرگنمايي:
آریا جوان - زومیت / گزارشها حاکی از آن است که دیپسیک با صرف 1٫6 میلیارد دلار و استفاده از 50 هزار تراشه انویدیا هوش مصنوعی خود را توسعه داده است.
دنیای هوش مصنوعی همواره شاهد ظهور و سقوط شرکتهای نوپا بوده است. در این میان، شرکت چینی دیپسیک با ادعاهای جسورانه خود مبنیبر کاهش چشمگیر هزینههای آموزش مدلهای هوش مصنوعی پیشرفته، توجه بسیاری را به خود جلب کرد. این شرکت مدعی بود که مدل R1 خود را با صرف تنها 6 میلیون دلار و 2٬048 پردازنده گرافیکی آموزش داده است؛ درحالیکه رقبای آمریکایی آن برای آموزش مدلهای مشابه، میلیاردها دلار هزینه میکنند. آیا این ادعاها واقعیت دارند؟
بنابر گزارش مؤسسه تحقیقاتی SemiAnalysis، دیپسیک برای توسعه زیرساختهای خود حدود 1٫6 میلیارد دلار هزینه کرده است و از 50 هزار پردازنده گرافیکی Hopper شامل 10 هزار H800 و 10 هزار H100 بهره میبرد.
آمار و ارقام مؤسسه تحقیقاتی SemiAnalysis، با ادعاهای اولیه دیپسیک مبنیبر هزینههای بسیار کم آموزش مدلهایش در تضاد است. به نظر میرسد که رقم 6 میلیون دلار فقط به بخشی از هزینههای آموزش، یعنی هزینه زمان پردازش گرافیکی برای مرحله پیشآموزش مدل اشاره کرده و هزینههای تحقیق، توسعه، پردازش دادهها و زیرساختهای کلی را در نظر نگرفته است.
دیپسیک در واقع از شرکت سرمایهگذاری چینی به نام High-Flyer برخاسته که از سالها پیش درزمینه هوش مصنوعی و GPU سرمایهگذاریهای کلانی انجام داده است. این شرکت در سال 2023 دیپسیک را بهعنوان شرکت مستقل و تخصصی در حوزه هوش مصنوعی راهاندازی کرد.
دیپسیک برخلاف بسیاری از استارتآپهای دیگر، بهجای تکیه بر سرویسهای ابری دیتاسنترهای اختصاصی خود را اداره میکند. این امر به آن امکان میدهد تا فرایند آزمایش و بهینهسازی مدلهای هوش مصنوعی خود را کاملاً کنترل و بدون نیاز به هماهنگی با شرکتهای دیگر، بهسرعت تغییرات مدنظر را اعمال کند.
یکی دیگر از ویژگیهای اصلی دیپسیک جذب استعدادهای برتر از داخل چین است. این شرکت با پرداخت حقوق و مزایای رقابتی وسوسهکننده، متخصصان هوش مصنوعی برجسته را از دانشگاههای معتبر چین مانند دانشگاه پکن و دانشگاه ژجیانگ جذب میکند. گفته میشود که برخی از محققان هوش مصنوعی در دیپسیک بیش از 1٫3 میلیون دلار حقوق سالانه دریافت میکنند که حتی از حقوق پرداختی شرکتهای بزرگ هوش مصنوعی چین مانند مونشات بیشتر است.
دیپسیک بهجای تکیه بر افزایش مقیاس سختافزار، بر بهبود الگوریتمها و نوآوریهای فنی تمرکز دارد. برای مثال، این شرکت الگوریتم Multi-Head Latent Attention (MLA) را توسعه داده که نیازمند ماهها کار تحقیقاتی و استفاده بسیار زیاد از GPU بوده است. مدیرعامل دیپسیک بیان میکند که با استفاده از رویکردهای هوشمندانه و الگوریتمهای کارآمد، میتوان با صرف منابع کمتر به نتایج مشابه یا حتی بهتری دستیافت.
بااینحال، موفقیت دیپسیک نهتنها به نوآوریهای فنی، بلکه به سرمایهگذاریهای کلان و جذب استعدادهای برتر نیز وابسته است. از دیدگاه بسیاری کارشناسان حوزه سختافزار، ادعاهای اولیه این شرکت مبنیبر هزینههای بسیار اندک آموزش مدلهای هوش مصنوعی تا حد زیادی جنبه تبلیغاتی داشته است و با واقعیت فاصله دارد. در واقع، دیپسیک نیز مانند سایر شرکتهای بزرگ فعال درزمینه هوش مصنوعی، برای رقابت در این عرصه نیازمند سرمایهگذاریهای هنگفت و تلاشهای بیوقفه است.
-
دوشنبه ۱۵ بهمن ۱۴۰۳ - ۱۳:۳۶:۴۸
-
۳ بازديد
-
-
آریا جوان
لینک کوتاه:
https://www.aryajavan.ir/Fa/News/1450702/