آریا جوان

آخرين مطالب

هکرها از هوش مصنوعی گوگل علیه خودش استفاده می‌کنند فناوری

هکرها از هوش مصنوعی گوگل علیه خودش استفاده می‌کنند
  بزرگنمايي:

آریا جوان - زومیت / حتی پیشرفته‌ترین مدل‌های هوش مصنوعی امروزی از حملات هکری در امان نیستند و می‌توان از قابلیت‌های این مدل‌ها علیه خودشان استفاده کرد.
می‌گویند برای شکار یک دزد باید مثل دزد فکر کرد. شاید همین موضوع در مورد هک مدل‌های زبانی بزرگ (LLM) هم صدق کند. محققان دانشگاه کالیفرنیا سن دیگو و دانشگاه ویسکانسین راهی پیدا کرده‌اند تا مدل‌های هوش مصنوعی جمینای گوگل را در برابر حملات هکری آسیب‌پذیرتر کنند و جالب اینکه این‌کار را با استفاده از ابزارهای گوگل انجام داده‌اند.
به نوشته‌ی Arstechnica، تکنیک Fun-Tuning میزان موفقیت حملات تزریق پرامپت (Prompt Injection) را به طرز چشمگیری افزایش می‌دهد. در این حملات، دستورهای مخفی در متن جاسازی می‌شوند تا مدل هوش مصنوعی را فریب دهند.
بازار


نکته‌ی جالب درمورد روش Fun-Tuning اینکه از ویژگی تنظیم دقیق (Fine-Tuning) مدل جمینای سؤاستفاده می‌کند. این قابلیت معمولاً برای آموزش مدل روی مجموعه داده‌های سفارشی کسب‌وکارها طراحی شده است، اما محققان از آن برای بهینه‌سازی خودکار حملات تزریق پرامپت استفاده کردند. به‌بیان دیگر، محققان به جمینای یاد دادند که چطور خودش را فریب دهد.
محققان دریافتند که افزودن پیشوندها و پسوندهای نامتعارف به پرامپت معمولی، شانس موفقیت آن را به شدت افزایش می‌دهد. به‌عنوان مثال، پرامپتی که به‌تنهایی شکست می‌خورد در صورت اضافه‌شدن عباراتی مانند «wandel ! ! ! !" alt="آریا جوان" width="100%" />

نتایج آزمایش‌ها نشان می‌دهد تأثیر چشمگیر روش Fun-Tuning را روی مدل‌های مختلف جمینای نشان می‌دهد:
در مدل Gemini 1.5 Flash میزان موفقیت حمله 65 درصد بود
در مدل Gemini 1.0 Pro این میزان به 82 رسید؛ بیش از دو برابر نرخ موفقیت حملات معمولی بدون Fun-Tuning
حملات Fun-Tuning بین مدل‌های مختلف قابل انتقال بودند، یعنی تزریق پرامپتی که روی یک نسخه کار می‌کرد، اغلب روی نسخه‌های دیگر هم مؤثر بود
ضعف امنیتی که در روش Fun-Tuning مورد استفاده قرار می‌گیرد از نحوه‌ی کارکرد تنظیم دقیق (Fine-Tuning) ناشی می‌شود. مدل‌های هوش مصنوعی برای ارزیابی میزان خطای خود هنگام آموزش، از سیستمی به نام Loss Score استفاده می‌کنند. هکرها می‌توانند از همین مکانیزم بازخوردی برای بهینه‌سازی حملات خود بهره ببرند و روش موفقی برای فریب سیستم بیابند.
گوگل هنوز واکنش مستقیمی به روش جدید Fun-Tuning نشان نداده است، اما سخنگوی این شرکت در بیانیه‌ای اعلام کرد مقابله با این نوع حملات همواره یکی از اولویت‌ها به‌حساب می‌آید و مدل‌های جمینای به‌طور مداوم در برابر حملات تزریق پرامپت و سایر تهدیدها آزمایش می‌شوند.
محققان باور دارند جلوگیری از Fun-Tuning آسان نخواهد بود زیرا بازخوردی که استفاده از این روش را ممکن می‌کند، بخش مهم و اساسی فرایند تنظیم دقیق مدل‌ها است. در نتیجه، مسدودکردن این نوع حمله می‌تواند به قیمت کاهش کارایی کلی Fine-Tuning تمام شود.

لینک کوتاه:
https://www.aryajavan.ir/Fa/News/1475964/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

گوشی‌های چینی با باتری 8000 میلی‌آمپری راهی بازار می‌شوند

فرزند ایلان ماسک می‌گوید او گیمر افتضاحی است

کره شمالی پهپاد انتحاری با هوش مصنوعی ساخت

شلوغی بازار وکیل در ایام نوروز

مدیحه‌سرایی دلنشین عمار الکنانی ذاکر معروف عراقی در محفل

یکی از تلاوت های به یادماندنی محفل

تماشاگران محفل هم اعجوبه هستند!

تماشاگران محفل هم اعجوبه هستن

طبیعت بهاری روستای پلنگ دره

تکنیک "قلعه‌ی حافظه" به روش جردن پیترسون

فلامینگوهای میانکاله

کوه سرخ، کوهی از جنس شن و ماسه

چهره ها/ سلفی جدید حدیث میرامینی

انتشار پشت صحنه تیتراژ برنامه «شوخی شوخی»

‌جوجه بدون منقل؛ مناسب زمانی که رفتی بیرون شهر و ذغال نداری

وقتی از جواب دادن به سوالای تکراری فامیل خسته نشدی!

شوک به شمسایی و قهرمان لیگ؛ ستاره جوان رباط داد

پدری یعنی قلب بارسا، یعنی مهندس اصلی تیم

با این مدل روسری بستن؛ استایلی شیک داشته باشید

سید محمد صدر: اسرائیلی‌ها مذاکرات «مک فارلین» را نجس کردند!

علی لاریجانی، مشاور رهبر انقلاب: اگر آمریکا یا اسرائیل، ایران را بمباران کنند مجبور خواهیم شد به سمت تولید بمب اتم برویم

نرم‌افزار Pentastic سامسونگ با قابلیت‌هایی جدید برای One UI 7 آماده شد

این پرچم‌دار اندرویدی فیلم‌برداری بهتری از آیفون خواهد داشت

تفریح ساده و بامزه

کنگ، ماسوله‌ی خراسان

استفاده از تار عنکبوت برای پارچه

تلاوت شاهکار وحید خزایی

رحمت نشون داد علاوه بر بازیگری خواننده خوبی‌ هم هست

چهره ها/ تبریک سال نو توسط بهنوش بختیاری

قسمت بیستم و نهم زندگی پس از زندگی «چشم های بسته»

عجیب‌ترین جایزه فوتبالی قرن، 4 شانه تخم مرغ!

پایان فصل برای ستاره ملی‌پوش یوونتوس

چگونه شخصیت کاریزماتیک داشته باشیم؟

واکنش اتحادیه اروپا به تهدیدات ترامپ علیه ایران؛ راه‌حلی جز دیپلماسی وجود ندارد

خبر استعفای 43 نماینده مجلس تکذیب شد

علی مطهری: باید همان ابتدا با ترامپ مذاکره می‌کردیم

کوبا، تهدید گستاخانه آمریکا علیه ایران را محکوم کرد

پزشکیان: با تمام وجود در کنار مردم یمن خواهیم بود

دیدار سید هادی خامنه‌ای با مهدی کروبی

تعداد بازیکنان Death Stranding به بیش از 20 میلیون نفر رسید

فروش بازی Monster Hunter Wilds از 10 میلیون نسخه فراتر رفت

بارش زیبای باران در کاظمین

جزیره کومودو، دنیای گمشده مارمولک های غول پیکر

پرخاشگری شدید فیل‌های آفریقایی

اباهت آرامگاه اردشیر سوم

چهره ها/ عکس جذاب و متفاوت نانسی عجرم در عید فطر

تجربه باورنکردنی جدا شدن روح از بدن در برنامه «زندگی پس از زندگی»

آموریم: بابت درخشش رشفورد در استون ویلا خوشحالم

انتقام شیرین رحمتی از پرسپولیس پس از شش سال

بازگشت اورونوف؛ انفجار نصفه‌نیمه و نگرانی هواداران