چاپ

آریا جوان - دیجیاتو / نتایج تحقیق حاضر می‌تواند پیامدهای مهمی برای حقوق مالکیت فکری، قانون‌گذاری و توسعه هوش مصنوعی در آینده داشته باشد.
بررسی جدیدی نشان می‌دهد 74.2 درصد متن‌هایی که مدل هوش مصنوعی دیپ‌سیک تولید می‌کند، از نظر سبک نگارش شباهت قابل‌توجهی به خروجی‌های ChatGPT دارند. این یافته‌ها می‌توانند نشانه‌ای از این باشند که DeepSeek در فرایند آموزش خود از خروجی‌های OpenAI استفاده کرده است.
براساس گزارش سایت «Forbes»، این تحقیق را شرکت Copyleaks، فعال در حوزه شناسایی محتوای مبتنی‌بر هوش مصنوعی، انجام داده است. به گفته این شرکت، نتایج این تحقیق می‌تواند پیامدهای مهمی برای حقوق مالکیت فکری، قانون‌گذاری و توسعه هوش مصنوعی در آینده داشته باشد.
شباهت سبک نگارش دیپ‌سیک به OpenAI
در این بررسی، Copyleaks از فناوری غربالگری و الگوریتم‌های دسته‌بندی استفاده کرده تا اثر انگشت سبکی (Stylistic Fingerprint) مدل‌های زبانی مختلف، ازجمله OpenAI، کلود، جمینای، LLaMA و DeepSeek را شناسایی کند. این دسته‌بندی با روش رأی‌گیری اجماعی انجام شده تا احتمال خطا به حداقل برسد و دقت افزایش یابد.

آریا جوان

بازار
نتیجه قابل‌توجه این بود که متن‌هایی که بیشتر مدل‌ها تولید کرده بودند، سبک منحصربه‌فردی داشتند اما بخش چشمگیری از خروجی‌های DeepSeek از نظر سبک، مشابه خروجی‌های OpenAI شناسایی شد.
«شای نیسان»، رئیس بخش علم داده Copyleaks، در گفتگویی ایمیلی توضیح داده این مطالعه را می‌توان شبیه کار یک کارشناس خط‌‌شناسی دانست که تلاش می‌کند نویسنده یک متن دست‌نویس را با مقایسه آن با دست‌خط‌های دیگران شناسایی کند. نتایج این تحقیق، تعجب‌آور و بسیار مهم است.
احتمال نقض حقوق مالکیت فکری OpenAI
نیسان تأکید دارد که این شباهت قطعی‌ترین مدرک برای استفاده مستقیم دیپ‌سیک از خروجی‌های OpenAI نیست، اما سؤالات جدی درباره فرایند آموزش و منابع داده این مدل ایجاد می‌کند.
اگر مشخص شود که DeepSeek بدون مجوز از متون ساخته OpenAI برای آموزش مدل خود استفاده کرده، پیامدهای حقوقی مهمی در نقض مالکیت فکری و تخلف از شرایط خدمات OpenAI خواهد داشت. نبود شفافیت درباره داده‌های آموزشی در صنعت هوش مصنوعی، این چالش را عمیق‌تر و نیاز به چارچوب‌های نظارتی مشخص برای افشای منابع آموزشی را برجسته‌تر می‌کند.
چالش اخلاقی و قانونی
هرچند خود OpenAI نیز بابت استفاده از محتوای وب بدون اجازه صریح با انتقاداتی مواجه بوده، شباهت سبک دیپ‌سیک به ChatGPT ابعاد تازه‌ای به این بحث اضافه می‌کند. در نبود رویه‌های حقوقی مشخص، پیگیری قانونی چنین مواردی دشوار است اما ابزارهایی مانند شناسایی اثر انگشت سبکی می‌توانند نشانه‌ای قدرتمند برای ردیابی و بررسی تخلفات احتمالی باشند.
بااینکه برخی کارشناسان احتمال می‌دهند مدل‌های زبانی به‌دلیل استفاده از داده‌های مشابه به‌تدریج به سبک‌های نزدیک به هم برسند، Copyleaks می‌گوید روش‌ اجماعی آنها مخصوص تشخیص تفاوت‌های سبکی ظریف طراحی شده و این شباهت را نمی‌توان صرفاً ناشی از هم‌پوشانی داده‌ها دانست.
نیسان در پایان تأکید کرده باوجود اشتراک احتمالی در داده‌های آموزشی، معماری مدل، روش‌های تنظیم دقیق (Fine-tuning) و تکنیک‌های تولید محتوا در هر مدل منحصربه‌فرد است. همین موضوع باعث می‌شود اثر انگشت سبکی هر مدل با دیگری متفاوت باشد.
هنوز مشخص نیست DeepSeek واقعاً از خروجی‌های OpenAI بدون مجوز استفاده کرده یا خیر اما این پرسش‌ها قطعاً در آینده نزدیک بخشی جدی بحث‌های توسعه و تنظیمگری هوش مصنوعی خواهند بود. DeepSeek تاکنون به درخواست‌ها ارائه توضیحات پاسخ نداده است.