آریا جوان

آخرين مطالب

OpenAI مدل‌های گفتاری و نوشتاری جدیدی برای ایجنت‌های هوش مصنوعی معرفی کرد فناوری

OpenAI مدل‌های گفتاری و نوشتاری جدیدی برای ایجنت‌های هوش مصنوعی معرفی کرد
  بزرگنمايي:

آریا جوان - دیجیاتو / البته OpenAI در حال حاضر قصد ندارد این مدل‌های جدید را به صورت عمومی منتشر کند.
OpenAI از ارتقاء مدل‌های هوش مصنوعی خود در زمینه تبدیل گفتار به متن و متن به گفتار خبر داد. این مدل‌های جدید که به API این شرکت اضافه شده‌اند، نسبت به نسخه‌های قبلی پیشرفت‌های قابل‌توجهی داشته‌اند و قابلیت‌های بیشتری را در اختیار توسعه‌دهندگان قرار می‌دهند.
به گفته OpenAI، این مدل‌های جدید بخشی از چشم‌انداز بزرگ‌تر این شرکت برای ساخت سیستم‌های خودکار یا «عامل‌های هوشمند» هستند که می‌توانند به‌طور مستقل وظایف مختلفی را برای کاربران انجام دهند. «اولیویه گودمن»، مدیر محصول اوپن‌ای‌آی، در این باره به TechCrunch توضیح داده که این ایجنت‌ها می‌توانند به‌عنوان چت‌بات‌هایی عمل کنند که با مشتریان یک کسب‌وکار تعامل می‌کنند. او پیش‌بینی کرد که در ماه‌های آینده شاهد ظهور تعداد بیشتری از این عامل‌ها خواهیم بود.
مدل تبدیل متن به گفتار OpenAI
مدل جدید تبدیل متن به گفتار OpenAI با نام gpt-4o-mini-tts، نه تنها گفتاری طبیعی‌تر و با جزئیات بیشتر تولید می‌کند، بلکه قابلیت تنظیم دقیق‌تری نیز دارد. توسعه‌دهندگان می‌توانند با استفاده از دستورات زبان طبیعی، نحوه بیان متن را کنترل کنند.
به‌عنوان مثال، می‌توان از این مدل خواست که مانند یک «دانشمند دیوانه» یا با صدایی آرام و شبیه به یک معلم صحبت کند. یک نمونه از صداهای تولید شده توسط این مدل را در ادامه می‌توانید بشنوید:

بازار


«جف هریس»، یکی از اعضای تیم محصول OpenAI، تأکید کرده که هدف این است که توسعه‌دهندگان بتوانند هم «تجربه صوتی» و هم «زمینه» را به دلخواه خود تنظیم کنند. او می‌گوید:
«در موقعیت‌های مختلف، شما نمی‌خواهید که صدایی یکنواخت و بدون احساس شنیده شود. مثلاً اگر در یک تجربه پشتیبانی مشتری هستید و می‌خواهید صدای ربات عذرخواهی کند، می‌توانید به مدل دستور دهید که این احساس را در صدا لحاظ کند.»
مدل‌های تبدیل گفتار به متن
OpenAI همچنین دو مدل جدید تبدیل گفتار به متن با نام‌های gpt-4o-transcribe و gpt-4o-mini-transcribe را معرفی کرده است که جایگزین مدل قدیمی Whisper می‌شوند. این مدل‌های جدید که روی مجموعه‌ داده‌های صوتی متنوع و باکیفیت آموزش دیده‌اند، می‌توانند صداهای با لهجه‌های مختلف و حتی در محیط‌های شلوغ را با دقت بیشتری تشخیص دهند.
هریس همچنین اشاره کرده که این مدل‌ها کمتر از Whisper دچار خطاهای «توهم» می‌شوند. مدل Whisper گاهی اوقات کلمات یا حتی جملات کاملی را که وجود نداشتند، به متن اضافه می‌کرد که این موضوع می‌توانست مشکلاتی را ایجاد کند. او می‌گوید:
«این مدل‌ها در مقایسه با Whisper بهبود چشمگیری داشته‌اند. دقت مدل‌ها برای ایجاد یک تجربه صوتی قابل اعتماد کاملاً ضروری است و دقت در اینجا به این معناست که مدل‌ها کلمات را به درستی تشخیص می‌دهند و جزئیاتی که نشنیده‌اند را به متن اضافه نمی‌کنند.»


بااین‌حال، دقت این مدل‌ها ممکن است بسته به زبانی که تبدیل می‌شود، متفاوت باشد.
برخلاف رویه گذشته، OpenAI قصد ندارد این مدل‌های جدید تبدیل گفتار به متن خود را به‌صورت عمومی منتشر کند. این شرکت پیش‌تر نسخه‌های جدید Whisper را تحت مجوز MIT برای استفاده تجاری منتشر می‌کرد. هریس توضیح داده که مدل‌های جدید بسیار بزرگ‌تر از Whisper هستند و بنابراین برای انتشار عمومی مناسب نیستند. او می‌گوید:
«این مدل‌ها از نوعی نیستند که بتوانید به راحتی روی لپ‌تاپ خود اجرا کنید. ما می‌خواهیم اگر چیزی را به‌صورت متن‌باز منتشر می‌کنیم، با دقت این کار را انجام دهیم و مدلی را ارائه کنیم که واقعاً برای آن نیاز خاص مناسب باشد.»

لینک کوتاه:
https://www.aryajavan.ir/Fa/News/1473023/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

کره شمالی درحال تشکیل گروه‌های هکری با تمرکز روی هوش مصنوعی است

شیائومی 15S Pro اولین نشانه‌ها از پرچمدار میان‌نسلی آینده

تصاویری از حال و هوای برفی در هند

«معاویه»؛ از شکست در روایت تا تحریف تاریخ

پیشنهاد اغوا کننده‌تر عربستانی‌ها به رافینیا!

جوکوویچ به دنبال کسب صدمین عنوان در تنیس

تصمیم نهایی یونایتد درباره رشفورد مشخص شد

آخرین رنکینگ فوتبال ساحلی؛ ایران در رده هفتم جهان

قلعه‌نویی: ٢٠ هزار کشته در تصادفات دلخراش است

تمرین فرانسه برای دیدار برگشت با کرواسی

بهترین بازیکن تاریخ تیم‌های ملی

فرمانده نیروی دریایی سپاه: ما حتما باید به هوش مصنوعی مجهز شویم

وزیر کشور: دیوارکشی مرزهای شرقی کشور آغاز شده است

ضریب اشغال هتل‌های 5ستاره کیش به 90درصد رسید

وقتی انسان و رایانه به یکدیگر گره می‌خورند!

نمایی از برج جهانی لوته در سئول، کره جنوبی

بازگشت شهاب حسینی به سینمای اجتماعی؛ «رها» روایت یک رنج است

صالح حردانی سد محکم مقابل نقطه قوت ازبکستان!

کار سخت یک سپاهانی برای بازی ملی

خشم دی‌ماریا: باز هم دروغ‌ها شروع شد!

شروع جلسه‌های فنی تیم ملی ایران برای بازی با ازبکستان

تکواندو ایران و نتیجه ماندگار در پاریس

ایتالیانو: این داغ‌ترین نیمکت سری‌آ بود

روزنامه‌نگار ازبک: ایران ستاره‌ دارد اما کارش در تهران سخت است

خانه‌ای که کارخانه شد؛ زنان موفقی که برند ساختند

اظهارات رسایی درباره جلسه تصویب برجام؛ درمورد پِهِن هم بخواهی تصمیم بگیری بیشتر از 20 دقیقه وقت می‌گذاری!

آتش‌سوزی در آسمان؛ هواپیمای هنگ‌کنگی دچار حادثه شد

روز پخش ​سریال «پایتخت» در نوروز مشخص شد

جواد قارایی: جهت اطلاع اردوغان؛ نوروز واژه فارسی است!

حذف زود هنگام قهرمانان؛ اتفاقی نادر در مسترز میامی

بازی تدارکاتی خیبر پیش از مصاف با استقلال

چراغپور: نقاط ضعف تیم ملی نگران کننده است

قانون جدید انگلیس؛ ستاره‌ها منتظر تصمیم توخل

پرواز چارتر هواداران ازبکستان به تهران برای بازی تیم ملی فوتبال

واکنش رسایی به اظهار نظر اخیر روحانی برای ماجرای گرانی بنزین در سال ٩٨

روایت صدر از ماجرای دعوایش با حاج قاسم در جلسه شورای عالی امنیت ملی

نماینده ویژه ترامپ: راه‌حل بحران با ایران، دیپلماسی است نه جنگ

تولید فصل سوم سریال «خاندان اژدها» آغاز شد

مومیایی مشهورترین ملکه مصر پیدا شد

توسعه هوش مصنوعی جدیدی که با دقت بالای 90 درصد سرطان را تشخیص می‌دهد

مدل صورتی گوشی تاشو موتورولا ریزر 60 اولترا رؤیت شد

نمایش قدرت شگفت‌انگیز آهن‌رباهای نئودیمیومی در یک آزمایش جالب

تصاویری از جاذبه گردشگری رُم

بیانات رهبرانقلاب درباره اهمیت صادقانه بودن پیمان مومنین با خدا

چهره‌هایی که راه را باز کردند؛ تئاتر شهر «هنرمند» فراموش شده است!

6 برنامه که نیمه دوم 1403 با فرم مشابه پخش شدند

محرومیت ماشاریپوف، یک غیبت بزرگ است

پژمان درستکار چگونه به این ترکیب رسید؟

نذر خدمت به کودکان مبتلا به بیماری پروانه‌ای

تقویم تاریخ/ صدور اعلامیه امام خمینی(ره)در واکنش به تهاجم مزدوران پهلوی به مدرسه فیضیه

ویکی پدیاجستجو