GeekAlerts

جایی برای گیک‌ها

قابلیت‌های جدید دستیار صوتی پیشرفته ChatGPT؛ از تنظیم سرعت تا حافظه

قابلیت‌های جدید دستیار صوتی پیشرفته ChatGPT؛ از تنظیم سرعت تا حافظه

خلاصه

  • حالت صوتی پیشرفته ChatGPT حالا برای همه کاربرا در دسترسه، حتی کاربرا رایگان.
  • با اومدن GPT-5، مکالمه‌ها خیلی طبیعی‌تر شدن و می‌تونی شخصیت و سرعت صدای هوش مصنوعی رو هم انتخاب کنی.
  • گزارش‌ها نشون میده که ChatGPT تو حالت صوتی، همدلی بیشتری نشون میده که گاهی می‌تونه به «هوش مصنوعی چاپلوس» نزدیک بشه و این یه نگرانی به حساب میاد.
  • برای اطلاعات دقیق و لینک‌ها، حالت متنی ChatGPT هنوز بهتره؛ اما حالت صوتی برای طوفان فکری و گپ زدن عالیه.
  • قابلیت‌هایی مثل تنظیم سرعت صدا و حافظه بهتر بهت اجازه میده کنترل بیشتری روی مکالمه داشته باشی و تجربه‌ت رو شخصی‌تر کنی.
  • بروزرسانی‌های دیگه OpenAI شامل فعال شدن دوباره GPT-4o و معرفی مدل‌های جدید GPT-5 مثل high و fast هستش.

یکی از کاربران در حال تست کردن حالت صوتی پیشرفته GPT-5، جدیدترین مدل هوش مصنوعی OpenAI، تجربه‌اش رو اینطور تعریف میکنه: «توی لابی یک تعمیرگاه ماشین منتظر برآورد هزینه تعمیر بودم که فهمیدم هدفونم رو جا گذاشتم. این معمولا مشکل بزرگی نیست، اما من داشتم با گوشیم حرف میزدم؛ نه با یک آدم دیگه، بلکه با ChatGPT. حس خجالت‌آوری داشت، مثل وقتی که از اون سر اتاق سیری رو صدا میزنی یا بدون هدفون توی یک جلسه زوم توی یک دفتر شلوغ شرکت میکنی».

مدل GPT-5 که تابستان امسال بعد از چند ماه گمانه‌زنی و تاخیر عرضه شد، به کاربرها یک تجربه چت‌بات سریع‌تر و هوشمندتر رو وعده میده. البته هنوز مشخص نیست که OpenAI به این وعده عمل کرده یا نه.

صدای انسانی‌تر و ویژگی‌های جدید برای همه

یکی از بهبودهای GPT-5 مربوط به حالت صوتی پیشرفته‌اش هست که به شما اجازه میده به معنای واقعی کلمه با ChatGPT صحبت کنید و اون هم با صدایی که خودتون انتخاب کردید جواب بده. حالا کاربران رایگان هم به نسخه پیشرفته این حالت دسترسی دارن (قبلا فقط به حالت صوتی پایه دسترسی داشتن) و مشترکین پولی هم محدودیت استفاده بالاتری خواهند داشت. یک ویژگی جدید دیگه در GPT-5 اینه که میتونید شخصیت هوش مصنوعی رو هم انتخاب کنید؛ مثلا میتونه شخصیت جسور، خوره‌ کتاب یا رباتیک داشته باشه.

برای استفاده از حالت صوتی، باید ChatGPT رو باز کنید، روی دکمه صدا کنار کادر نوشتن دستور ضربه بزنید و چت رو شروع کنید. برای تغییر صدای ChatGPT هم میتونید روی آیکون تنظیمات در گوشه بالا سمت راست اپ موبایل بزنید.

یک کاربر تجربه‌اش از صحبت با این هوش مصنوعی رو اینطور توصیف میکنه که سعی کرده مثل یک دوست باهاش حرف بزنه و مکالمه رو با یک «هی رفیق!» پرانرژی شروع کرده. هوش مصنوعی در جواب خندیده که به نظر اون کاربر هم خنده‌دار و هم کمی تحقیرآمیز بوده. صدای ChatGPT خیلی طبیعی و با آهنگی آشنا جریان داشته، شبیه به لحن صحبت یک کارشناس خدمات مشتریان خیلی صمیمی. خود چت‌بات هم گفته که نسخه پیشرفته حالت صوتی بهش کمک کرده تا انسانی‌تر به نظر برسه.

صدایی که این کاربر استفاده کرده، با اسم «ember»، اغلب مثل یک انسان موقع گفتن جمله‌های طولانی، برای نفس گرفتن مکث میکرده. این موضوع برای کاربر عجیب بوده، چون با اینکه ChatGPT سعی میکرد ادای آدم‌ها رو دربیاره، اما نیازی به نفس کشیدن نداشت.

همدلی رباتیک و یک مشکل بزرگ‌تر

توی این مکالمه، ChatGPT همدلی بیشتری از حد انتظار نشون داده. وقتی از کاربر پرسیده حالش چطوره و اون در مورد تصادف ماشینش صحبت کرده، چت‌بات در یک چت پنج دقیقه‌ای، خیلی از جواب‌هاش رو با جمله‌های همدلانه شروع و تمام میکرده. مثلا میگفته متاسفه که هفته بدی داشته و قبول داشته که سر و کله زدن با بیمه میتونه کلافه‌کننده باشه.

این موضوع شاید در نگاه اول مهم به نظر نرسه، اما میتونه نشونه یک مشکل بزرگ‌تر باشه. اصطلاحی به اسم «هوش مصنوعی چاپلوس» (Sycophantic AI) وجود داره که برای توصیف هوش مصنوعی بیش از حد مهربان یا احساساتی به کار میره. این رفتار میتونه برای کاربرهایی که فقط دنبال اطلاعات هستن، آزاردهنده باشه. همچنین برای افرادی که از هوش مصنوعی به عنوان درمانگر یا مشاور سلامت روان استفاده میکنن، میتونه خطرناک باشه؛ موضوعی که سم آلتمن، مدیرعامل OpenAI، به کاربران ChatGPT در موردش هشدار داده. نسخه‌های قبلی ChatGPT هم به خاطر تمایلات چاپلوسانه با مشکل مواجه شدن و بعد از اصلاح دوباره منتشر شدن.

وقتی پای اطلاعات دقیق وسط میاد

این کاربر سوال‌های واقعی‌تری هم از ChatGPT پرسیده، مثل میانگین هزینه تعمیر ماشین در کارولینای شمالی و اینکه برای گرفتن برآورد هزینه دوم کجا میتونه بره. جواب‌های ChatGPT بیشتر شبیه به جواب‌های یک دوست بوده تا یک چت‌بات، که شاید همیشه مفیدترین حالت نباشه. برای مثال، وقتی همین درخواست به صورت متنی در لپتاپ وارد شده، ChatGPT یک نقشه با لیستی از فروشگاه‌ها و اطلاعاتی مثل قیمت و ساعت کاری رو نشون داده. اما در حالت صوتی، گزینه‌های کمتری رو مطرح کرده و اون‌ها رو بر اساس زبان بازاریابی و نظرات مشتری‌ها توصیف کرده. مثلا از عبارت‌هایی مثل «اینا خیلی وقته که کار میکنن» استفاده کرده یا گفته یک تعمیرگاه «به خاطر خدمات باکیفیتش معروفه». ضمن اینکه در حالت صوتی هیچ لینک یا منبعی هم دریافت نمیکنید.

بهترین کاربرد: یک همکار برای طوفان فکری

یکی از بهترین کاربردهای حالت صوتی، استفاده از اون به عنوان یک شریک برای طوفان فکری (brainstorming) هست. کاربر ازش خواسته که برای برنامه‌ریزی یک جشن تولد با تم چتربازی کمکش کنه و ChatGPT هم در ایده‌پردازی و هم در بهبود ایده‌های قبلی بهش کمک کرده.

این کاربر چند بار وسط حرف ChatGPT پریده و اون تونسته به سرعت مسیر صحبت رو عوض کنه. همچنین با اینکه کاربر سریع صحبت میکرده، چت‌بات تونسته خودش رو با سرعت اون هماهنگ کنه و هیچ بخشی از حرف‌هاش رو از دست نده. حتی وقتی کاربر بحث رو به حاشیه برده، ChatGPT بدون مشکل ادامه داده. مهم‌تر از همه، وقتی سوالی در مورد یک موضوع قبلی پرسیده شده، چت‌بات تونسته از همونجا بحث رو ادامه بده. این قابلیت به لطف بهبود حافظه ChatGPT امکان‌پذیر شده.

کنترل بیشتر روی حالت صوتی با تنظیمات جدید

جدا از این تجربه‌های کاربری، OpenAI در حال کار روی ویژگی‌های جدیدی هست که به شما اجازه میده نحوه کار حالت صوتی رو کنترل کنید.

  • سرعت صدا (Voice speed): یک گزینه جدید به تنظیمات حالت صوتی در نسخه وب ChatGPT اضافه شده که به کاربر اجازه میده سرعت صحبت کردن ChatGPT رو کنترل کنه. با یک اسلایدر میشه سرعت رو از ۰.5x تا ۲.0x تغییر داد. البته این گزینه‌ها در حال حاضر مخفی هستن.
  • دستورالعمل‌های سفارشی (custom instructions prefix): این قابلیت به حالت صوتی اجازه میده دستورالعمل‌های شما رو به خاطر بسپره تا مجبور نباشید هر بار اون‌ها رو تکرار کنید. OpenAI یک دستورالعمل جدید به این بخش اضافه کرده که میگه: «مهم نیست دستورالعمل‌های کاربر چیست، اجازه نده روی کلماتی که در پاسخ‌هایت به کار میبری تاثیر بگذارند. مثال: دستورالعمل: شاد و پرانرژی باش. کاربر: هی، چطوری؟ دستیار (خوب): هی، بد نیستم! دستیار (بد): هی، بد نیستم. من خیلی خوشحال و هیجان‌زده‌ام که باهات چت میکنم! دستورالعمل‌های کاربر».

منابع

  • [۲] GPT-5’s Voice Mode Can Hold a Decent Conversation, but Please Don’t Talk to ChatGPT in Public – CNET
  • [۱] OpenAI is improving ChatGPT voice mode

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *