خلاصه
- حالت صوتی پیشرفته ChatGPT حالا برای همه کاربرا در دسترسه، حتی کاربرا رایگان.
- با اومدن GPT-5، مکالمهها خیلی طبیعیتر شدن و میتونی شخصیت و سرعت صدای هوش مصنوعی رو هم انتخاب کنی.
- گزارشها نشون میده که ChatGPT تو حالت صوتی، همدلی بیشتری نشون میده که گاهی میتونه به «هوش مصنوعی چاپلوس» نزدیک بشه و این یه نگرانی به حساب میاد.
- برای اطلاعات دقیق و لینکها، حالت متنی ChatGPT هنوز بهتره؛ اما حالت صوتی برای طوفان فکری و گپ زدن عالیه.
- قابلیتهایی مثل تنظیم سرعت صدا و حافظه بهتر بهت اجازه میده کنترل بیشتری روی مکالمه داشته باشی و تجربهت رو شخصیتر کنی.
- بروزرسانیهای دیگه OpenAI شامل فعال شدن دوباره GPT-4o و معرفی مدلهای جدید GPT-5 مثل high و fast هستش.
یکی از کاربران در حال تست کردن حالت صوتی پیشرفته GPT-5، جدیدترین مدل هوش مصنوعی OpenAI، تجربهاش رو اینطور تعریف میکنه: «توی لابی یک تعمیرگاه ماشین منتظر برآورد هزینه تعمیر بودم که فهمیدم هدفونم رو جا گذاشتم. این معمولا مشکل بزرگی نیست، اما من داشتم با گوشیم حرف میزدم؛ نه با یک آدم دیگه، بلکه با ChatGPT. حس خجالتآوری داشت، مثل وقتی که از اون سر اتاق سیری رو صدا میزنی یا بدون هدفون توی یک جلسه زوم توی یک دفتر شلوغ شرکت میکنی».
مدل GPT-5 که تابستان امسال بعد از چند ماه گمانهزنی و تاخیر عرضه شد، به کاربرها یک تجربه چتبات سریعتر و هوشمندتر رو وعده میده. البته هنوز مشخص نیست که OpenAI به این وعده عمل کرده یا نه.
صدای انسانیتر و ویژگیهای جدید برای همه
یکی از بهبودهای GPT-5 مربوط به حالت صوتی پیشرفتهاش هست که به شما اجازه میده به معنای واقعی کلمه با ChatGPT صحبت کنید و اون هم با صدایی که خودتون انتخاب کردید جواب بده. حالا کاربران رایگان هم به نسخه پیشرفته این حالت دسترسی دارن (قبلا فقط به حالت صوتی پایه دسترسی داشتن) و مشترکین پولی هم محدودیت استفاده بالاتری خواهند داشت. یک ویژگی جدید دیگه در GPT-5 اینه که میتونید شخصیت هوش مصنوعی رو هم انتخاب کنید؛ مثلا میتونه شخصیت جسور، خوره کتاب یا رباتیک داشته باشه.
برای استفاده از حالت صوتی، باید ChatGPT رو باز کنید، روی دکمه صدا کنار کادر نوشتن دستور ضربه بزنید و چت رو شروع کنید. برای تغییر صدای ChatGPT هم میتونید روی آیکون تنظیمات در گوشه بالا سمت راست اپ موبایل بزنید.
یک کاربر تجربهاش از صحبت با این هوش مصنوعی رو اینطور توصیف میکنه که سعی کرده مثل یک دوست باهاش حرف بزنه و مکالمه رو با یک «هی رفیق!» پرانرژی شروع کرده. هوش مصنوعی در جواب خندیده که به نظر اون کاربر هم خندهدار و هم کمی تحقیرآمیز بوده. صدای ChatGPT خیلی طبیعی و با آهنگی آشنا جریان داشته، شبیه به لحن صحبت یک کارشناس خدمات مشتریان خیلی صمیمی. خود چتبات هم گفته که نسخه پیشرفته حالت صوتی بهش کمک کرده تا انسانیتر به نظر برسه.
صدایی که این کاربر استفاده کرده، با اسم «ember»، اغلب مثل یک انسان موقع گفتن جملههای طولانی، برای نفس گرفتن مکث میکرده. این موضوع برای کاربر عجیب بوده، چون با اینکه ChatGPT سعی میکرد ادای آدمها رو دربیاره، اما نیازی به نفس کشیدن نداشت.
همدلی رباتیک و یک مشکل بزرگتر
توی این مکالمه، ChatGPT همدلی بیشتری از حد انتظار نشون داده. وقتی از کاربر پرسیده حالش چطوره و اون در مورد تصادف ماشینش صحبت کرده، چتبات در یک چت پنج دقیقهای، خیلی از جوابهاش رو با جملههای همدلانه شروع و تمام میکرده. مثلا میگفته متاسفه که هفته بدی داشته و قبول داشته که سر و کله زدن با بیمه میتونه کلافهکننده باشه.
این موضوع شاید در نگاه اول مهم به نظر نرسه، اما میتونه نشونه یک مشکل بزرگتر باشه. اصطلاحی به اسم «هوش مصنوعی چاپلوس» (Sycophantic AI) وجود داره که برای توصیف هوش مصنوعی بیش از حد مهربان یا احساساتی به کار میره. این رفتار میتونه برای کاربرهایی که فقط دنبال اطلاعات هستن، آزاردهنده باشه. همچنین برای افرادی که از هوش مصنوعی به عنوان درمانگر یا مشاور سلامت روان استفاده میکنن، میتونه خطرناک باشه؛ موضوعی که سم آلتمن، مدیرعامل OpenAI، به کاربران ChatGPT در موردش هشدار داده. نسخههای قبلی ChatGPT هم به خاطر تمایلات چاپلوسانه با مشکل مواجه شدن و بعد از اصلاح دوباره منتشر شدن.
وقتی پای اطلاعات دقیق وسط میاد
این کاربر سوالهای واقعیتری هم از ChatGPT پرسیده، مثل میانگین هزینه تعمیر ماشین در کارولینای شمالی و اینکه برای گرفتن برآورد هزینه دوم کجا میتونه بره. جوابهای ChatGPT بیشتر شبیه به جوابهای یک دوست بوده تا یک چتبات، که شاید همیشه مفیدترین حالت نباشه. برای مثال، وقتی همین درخواست به صورت متنی در لپتاپ وارد شده، ChatGPT یک نقشه با لیستی از فروشگاهها و اطلاعاتی مثل قیمت و ساعت کاری رو نشون داده. اما در حالت صوتی، گزینههای کمتری رو مطرح کرده و اونها رو بر اساس زبان بازاریابی و نظرات مشتریها توصیف کرده. مثلا از عبارتهایی مثل «اینا خیلی وقته که کار میکنن» استفاده کرده یا گفته یک تعمیرگاه «به خاطر خدمات باکیفیتش معروفه». ضمن اینکه در حالت صوتی هیچ لینک یا منبعی هم دریافت نمیکنید.
بهترین کاربرد: یک همکار برای طوفان فکری
یکی از بهترین کاربردهای حالت صوتی، استفاده از اون به عنوان یک شریک برای طوفان فکری (brainstorming) هست. کاربر ازش خواسته که برای برنامهریزی یک جشن تولد با تم چتربازی کمکش کنه و ChatGPT هم در ایدهپردازی و هم در بهبود ایدههای قبلی بهش کمک کرده.
این کاربر چند بار وسط حرف ChatGPT پریده و اون تونسته به سرعت مسیر صحبت رو عوض کنه. همچنین با اینکه کاربر سریع صحبت میکرده، چتبات تونسته خودش رو با سرعت اون هماهنگ کنه و هیچ بخشی از حرفهاش رو از دست نده. حتی وقتی کاربر بحث رو به حاشیه برده، ChatGPT بدون مشکل ادامه داده. مهمتر از همه، وقتی سوالی در مورد یک موضوع قبلی پرسیده شده، چتبات تونسته از همونجا بحث رو ادامه بده. این قابلیت به لطف بهبود حافظه ChatGPT امکانپذیر شده.
کنترل بیشتر روی حالت صوتی با تنظیمات جدید
جدا از این تجربههای کاربری، OpenAI در حال کار روی ویژگیهای جدیدی هست که به شما اجازه میده نحوه کار حالت صوتی رو کنترل کنید.
- سرعت صدا (Voice speed): یک گزینه جدید به تنظیمات حالت صوتی در نسخه وب ChatGPT اضافه شده که به کاربر اجازه میده سرعت صحبت کردن ChatGPT رو کنترل کنه. با یک اسلایدر میشه سرعت رو از ۰.5x تا ۲.0x تغییر داد. البته این گزینهها در حال حاضر مخفی هستن.
- دستورالعملهای سفارشی (custom instructions prefix): این قابلیت به حالت صوتی اجازه میده دستورالعملهای شما رو به خاطر بسپره تا مجبور نباشید هر بار اونها رو تکرار کنید. OpenAI یک دستورالعمل جدید به این بخش اضافه کرده که میگه: «مهم نیست دستورالعملهای کاربر چیست، اجازه نده روی کلماتی که در پاسخهایت به کار میبری تاثیر بگذارند. مثال: دستورالعمل: شاد و پرانرژی باش. کاربر: هی، چطوری؟ دستیار (خوب): هی، بد نیستم! دستیار (بد): هی، بد نیستم. من خیلی خوشحال و هیجانزدهام که باهات چت میکنم! دستورالعملهای کاربر».
دیدگاهتان را بنویسید