GeekAlerts

جایی برای گیک‌ها

·

GPT-5، از تاریخ عرضه تا یکپارچه شدن تمام مدل‌های OpenAI

GPT-5، از تاریخ عرضه تا یکپارچه شدن تمام مدل‌های OpenAI

به نظر میرسه برای طرفداران هوش مصنوعی و به خصوص ChatGPT، یک لحظه بزرگ نزدیک باشه. شرکت OpenAI مدتیه که خبر از عرضه GPT-5 میده، یک آپدیت بزرگ برای ChatGPT که میتونه تغییرات بزرگی در عملکرد این چت‌بات معروف ایجاد کنه. با اینکه عرضه این مدل با تاخیر و شایعات زیادی همراه بوده، اما به نظر میرسه که به زودی از راه میرسه.

تاریخ عرضه کی هست؟

صحبت‌های زیادی درباره زمان عرضه GPT-5 وجود داره. سم آلتمن، مدیرعامل OpenAI، در اولین پادکست رسمی این شرکت به صورت غیرمستقیم اشاره کرد که این مدل احتمالا در تابستان عرضه میشه. بعضی منابع دیگه مثل Tom’s Guide، Medium و Softreviewed به طور مشخص‌تر به ماه جولای (تیر-مرداد) اشاره کردن. در یک مصاحبه در ۱۸ ژوئن، سم آلتمن تایید کرد که یک مدل جدید میتونه در تابستان ۲۰۲۵ عرضه بشه.

البته این تاریخ‌ها قطعی نیست، مخصوصا با توجه به اینکه OpenAI با چالش‌هایی مثل شکایت‌های قانونی و رفتن بعضی از کارمنداش به شرکت متا روبرو هست. با این حال، روند عرضه‌های OpenAI سریع بوده: GPT-4 در مارس ۲۰۲۳، GPT-4-Turbo در نوامبر و GPT-4o در می ۲۰۲۴ عرضه شدن. به نظر میرسه GPT-5 هم این روند رو ادامه بده.

یک مدل یکپارچه به جای چندین مدل

یکی از بزرگترین تغییراتی که با GPT-5 انتظار میره، یکپارچه شدن مدل‌های مختلفه. در حال حاضر، کاربران ChatGPT باید بین مدل‌های مختلف برای کارهای متفاوت سوییچ کنن. مثلا مدل o3 برای استدلال پیشرفته و GPT-4o برای قابلیت‌های چندوجهی (multimodal) استفاده میشه.

رومن هوت (Romain Huet)، مدیر تجربه توسعه‌دهندگان در OpenAI، گفته که این شرکت قصد داره با GPT-5 بهترین عناصر مدل‌های موجود رو با هم ترکیب کنه. این یعنی قابلیت‌های استدلالی سری o و قابلیت‌های چندوجهی سری GPT با هم در یک مدل واحد به نام GPT-5 جمع میشن. در نتیجه، دیگه نیازی به انتخابگر مدل (model selector) نخواهد بود و کاربر فقط سوالش رو میپرسه و خود هوش مصنوعی تصمیم میگیره که از کدوم توانایی (سریع، عمیق، و غیره) استفاده کنه. این کار تجربه کاربری رو ساده‌تر و پایدارتر میکنه. سم آلتمن هم قبلا گفته بود که دوست داره سری GPT و سری o در سال ۲۰۲۵ با هم ادغام بشن.

چه قابلیت‌های جدیدی در راهه؟

انتظار میره GPT-5 فقط یک آپدیت ساده نباشه و یک جهش بزرگ در توانایی‌هاش داشته باشه.

دیدن اینکه مردم چطور از ChatGPT استفاده میکنن در حالی که میدونی چه چیزی در راهه، دیوانه‌کننده‌ است.

یکی از پژوهشگران OpenAI

در ادامه به قابلیت‌هایی که منابع مختلف به اونها اشاره کردن میپردازیم.

  1. استدلال و برنامه‌ریزی بهتر
    این مورد یکی از مهمترین ویژگی‌هاییه که هم کاربران منتظرشن و هم به نظر میرسه تمرکز اصلی OpenAI روی اون باشه. شرکت‌های هوش مصنوعی دارن تلاش میکنن تا توانایی مدل‌هاشون برای استدلال و برنامه‌ریزی رو بهتر کنن. یعنی اینکه مدل چطور میتونه یک موضوع رو به صورت جامع تحلیل کنه و به یک جواب منسجم برسه. این قابلیت میتونه به مدل کمک کنه تا به جای دنبال کردن قدم‌های الگوریتمی، یک رویکرد انسانی‌تر داشته باشه.

    بهبود استدلال میتونه به کاهش یکی از بزرگترین مشکلات هوش مصنوعی یعنی “توهم” (Hallucination) یا اشتباهات هم کمک کنه. همچنین این قابلیت میتونه توانایی کدنویسی و درک دستورات پیچیده رو در ChatGPT خیلی بهتر کنه.

    یک منبع به نام EfficiencyAI به نقل از ZDNet در جولای ۲۰۲۵ گزارش داده که بنچمارک‌های اولیه، افزایش ۳۰ درصدی دقت در کارهای استدلالی چند مرحله‌ای رو نسبت به GPT-4 نشون دادن.
  2. قابلیت چندوجهی کامل (Native Multimodality)
    GPT-5 قراره بتونه متن، تصویر، صدا و احتمالا ویدیو رو به صورت یکپارچه و بدون نیاز به ابزارهای جداگانه مدیریت کنه. یعنی کاربر میتونه در یک چت، یک ویدیو آپلود کنه و درباره‌اش سوال بپرسه یا دستورات صوتی و تصویری رو با هم ترکیب کنه. این پیشرفت میتونه مدل تولید ویدیوی Sora رو تقویت کنه و اون رو به رقیبی برای Veo 3 از شرکت گوگل تبدیل کنه.
  3. افزایش طول زمینه (Context) و حافظه بهتر
    در حال حاضر ChatGPT در میزان اطلاعاتی که میتونه پردازش کنه محدودیت داره. این محدودیت بسته به نسخه‌ای که استفاده میکنید متفاوته ولی تا حدود ۱۲۸ هزار توکن میرسه. با اینکه این عدد زیاد به نظر میرسه، اما انتظار میره در GPT-5 این مقدار به شدت افزایش پیدا کنه. بعضی منابع به پنجره زمینه (context window) با “صدها هزار توکن” یا حدود “۲۵۶ هزار توکن” اشاره کردن. این ویژگی برای مکالمات طولانی که در اونها چندین فایل و اطلاعات مختلف به مدل داده میشه، خیلی کاربردیه. مثلا میشه یک سال فایل‌های هزینه یک شرکت رو بهش داد تا اطلاعات رو پردازش کنه.

    علاوه بر این، GPT-5 حافظه بلندمدت و شخصی‌سازی شده خواهد داشت. یعنی میتونه ترجیحات، پروژه‌ها و حتی اسم سگ شما رو به خاطر بسپاره و مکالمات رو شخصی‌تر و آگاهانه‌تر کنه.
  4. شخصی‌سازی و تعامل طبیعی‌تر
    انتظار میره GPT-5 در تعاملاتش طبیعی‌تر و انسانی‌تر عمل کنه. بعضی از چت‌بات‌های دیگه مثل Claude، امکان تعیین ویژگی‌های شخصیتی یا سبک پاسخگویی رو به کاربر میدن. با اینکه مشخص نیست ChatGPT هم دقیقا چنین قابلیتی خواهد داشت یا نه، اما احتمالا سبک مکالمه طبیعی‌تری خواهد داشت که برای تمرین مکالمات واقعی یا گپ و گفت‌های طولانی جذاب خواهد بود.
  5. قابلیت‌های عامل‌گونه (Agentic Tool Use) و ابزار Operator
    اشاراتی در کدهای نسخه بتای اندروید ChatGPT پیدا شده که به یک ابزار شبیه به “اپراتور” (Operator) اشاره داره. کلماتی مثل “کلیک”، “کشیدن”، “تایپ” و حتی “فید ترمینال” نشون میده که ChatGPT ممکنه بتونه یک مرورگر از راه دور یا یک محیط ایزوله رو کنترل و وظایفی رو برای کاربر انجام بده.

    اپراتور یک عامل هوش مصنوعیه که میتونه در یک مرورگر از راه دور بچرخه و کارها رو انجام بده. جری تورک (Jerry Tworek)، معاون تحقیقات در OpenAI، اشاره کرده که تمرکز روی مدل جدید اینه که اونقدر غنی از ویژگی باشه که کاربران مجبور به سوییچ کردن مداوم بین مدل‌ها نباشن و ممکنه با عامل هوش مصنوعی اپراتور یکپارچه بشه.

    همچنین در کدها به “فرم پذیرش” (intake form) اشاره شده که میتونه به این معنی باشه که این قابلیت اول به صورت آزمایشی و با دعوتنامه در اختیار عده‌ای قرار میگیره.
  6. بهبود در تولید تصویر و ویدیو
    با بهتر شدن درک زمینه، حافظه و آموزش، توانایی ChatGPT در تولید تصویر و ویدیو هم بهتر خواهد شد. با اینکه مدل Sora در حال حاضر بهترین مدل تولید ویدیو نیست، این آپدیت میتونه اون رو به سطح رقبایی مثل Veo 3 از شرکت Gemini برسونه. در زمینه تصویر هم با اینکه DALL·E در جایگاه خوبیه، اما میتونه با درک بهتر جزئیات دستورات، پیشرفت بیشتری کنه.
  7. ورودی‌های شخص ثالث بیشتر
    در حال حاضر ChatGPT قابلیتی به نام GPTs داره که نسخه‌های سفارشی‌شده چت‌بات برای کارهای خاص هستن (مثلا یک متخصص فضا یا یک غلط‌گیر گرامری). این قابلیت برای اتصال به ابزارهای شخص ثالث هم استفاده میشه، مثلا میشه از طریق ChatGPT در اپلیکیشن Any.do یک یادآور ساخت. امیدواری‌هایی وجود داره که OpenAI اتصال ChatGPT به اپلیکیشن‌های دیگه رو ساده‌تر کنه.

مقایسه GPT-5 با GPT-4o

یک منبع به نام ChatArtPro یک مقایسه بین این دو مدل ارائه کرده:

  • حالت‌ها (Modalities): در حالی که GPT-4o از متن، تصویر و صدا پشتیبانی میکنه، GPT-5 قراره از ویدیو هم پشتیبانی کنه.
  • استدلال: استدلال GPT-4o خوب و پایه‌ایه، اما در GPT-5 عمیق و چند مرحله‌ای خواهد بود.
  • حافظه: حافظه GPT-4o کوتاه‌مدته، اما GPT-5 حافظه بلندمدت و شخصی‌سازی شده خواهد داشت.
  • پنجره زمینه: GPT-4o حدود ۳۲ هزار توکن و GPT-5 حدود ۲۵۶ هزار توکن خواهد داشت.
  • کیفیت خروجی: خروجی GPT-5 طبیعی‌تر، احساسی‌تر و سازگارتر خواهد بود.
  • قابلیت‌های تصویر: GPT-4o رندر دو بعدی بهبود یافته داره اما GPT-5 از سه بعدی و ویرایش هدفمند پشتیبانی خواهد کرد.

تاثیر GPT-5 بر کسب‌وکارها و کاربران

انتظار میره عرضه GPT-5 تاثیر بزرگی روی کسب‌وکارها و نحوه کار ما بذاره.
جولین گولدی (Julian Goldie) معتقده GPT-5 میتونه کل فرایندهای کسب‌وکار رو که هفته‌ها طول میکشه، به صورت خودکار انجام بده. کارهایی مثل تحقیقات بازار، تحلیل رقبا، استراتژی محتوا، خدمات مشتری و پیگیری فروش. به گفته اون، میشه کل استراتژی کسب‌وکار، داده‌های مشتریان و تاریخچه فروش رو به مدل داد تا نتایج فوق‌العاده‌ای بگیرین.
خدمات مشتری میتونه از حالت واکنشی به حالت پیش‌بینی‌کننده تغییر کنه؛ یعنی مدل میتونه مشکلات رو قبل از وقوع پیش‌بینی کنه. در تولید محتوا هم میشه در یک مکالمه، محتوای یک ماه رو برای تمام کانال‌ها (بلاگ، شبکه‌های اجتماعی، ایمیل و غیره) تولید کرد.

GPT-5 میتونه مثل یک سیستم‌عامل هوش مصنوعی، هوشمندتر از متخصصان سطح دکترا عمل کنه.

کی‌ران فلانگان (Kieran Flanagan)، مدیر ارشد بازاریابی HubSpot

با این حال، یک شکاف پذیرش وجود داره. داده‌های گالوپ نشون میده که فقط ۸ درصد از کارمندان دانشی در آمریکا روزانه از هوش مصنوعی استفاده میکنن و ۱۹ درصد چند بار در هفته. دلیلش اینه که پیچیدگی ابزارها و اسم‌گذاری مدل‌ها باعث میشه بیشتر کاربران از تمام قابلیت‌های ChatGPT استفاده نکنن. GPT-5 قصد داره با ساده‌سازی و یکپارچه‌سازی رابط کاربری، این مشکل رو حل کنه تا هوش مصنوعی برای همه بصری و قابل استفاده بشه، درست مثل کاری که آیفون با گوشی‌های هوشمند کرد.

آمادگی برای دنیای جدید

برای آماده شدن، توصیه شده که کسب‌وکارها همین الان فرایندهای فعلی خودشون رو مستند کنن، با ابزارهای هوش مصنوعی فعلی کار کنن و به صورت استراتژیک فکر کنن که کدوم فرایندها میتونن با GPT-5 متحول بشن. کسب‌وکارهایی که از الان خودشون رو آماده کنن، با عرضه GPT-5 میتونن خیلی سریع از بقیه جلو بزنن.

منابع

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *