به نظر میرسه برای طرفداران هوش مصنوعی و به خصوص ChatGPT، یک لحظه بزرگ نزدیک باشه. شرکت OpenAI مدتیه که خبر از عرضه GPT-5 میده، یک آپدیت بزرگ برای ChatGPT که میتونه تغییرات بزرگی در عملکرد این چتبات معروف ایجاد کنه. با اینکه عرضه این مدل با تاخیر و شایعات زیادی همراه بوده، اما به نظر میرسه که به زودی از راه میرسه.
تاریخ عرضه کی هست؟
صحبتهای زیادی درباره زمان عرضه GPT-5 وجود داره. سم آلتمن، مدیرعامل OpenAI، در اولین پادکست رسمی این شرکت به صورت غیرمستقیم اشاره کرد که این مدل احتمالا در تابستان عرضه میشه. بعضی منابع دیگه مثل Tom’s Guide، Medium و Softreviewed به طور مشخصتر به ماه جولای (تیر-مرداد) اشاره کردن. در یک مصاحبه در ۱۸ ژوئن، سم آلتمن تایید کرد که یک مدل جدید میتونه در تابستان ۲۰۲۵ عرضه بشه.
البته این تاریخها قطعی نیست، مخصوصا با توجه به اینکه OpenAI با چالشهایی مثل شکایتهای قانونی و رفتن بعضی از کارمنداش به شرکت متا روبرو هست. با این حال، روند عرضههای OpenAI سریع بوده: GPT-4 در مارس ۲۰۲۳، GPT-4-Turbo در نوامبر و GPT-4o در می ۲۰۲۴ عرضه شدن. به نظر میرسه GPT-5 هم این روند رو ادامه بده.
یک مدل یکپارچه به جای چندین مدل
یکی از بزرگترین تغییراتی که با GPT-5 انتظار میره، یکپارچه شدن مدلهای مختلفه. در حال حاضر، کاربران ChatGPT باید بین مدلهای مختلف برای کارهای متفاوت سوییچ کنن. مثلا مدل o3 برای استدلال پیشرفته و GPT-4o برای قابلیتهای چندوجهی (multimodal) استفاده میشه.
رومن هوت (Romain Huet)، مدیر تجربه توسعهدهندگان در OpenAI، گفته که این شرکت قصد داره با GPT-5 بهترین عناصر مدلهای موجود رو با هم ترکیب کنه. این یعنی قابلیتهای استدلالی سری o و قابلیتهای چندوجهی سری GPT با هم در یک مدل واحد به نام GPT-5 جمع میشن. در نتیجه، دیگه نیازی به انتخابگر مدل (model selector) نخواهد بود و کاربر فقط سوالش رو میپرسه و خود هوش مصنوعی تصمیم میگیره که از کدوم توانایی (سریع، عمیق، و غیره) استفاده کنه. این کار تجربه کاربری رو سادهتر و پایدارتر میکنه. سم آلتمن هم قبلا گفته بود که دوست داره سری GPT و سری o در سال ۲۰۲۵ با هم ادغام بشن.
چه قابلیتهای جدیدی در راهه؟
انتظار میره GPT-5 فقط یک آپدیت ساده نباشه و یک جهش بزرگ در تواناییهاش داشته باشه.
دیدن اینکه مردم چطور از ChatGPT استفاده میکنن در حالی که میدونی چه چیزی در راهه، دیوانهکننده است.
یکی از پژوهشگران OpenAI
در ادامه به قابلیتهایی که منابع مختلف به اونها اشاره کردن میپردازیم.
- استدلال و برنامهریزی بهتر
این مورد یکی از مهمترین ویژگیهاییه که هم کاربران منتظرشن و هم به نظر میرسه تمرکز اصلی OpenAI روی اون باشه. شرکتهای هوش مصنوعی دارن تلاش میکنن تا توانایی مدلهاشون برای استدلال و برنامهریزی رو بهتر کنن. یعنی اینکه مدل چطور میتونه یک موضوع رو به صورت جامع تحلیل کنه و به یک جواب منسجم برسه. این قابلیت میتونه به مدل کمک کنه تا به جای دنبال کردن قدمهای الگوریتمی، یک رویکرد انسانیتر داشته باشه.
بهبود استدلال میتونه به کاهش یکی از بزرگترین مشکلات هوش مصنوعی یعنی “توهم” (Hallucination) یا اشتباهات هم کمک کنه. همچنین این قابلیت میتونه توانایی کدنویسی و درک دستورات پیچیده رو در ChatGPT خیلی بهتر کنه.
یک منبع به نام EfficiencyAI به نقل از ZDNet در جولای ۲۰۲۵ گزارش داده که بنچمارکهای اولیه، افزایش ۳۰ درصدی دقت در کارهای استدلالی چند مرحلهای رو نسبت به GPT-4 نشون دادن. - قابلیت چندوجهی کامل (Native Multimodality)
GPT-5 قراره بتونه متن، تصویر، صدا و احتمالا ویدیو رو به صورت یکپارچه و بدون نیاز به ابزارهای جداگانه مدیریت کنه. یعنی کاربر میتونه در یک چت، یک ویدیو آپلود کنه و دربارهاش سوال بپرسه یا دستورات صوتی و تصویری رو با هم ترکیب کنه. این پیشرفت میتونه مدل تولید ویدیوی Sora رو تقویت کنه و اون رو به رقیبی برای Veo 3 از شرکت گوگل تبدیل کنه. - افزایش طول زمینه (Context) و حافظه بهتر
در حال حاضر ChatGPT در میزان اطلاعاتی که میتونه پردازش کنه محدودیت داره. این محدودیت بسته به نسخهای که استفاده میکنید متفاوته ولی تا حدود ۱۲۸ هزار توکن میرسه. با اینکه این عدد زیاد به نظر میرسه، اما انتظار میره در GPT-5 این مقدار به شدت افزایش پیدا کنه. بعضی منابع به پنجره زمینه (context window) با “صدها هزار توکن” یا حدود “۲۵۶ هزار توکن” اشاره کردن. این ویژگی برای مکالمات طولانی که در اونها چندین فایل و اطلاعات مختلف به مدل داده میشه، خیلی کاربردیه. مثلا میشه یک سال فایلهای هزینه یک شرکت رو بهش داد تا اطلاعات رو پردازش کنه.
علاوه بر این، GPT-5 حافظه بلندمدت و شخصیسازی شده خواهد داشت. یعنی میتونه ترجیحات، پروژهها و حتی اسم سگ شما رو به خاطر بسپاره و مکالمات رو شخصیتر و آگاهانهتر کنه. - شخصیسازی و تعامل طبیعیتر
انتظار میره GPT-5 در تعاملاتش طبیعیتر و انسانیتر عمل کنه. بعضی از چتباتهای دیگه مثل Claude، امکان تعیین ویژگیهای شخصیتی یا سبک پاسخگویی رو به کاربر میدن. با اینکه مشخص نیست ChatGPT هم دقیقا چنین قابلیتی خواهد داشت یا نه، اما احتمالا سبک مکالمه طبیعیتری خواهد داشت که برای تمرین مکالمات واقعی یا گپ و گفتهای طولانی جذاب خواهد بود. - قابلیتهای عاملگونه (Agentic Tool Use) و ابزار Operator
اشاراتی در کدهای نسخه بتای اندروید ChatGPT پیدا شده که به یک ابزار شبیه به “اپراتور” (Operator) اشاره داره. کلماتی مثل “کلیک”، “کشیدن”، “تایپ” و حتی “فید ترمینال” نشون میده که ChatGPT ممکنه بتونه یک مرورگر از راه دور یا یک محیط ایزوله رو کنترل و وظایفی رو برای کاربر انجام بده.
اپراتور یک عامل هوش مصنوعیه که میتونه در یک مرورگر از راه دور بچرخه و کارها رو انجام بده. جری تورک (Jerry Tworek)، معاون تحقیقات در OpenAI، اشاره کرده که تمرکز روی مدل جدید اینه که اونقدر غنی از ویژگی باشه که کاربران مجبور به سوییچ کردن مداوم بین مدلها نباشن و ممکنه با عامل هوش مصنوعی اپراتور یکپارچه بشه.
همچنین در کدها به “فرم پذیرش” (intake form) اشاره شده که میتونه به این معنی باشه که این قابلیت اول به صورت آزمایشی و با دعوتنامه در اختیار عدهای قرار میگیره. - بهبود در تولید تصویر و ویدیو
با بهتر شدن درک زمینه، حافظه و آموزش، توانایی ChatGPT در تولید تصویر و ویدیو هم بهتر خواهد شد. با اینکه مدل Sora در حال حاضر بهترین مدل تولید ویدیو نیست، این آپدیت میتونه اون رو به سطح رقبایی مثل Veo 3 از شرکت Gemini برسونه. در زمینه تصویر هم با اینکه DALL·E در جایگاه خوبیه، اما میتونه با درک بهتر جزئیات دستورات، پیشرفت بیشتری کنه. - ورودیهای شخص ثالث بیشتر
در حال حاضر ChatGPT قابلیتی به نام GPTs داره که نسخههای سفارشیشده چتبات برای کارهای خاص هستن (مثلا یک متخصص فضا یا یک غلطگیر گرامری). این قابلیت برای اتصال به ابزارهای شخص ثالث هم استفاده میشه، مثلا میشه از طریق ChatGPT در اپلیکیشن Any.do یک یادآور ساخت. امیدواریهایی وجود داره که OpenAI اتصال ChatGPT به اپلیکیشنهای دیگه رو سادهتر کنه.
مقایسه GPT-5 با GPT-4o
یک منبع به نام ChatArtPro یک مقایسه بین این دو مدل ارائه کرده:
- حالتها (Modalities): در حالی که GPT-4o از متن، تصویر و صدا پشتیبانی میکنه، GPT-5 قراره از ویدیو هم پشتیبانی کنه.
- استدلال: استدلال GPT-4o خوب و پایهایه، اما در GPT-5 عمیق و چند مرحلهای خواهد بود.
- حافظه: حافظه GPT-4o کوتاهمدته، اما GPT-5 حافظه بلندمدت و شخصیسازی شده خواهد داشت.
- پنجره زمینه: GPT-4o حدود ۳۲ هزار توکن و GPT-5 حدود ۲۵۶ هزار توکن خواهد داشت.
- کیفیت خروجی: خروجی GPT-5 طبیعیتر، احساسیتر و سازگارتر خواهد بود.
- قابلیتهای تصویر: GPT-4o رندر دو بعدی بهبود یافته داره اما GPT-5 از سه بعدی و ویرایش هدفمند پشتیبانی خواهد کرد.
تاثیر GPT-5 بر کسبوکارها و کاربران
انتظار میره عرضه GPT-5 تاثیر بزرگی روی کسبوکارها و نحوه کار ما بذاره.
جولین گولدی (Julian Goldie) معتقده GPT-5 میتونه کل فرایندهای کسبوکار رو که هفتهها طول میکشه، به صورت خودکار انجام بده. کارهایی مثل تحقیقات بازار، تحلیل رقبا، استراتژی محتوا، خدمات مشتری و پیگیری فروش. به گفته اون، میشه کل استراتژی کسبوکار، دادههای مشتریان و تاریخچه فروش رو به مدل داد تا نتایج فوقالعادهای بگیرین.
خدمات مشتری میتونه از حالت واکنشی به حالت پیشبینیکننده تغییر کنه؛ یعنی مدل میتونه مشکلات رو قبل از وقوع پیشبینی کنه. در تولید محتوا هم میشه در یک مکالمه، محتوای یک ماه رو برای تمام کانالها (بلاگ، شبکههای اجتماعی، ایمیل و غیره) تولید کرد.
GPT-5 میتونه مثل یک سیستمعامل هوش مصنوعی، هوشمندتر از متخصصان سطح دکترا عمل کنه.
کیران فلانگان (Kieran Flanagan)، مدیر ارشد بازاریابی HubSpot
با این حال، یک شکاف پذیرش وجود داره. دادههای گالوپ نشون میده که فقط ۸ درصد از کارمندان دانشی در آمریکا روزانه از هوش مصنوعی استفاده میکنن و ۱۹ درصد چند بار در هفته. دلیلش اینه که پیچیدگی ابزارها و اسمگذاری مدلها باعث میشه بیشتر کاربران از تمام قابلیتهای ChatGPT استفاده نکنن. GPT-5 قصد داره با سادهسازی و یکپارچهسازی رابط کاربری، این مشکل رو حل کنه تا هوش مصنوعی برای همه بصری و قابل استفاده بشه، درست مثل کاری که آیفون با گوشیهای هوشمند کرد.
آمادگی برای دنیای جدید
برای آماده شدن، توصیه شده که کسبوکارها همین الان فرایندهای فعلی خودشون رو مستند کنن، با ابزارهای هوش مصنوعی فعلی کار کنن و به صورت استراتژیک فکر کنن که کدوم فرایندها میتونن با GPT-5 متحول بشن. کسبوکارهایی که از الان خودشون رو آماده کنن، با عرضه GPT-5 میتونن خیلی سریع از بقیه جلو بزنن.
منابع
- GPT-5 will be here any minute — here’s what we’re hoping to see
- OpenAI is launching GPT-5 this summer: one LLM to rule them all
- GPT-5 Is Coming in July 2025 — And Everything Will Change
- Leaks hint at Operator-like tool in ChatGPT ahead of GPT-5 launch
- Lead with AI | ChatGPT-5 Will Change Everything
- GPT-5 to launch this summer, replacing multiple existing models
- GPT-5 Drops Soon — Here’s How to 10X Your Business Before Everyone Else
- OpenAI Unveils GPT-5 with Enhanced Capabilities – Efficiency AI Transformation
- “This Is How Humanity Ends…” – Sam Altman STUNS the World on GPT-5’s Terrifying Power
- OpenAI to Unveil GPT-5: The Next Generation AI Set for Summer Launch
- OpenAI Might Combine Reasoning and Multimodality With GPT-5 AI Model
- GPT-5 Is Almost Here — Everything You Need to Know
دیدگاهتان را بنویسید