میدونید که OpenAI یه مدل هوش مصنوعی به اسم GPT-5 ساخته. حالا اومده یه نسخه ویژه از همین مدل رو فقط و فقط برای کارهای برنامهنویسی بهینه کرده و اسمش رو گذاشته GPT-5-Codex. این مدل یه جورایی مثل یه برنامهنویس حرفهای عمل میکنه که میتونه به صورت مستقل و فعال (یا به قول خودشون «عاملانه» یا Agentic) کارها رو دست بگیره.
این دستیار جدید فقط برای جواب دادن به سوالهای ساده طراحی نشده. آموزش دیده تا کارهای واقعی مهندسی نرمافزار رو انجام بده. کارهایی مثل:
- ساختن کامل یک پروژه از صفر
- اضافه کردن ویژگیها و تستهای جدید به کد
- اشکالزدایی یا همون دیباگ کردن
- انجام تغییرات بزرگ و ساختاری تو کد (که بهش میگن ریفکتورینگ)
- بررسی کدها (Code Review) برای پیدا کردن مشکلات اساسی
یه نکته خیلی جالب در مورد این مدل اینه که زمان فکر کردنش متغیره. یعنی چی؟ یعنی برای کارهای ساده و سریع، مثل اینکه بپرسی «الان تو کدوم پوشه هستیم؟»، خیلی سریع جواب میده. اما برای کارهای پیچیده و سخت، مثل یه ریفکتورینگ بزرگ، خیلی بیشتر وقت میذاره و حسابی روش فکر میکنه. تو تستهایی که خود OpenAI انجام داده، دیده شده که این مدل برای کارهای کوچیک ۹۳.۷ درصد توکن کمتری نسبت به GPT-5 مصرف میکنه، ولی برای کارهای بزرگ دو برابر بیشتر زمان برای فکر کردن، ویرایش و تست کردن کد میذاره. حتی مواردی بوده که GPT-5-Codex بیشتر از ۷ ساعت به طور مستقل روی یک کار بزرگ و پیچیده کار کرده، هی کد رو تغییر داده، تستها رو درست کرده تا بالاخره به نتیجه موفق رسیده.
کجا میتونیم ازش استفاده کنیم؟
خوبی ماجرا اینه که این ابزار تقریبا همهجا در دسترسه. شما میتونید از طریق این راهها ازش استفاده کنید:
- ترمینال (Terminal): با استفاده از چیزی به اسم Codex CLI.
- محیط کدنویسی (IDE): با افزونهای که برای برنامههایی مثل VS Code و Cursor ارائه شده.
- وب: از طریق سایت Codex.
- گیتهاب (GitHub): برای بررسی کدها.
- اپلیکیشن موبایل ChatGPT: حتی روی گوشی هم میتونید ازش استفاده کنید.
نکته مهم اینه که OpenAI میگه این مدل مخصوص محیطهای کدنویسی مثل Codex ساخته شده و بهتره برای کارهای عمومی چت ازش استفاده نشه، چون برای اون کارها بهینه نیست.
دسترسی به شبکه (Network Access)
اوایل که نسخه ابری Codex عرضه شد، به طور کامل دسترسی به شبکه رو بسته بودن تا ریسکها رو کم کنن. اما کاربرها گفتن که این ریسکها رو درک میکنن و دوست دارن خودشون تصمیم بگیرن که عامل چقدر به اینترنت دسترسی داشته باشه. مثلا گاهی لازمه که عامل یه کتابخونه یا بسته نرمافزاری رو نصب یا آپدیت کنه.
برای همین، الان کاربرها میتونن برای هر پروژه مشخص کنن که عامل به چه سایتهایی دسترسی داشته باشه. میتونن یه لیست سایتهای مجاز (allowlist) یا غیرمجاز (denylist) تعریف کنن. البته فعال کردن دسترسی به اینترنت میتونه ریسکهایی مثل تزریق پرامپت، لو رفتن اطلاعات حساس یا استفاده از کدهایی با محدودیت لایسنس رو به همراه داشته باشه. برای همین توصیه میشه که خروجیها با دقت بررسی بشن و دسترسی فقط به دامنههای مورد اعتماد محدود بشه.
ابزارها و قابلیتهای جدید Codex
با معرفی GPT-5-Codex، کل مجموعه ابزارهای Codex هم آپدیت شدن تا بهتر و کارآمدتر بشن.
Codex CLI و افزونه IDE
- رابط خط فرمان (CLI): این ابزار که متنبازه (Open-source)، با توجه به بازخورد جامعه کاربری بازسازی شده. الان میتونید عکس (اسکرینشات، وایرفریم، دیاگرام) رو مستقیم در CLI بهش بدید تا زمینه کار رو بهتر درک کنه. برای کارهای پیچیده، یه لیست کارها (to-do list) داره که پیشرفتش رو دنبال میکنه. رابط کاربریش هم بهتر شده و دنبال کردن کارهای مدل راحتتره.
- حالتهای تایید (Approval Modes): سه سطح دسترسی سادهسازی شده داره:
- فقط خواندنی (Read-only): برای هر کاری از شما اجازه میگیره.
- خودکار (Auto): به کل پروژه دسترسی کامل داره ولی برای دسترسی به خارج از پروژه اجازه میگیره.
- دسترسی کامل (Full access): میتونه هر فایلی رو بخونه و دستورها رو با دسترسی به شبکه اجرا کنه.
- افزونه IDE: این افزونه عامل Codex رو مستقیم به محیط کدنویسی شما مثل VS Code میاره. اینطوری چون به فایلهای باز و کدهای انتخاب شده شما دسترسی داره، با پرامپتهای کوتاهتر به نتایج سریعتری میرسید. همچنین میتونید کارها رو به راحتی بین محیط محلی و ابری جابجا کنید.
Codex در فضای ابری (Cloud) و گیتهاب
- زیرساخت بهتر: با استفاده از کش کردن کانتینرها، زمان انجام کارها تا ۹۰ درصد کاهش پیدا کرده. Codex الان میتونه به طور خودکار محیط خودش رو با اجرای اسکریپتهای راهاندازی آماده کنه و در صورت نیاز با دستورهایی مثل
pip install
بستههای لازم رو نصب کنه. - قابلیتهای بصری: مثل CLI، در نسخه ابری هم میتونید بهش عکس بدید. جالبتر اینکه خودش هم میتونه یه مرورگر باز کنه، به چیزی که ساخته نگاه کنه، تغییرش بده و یه اسکرینشات از نتیجه کارش به شما نشون بده.
- بررسی کد در گیتهاب (Code Review): این یکی از قابلیتهای خیلی مهمه. بر خلاف ابزارهای تحلیل استاتیک، Codex هدف اصلی یک PR (Pull Request) رو با تغییرات کد مقایسه میکنه، کل کدبیس و وابستگیها رو بررسی میکنه و حتی کد و تستها رو اجرا میکنه تا از درست کار کردنش مطمئن بشه.
- وقتی برای یه ریپازیتوری گیتهاب فعالش کنید، به طور خودکار PRها رو بررسی میکنه و تحلیلش رو پست میکنه.
- میتونید با منشن کردن «@codex review» ازش بخواید یه PR رو بررسی کنه و حتی بهش بگید دنبال چی بگرده، مثلا «@codex review for security vulnerabilities» (برای آسیبپذیریهای امنیتی بررسی کن).
در خود OpenAI، الان Codex اکثر PRها رو بررسی میکنه و روزانه صدها مشکل رو پیدا میکنه، حتی قبل از اینکه یه انسان شروع به بررسی کنه.
پرسش و پاسخ
سوال ۱: پس GPT-5-Codex یه نسخه بهتر از GPT-5 معمولیه؟
نه لزوما «بهتر». بهتره بگیم یه نسخه «تخصصی» شده است. مثل این میمونه که یه ماشین اسپرت داشته باشی و یه کامیون. هر دو وسیله نقلیه هستن، اما هر کدوم برای یه کار خاص ساخته شدن. GPT-5 یه مدل همهکاره است، اما GPT-5-Codex به طور ویژه برای کارهای کدنویسی و مهندسی نرمافزار آموزش دیده و بهینه شده. پس در زمینه کدنویسی عملکرد خیلی بهتری داره، ولی برای کارهای دیگه شاید مدل اصلی GPT-5 مناسبتر باشه.
سوال ۲: این که میگید «عاملانه» یا «Agentic» کار میکنه، یعنی چی دقیقا؟
تصور کنید به جای یه ابزار ساده که فقط به دستورهای شما جواب میده، یه همکار برنامهنویس دارید. بهش یه کار بزرگ میدید، مثلا «این ویژگی جدید رو به اپلیکیشن اضافه کن». اون خودش میره کار رو به مراحل کوچیکتر تقسیم میکنه، کد مینویسه، تست میکنه، اگه به مشکلی خورد سعی میکنه حلش کنه و در نهایت نتیجه رو به شما تحویل میده. این یعنی «عاملانه» کار کردن؛ یعنی مثل یه عامل مستقل و هوشمند عمل میکنه.
سوال ۳: آیا امنه که بذارم این ابزار روی کامپیوتر من کد اجرا کنه؟
این سوال خیلی خوبیه. همونطور که توضیح دادم، OpenAI خیلی روی امنیت کار کرده. به طور پیشفرض، Codex چه در نسخه ابری و چه روی کامپیوتر شما، داخل یه محیط ایزوله به اسم «سندباکس» کار میکنه و دسترسی به اینترنت هم نداره. این یعنی نمیتونه به فایلهای مهم سیستم شما آسیب بزنه یا اطلاعاتتون رو جایی بفرسته. شما به عنوان کاربر کنترل کامل دارید و میتونید تصمیم بگیرید که چقدر بهش دسترسی بدید. برای کارهای حساس، همیشه از شما اجازه میگیره. اما در هر صورت، همیشه توصیه میشه که کارهایی که انجام میده رو قبل از نهایی کردن بررسی کنید.
سوال ۴: این قابلیت «زمان تفکر متغیر» چطور کار میکنه و چه فایدهای داره؟
این یکی از ویژگیهای کلیدی این مدله. فکر کنید دارید با یه همکارتون صحبت میکنید. اگه ازش یه سوال ساده بپرسید، مثلا «ساعت چنده؟»، انتظار دارید فورا جواب بده. اما اگه ازش بخواید یه مسئله پیچیده ریاضی رو حل کنه، انتظار دارید روش فکر کنه و زمان بذاره. این مدل هم همینطوره. برای درخواستهای کوچیک و ساده، خیلی سریع و چابک عمل میکنه تا مکالمه روون باشه. اما برای کارهای بزرگ و پیچیده، میدونه که باید زمان بیشتری بذاره، تحقیق کنه، کد رو چند بار بنویسه و تست کنه. این باعث میشه هم کارآمدتر باشه و هم برای کارهای سخت، نتیجه بهتری بده.
سوال ۵: آیا این ابزار قراره جای برنامهنویسها رو بگیره؟
در حال حاضر، این ابزارها بیشتر شبیه به یک دستیار یا همکار خیلی قدرتمند هستن تا یک جایگزین. اونها میتونن کارهای تکراری و زمانبر رو انجام بدن، به شما در پیدا کردن راهحلها کمک کنن و سرعتتون رو خیلی بالا ببرن. همونطور که یه کاربر گفته بود: «با Codex، من کار ریفکتورینگ و نوشتن تست رو بهش سپردم و خودم روی اولویتهای دیگه تمرکز کردم». پس این ابزارها به برنامهنویسها کمک میکنن که روی بخشهای خلاقانهتر و مهمتر کارشون تمرکز کنن. خود OpenAI هم تاکید میکنه که حتی برای بررسی کد، Codex باید به عنوان یک بررسیکننده اضافی در کنار انسان استفاده بشه، نه جایگزین اون.
دیدگاهتان را بنویسید