۱۴ مرداد ۱۴۰۴

خبرهایی از کلاد ۴.۱، مدل جدید از آنتروپیک در راه است؟

مثل اینکه شرکت آنتروپیک بی سر و صدا در حال کار روی مدل جدیدی به اسم کلاد اوپس ۴.۱ (Claude Opus 4.1) هست. ماجرا از جایی شروع شد که تصاویری از محیط داخلی این شرکت در شبکه‌های اجتماعی دست به دست شد که نشون میداد مدل جدیدی در حال تست شدنه. یه کاربر در شبکه اجتماعی اکس (توییتر سابق) با شناسه legit_api@ هم اسکرین‌شاتی منتشر کرده که به این مدل توی فایل‌های کد داخلی کلاد اشاره داره.

توی این اطلاعات فاش شده، یه شعار هم برای مدل جدید دیده میشه که میگه: «اوپس ۴.۱ اینجاست – آخرین مدل ما رو برای قدرت حل مسئله بیشتر امتحان کنید». این جمله خیلی واضح نشون میده که تمرکز اصلی این مدل جدید روی بهبود توانایی حل مسئله‌های پیچیده و قدرت استدلال گذاشته شده.

اسم رمز «پلنگ» و جزئیات فنی

یه نکته جالب دیگه، اسم رمز داخلی این مدله: «claude-leopard-v2-02-prod». هر بخش از این اسم یه معنی داره:

leopard (پلنگ): این اسم احتمالا به سرعت بالا در پاسخگویی و توانایی تحلیل دقیق‌تر مدل اشاره داره. پلنگ‌ها به خاطر چابکی و دقتشون شناخته میشن و شاید آنتروپیک هم همین انتظار رو از مدل جدیدش داره.
v2-02: این قسمت نشون میده که این نسخه، دومین تکرار بزرگ از این ورژن به حساب میاد و چندین دور بهینه‌سازی داخلی رو پشت سر گذاشته.
prod: این پسوند هم یعنی مدل در محیط «پروداکشن» یا همون محیط اصلی داره تست میشه. این یعنی چی؟ یعنی مدل مراحل آزمایشی اولیه رو رد کرده و احتمالا به انتشار رسمی خیلی نزدیکه.

علاوه بر اینها، توی کدها به دو تا دکمه با متن‌های «button_text-try» و «button_text-upgrade» هم اشاره شده که میتونه به این معنی باشه که شرکت قصد داره این مدل رو برای تست در اختیار کاربرهای اولیه قرار بده.

چرا آنتروپیک روی قدرت حل مسئله تمرکز کرده؟

این حرکت آنتروپیک با روندهای اخیر صنعت هوش مصنوعی کاملا هماهنگه. بعد از اینکه مدل‌هایی مثل GPT-o1 و DeepSeek-R1 با تمرکز روی استنتاج و استدلال عرضه شدن، شرکت‌های بزرگ دیگه هم دارن روی تقویت استدلال منطقی و حل مسئله‌های پیچیده مدل‌هاشون کار میکنن.

آنتروپیک هم برای اینکه توی این بازار رقابتی عقب نمونه، تصمیم گرفته مدل جدیدی با این قابلیت‌ها عرضه کنه. این موضوع به خصوص وقتی مهم میشه که رقبایی مثل OpenAI با مدل‌های سری o و بقیه شرکت‌ها مدام در حال انتشار نسخه‌های پیشرفته‌تر هستن.

این تمرکز روی حل مسئله، یه جورایی ادامه مسیر قبلی آنتروپیک هم هست. مدل قبلی این شرکت، یعنی کلاد ۴.۰ که شامل اوپس ۴ و سونت ۴ بود، به خاطر توانایی‌های خوبش در کدنویسی معروف شد. اوپس ۴ تونست توی بنچمارک SWE-bench امتیاز ۷۲.۵ درصد رو به دست بیاره. این بنچمارک یه معیار خیلی سنگین برای سنجش توانایی مدل‌ها در حوزه مهندسی نرم‌افزار در دنیای واقعیه. ابزاری به اسم Cursor هم مدل اوپس ۴ رو برای کدنویسی «پیشرفته‌ترین» توصیف کرده بود.

یکی از ویژگی‌های جدیدی که توی مدل سونت ۴ معرفی شد، «خلاصه‌های فکری» بود. توی این ویژگی، یه مدل کوچیک‌تر برای خلاصه کردن زنجیره استدلال‌های طولانی استفاده میشه. یه حالت مخصوص توسعه‌دهنده‌ها یا Developer Mode هم وجود داره که زنجیره فکری خام مدل رو برای کاربرای حرفه‌ای نشون میده.

رقابت در بازار و آینده پیش رو

اطلاعات تست داخلی کلاد اوپس ۴.۱ دقیقا زمانی به بیرون درز کرده که رقابت بر سر توانایی استنتاج مدل‌های هوش مصنوعی خیلی شدید شده.

سری مدل‌های GPT-o1 شرکت OpenAI عملکرد خیلی خوبی توی کارهای استنتاجی نشون دادن.
مدل R1 از شرکت DeepSeek در جامعه متن‌باز به محبوبیت زیادی رسیده.
گوگل هم مدام در حال بهینه‌سازی قابلیت‌های استنتاجی مدل جمینای ۲.۰ هست.

در چنین فضایی، آنتروپیک باید مطمئن بشه که سری مدل‌های کلاد از رقبا عقب نمونن. با اینکه مدل کلاد همیشه به خاطر کیفیت بالای گفتگو و امنیتش شناخته شده، ولی در زمینه حل مسئله‌های پیچیده هنوز جای پیشرفت داره.

به نظر میرسه روند کلی صنعت هم از مدل‌های گفتگوی عمومی به سمت مدل‌های با قابلیت‌های تخصصی در حال حرکته. تقویت توانایی استدلال به یه نقطه تمرکز کلیدی برای همه شرکت‌ها تبدیل شده و این فقط به ریاضی و منطق محدود نمیشه، بلکه حوزه‌هایی مثل تولید کد، تحقیقات علمی و تحلیل‌های پیچیده رو هم شامل میشه. این تغییر رو میشه یه جور جهش از «توانایی گفتگو» به «توانایی تفکر» دونست.

تاریخ انتشار و تاثیری که روی کاربرها میذاره

با توجه به اینکه اسکرین‌شات‌ها از محیط تست داخلی لو رفته و از پسوند «prod» استفاده شده، به احتمال زیاد کلاد اوپس ۴.۱ به تاریخ انتشار رسمی نزدیکه. معمولا شرکت‌های هوش مصنوعی چند هفته تا چند ماه بعد از تموم شدن تست‌های داخلی، مدل جدیدشون رو به صورت رسمی منتشر میکنن.

برای کاربرهایی که الان از کلاد استفاده میکنن، افزایش قدرت استدلال در اوپس ۴.۱ میتونه کارایی این ابزار رو توی کارهای تخصصی خیلی بالا ببره. فرقی نمیکنه کار شما تحلیل‌های پیچیده باشه، دیباگ کردن کد باشه یا تحقیقات دانشگاهی، یه ابزار با قدرت حل مسئله بالاتر، کلاد رو به یه دستیار هوش مصنوعی ارزشمندتر تبدیل میکنه.

هرچند که آنتروپیک هنوز به صورت رسمی این اطلاعات رو تایید نکرده، اما معمولا وقتی جزئیات اینطوری به بیرون درز میکنه، یعنی باید منتظر یه خبر رسمی در آینده نزدیک باشیم.

منابع

[۱] Looks like Claude 4.1 Opus is also coming soon : r/singularity
[۲] Anthropic is suspected to have started internal testing of Claude Opus 4.1: The codename ‘leopard’ suggests a significant upgrade in reasoning capabilities
[۳] Anthropic spotted testing Claude Opus 4.1 – EONMSK News

آنتروپیک