۱۰ مرداد ۱۴۰۴

گوگل Gemini 2.5 Deep Think را معرفی کرد، تفکر بیشتر برای پاسخ‌های بهتر

گوگل دیپ‌مایند (Google DeepMind) میگه که جمینای ۲.۵ دیپ تینک، پیشرفته‌ترین مدل هوش مصنوعی این شرکت برای استدلال کردنه. این مدل میتونه با بررسی و در نظر گرفتن چندین ایده به صورت همزمان، به سوالات جواب بده و در نهایت بهترین پاسخ رو انتخاب کنه.

به زبان ساده‌تر، این مدل اولین مدل «چندعاملی» (multi-agent) گوگل هست که به صورت عمومی عرضه شده. این یعنی سیستم به جای اینکه فقط با یک عامل هوش مصنوعی به یک سوال فکر کنه، چندین عامل رو به صورت موازی برای حل یک مسئله به کار میگیره. این فرایند اگرچه به قدرت محاسباتی خیلی بیشتری نیاز داره، اما معمولا به جواب‌های بهتری میرسه.

مدیرعامل دیپ‌مایند، دمیس حسابیس، گفته که این مدل بر اساس «جدیدترین تحقیقات پیشرفته» ساخته شده و بهش این توانایی رو میده که قبل از انتخاب جواب نهایی، چندین ایده رو همزمان بسنجه. گوگل میگه این مدل میتونه به افراد برای حل مشکلاتی که به خلاقیت، برنامه ریزی استراتژیک و بهبود مرحله به مرحله نیاز دارن، کمک کنه.

عملکرد و نتایج در بنچمارک‌ها

مدلی که Deep Think بر اساس اون ساخته شده، در المپیاد جهانی ریاضی (IMO) امسال به سطح مدال طلا رسیده بود. البته اون مدل اصلی برای حل مسائل پیچیده ریاضی به چندین ساعت زمان نیاز داشت، اما نسخه‌ای که الان برای استفاده روزمره بهینه شده، در تست‌های داخلی تونسته در بنچمارک‌های المپیاد ریاضی ۲۰۲۵ به سطح برنز برسه.

در کنار عرضه عمومی دیپ تینک، گوگل گفته که داره همون مدلی که در المپیاد ریاضی استفاده کرده بود رو در اختیار گروهی از ریاضی‌دان‌ها و دانشگاهی‌ها قرار میده. این مدل به جای چند ثانیه یا دقیقه، «ساعت‌ها» برای استدلال زمان نیاز داره. هدف گوگل اینه که از این مدل برای پیشرفت تحقیقات استفاده بشه و بازخورد بگیره تا سیستم چندعاملی رو برای کاربردهای آکادمیک بهتر کنه.

گوگل ادعا میکنه که مدل Deep Think در تست‌ها و بنچمارک‌های مختلف، رکوردهای جدیدی ثبت کرده:

Humanity’s Last Exam (HLE): در این آزمون سخت که توانایی هوش مصنوعی رو در جواب دادن به هزاران سوال در زمینه‌های ریاضی، علوم انسانی و علوم میسنجه، مدل گوگل بدون ابزار به امتیاز ۳۴.۸ درصد رسیده. در مقایسه، مدل Grok 4 از شرکت xAI امتیاز ۲۵.۴ درصد و مدل o3 از شرکت OpenAI امتیاز ۲۰.۳ درصد رو کسب کرده.
LiveCodeBench V6: در این آزمون که مربوط به وظایف پیچیده کدنویسی رقابتی هست، مدل گوگل امتیاز ۸۷.۶ درصد رو به دست آورده. در حالی که امتیاز Grok 4 برابر با ۷۹ درصد و امتیاز o3 از OpenAI برابر با ۷۲ درصد بوده.
MMMU: در این تست استدلال چندوجهی، دیپ تینک به امتیاز ۸۴ درصد رسیده.
المپیاد ریاضی ۲۰۲۵ آمریکا: این مدل در این آزمون هم عملکرد قابل توجهی داشته، هرچند گوگل امتیاز دقیق اون رو اعلام نکرده.

گوگل همچنین میگه که این مدل میتونه پاسخ‌های «خیلی طولانی‌تری» نسبت به مدل‌های هوش مصنوعی سنتی تولید کنه و در تست‌ها، برای کارهای مربوط به توسعه وب، خروجی‌های دقیق‌تر و از نظر زیبایی‌شناختی بهتری نسبت به مدل‌های دیگه داشته.

چطور میشه از Deep Think استفاده کرد؟

این قابلیت از همین الان برای مشترکین Google AI Ultra فعاله. کاربرها میتونن با یک کلید در نوار ورودی اپلیکیشن جمینای، وقتی مدل روی Gemini 2.5 Pro تنظیم شده باشه، اون رو فعال کنن.

گوگل قصد داره در هفته‌های آینده، Deep Think رو از طریق Gemini API در اختیار گروهی از تسترها هم قرار بده تا بفهمه توسعه‌دهنده‌ها و شرکت‌ها چطور میتونن از این سیستم چندعاملی استفاده کنن.

هزینه و برنامه‌های اشتراک

Google AI Ultra: هزینه این اشتراک ماهانه ۲۵۰ دلار هست. این طرح علاوه بر دیپ تینک، شامل دسترسی زودهنگام به مدل‌های ویدیویی آزمایشی، محدودیت‌های بالاتر در ابزارهایی مثل NotebookLM، یک مدیر عامل هوش مصنوعی اولیه و ۳۰ ترابایت فضای ذخیره سازی میشه.
Google AI Pro: برنامه ارزان‌تر که قبلا AI Premium نام داشت، حالا به این اسم تغییر کرده و هزینه اون سالانه ۲۰ دلار هست.

به نظر میرسه که آزمایشگاه‌های پیشرو هوش مصنوعی دارن به سمت رویکرد چندعاملی حرکت میکنن. شرکت xAI ایلان ماسک به تازگی سیستم چندعاملی Grok 4 Heavy رو منتشر کرده. محققان OpenAI هم گفته بودن مدلی که برای کسب مدال طلا در المپیاد ریاضی استفاده کردن یک سیستم چندعاملی بوده. شرکت Anthropic هم از یک سیستم مشابه برای تولید گزارش‌های تحقیقاتی دقیق استفاده میکنه. با توجه به هزینه‌های بالای این سیستم‌ها، شرکت‌ها ممکنه اونها رو فقط در گرون‌ترین طرح‌های اشتراکی خودشون ارائه بدن.

منابع

[۱] Google bringt Deep Think in die Gemini-App
[۲] Apple’s official account posts Galaxy Z Flip 7 promo video in slip-up
[۳] Google rolls out Gemini Deep Think AI, a reasoning model that tests multiple ideas in parallel | TechCrunch
[۴] Gemini 2.5 Deep Think is finally heading to Google AI Ultra users | Android Central

گوگل مدل‌های هوش‌مصنوعی

گوگل Gemini 2.5 Deep Think را معرفی کرد، تفکر بیشتر برای پاسخ‌های بهتر

عملکرد و نتایج در بنچمارک‌ها

چطور میشه از Deep Think استفاده کرد؟

هزینه و برنامه‌های اشتراک

منابع

دیدگاه‌ها

دیدگاهتان را بنویسید لغو پاسخ