۲۵ مرداد ۱۴۰۴

مدل DeepSeek R2 در راه است

خلاصه

شرکت چینی DeepSeek می‌خواست مدل جدید هوش مصنوعیش، R2، رو با تراشه‌های هواوی آموزش بده.
اما تراشه‌های هواوی Ascend 910C با مشکلات جدی مثل ناپایداری و نبود نرم‌افزار قوی مثل CUDA روبرو شدن.
این باعث شد DeepSeek بعد از ماه‌ها تلاش بی‌نتیجه، مجبور بشه برگرده سراغ تراشه‌های انویدیا برای آموزش R2.
مقامات چینی اصرار به خودکفایی دارن، اما این ماجرا نشون داد که عقب‌موندگی فنی خیلی جدیه.
DeepSeek R2 بالاخره روی سخت‌افزار انویدیا آموزش دید، اما برای اطمینان از سازگاری با محصولات مشتری‌ها، بخش استنتاج رو روی هواوی نگه داشت.
با وجود تلاش‌های هواوی برای ساخت سرورهای قدرتمند مثل CloudMatrix 384، کارشناس‌ها هنوز از پایداری و نرم‌افزارش راضی نیستن.
این تاخیر، DeepSeek رو از رقبای آمریکایی مثل OpenAI عقب انداخته و بنیان‌گذار DeepSeek از این وضعیت ناراحته.

شرکت هوش مصنوعی چینی DeepSeek که اوایل امسال با مدل R1 خودش کلی سر و صدا کرده بود، قصد داشت با مدل جدیدش یعنی R2 دوباره بترکونه. اما یه اتفاقی افتاد که همه برنامه‌ها رو به هم ریخت. قضیه از این قراره که این شرکت، احتمالا با تشویق مقامات چینی، تصمیم گرفت برای آموزش مدل جدیدش از تراشه‌های هواوی استفاده کنه، اما این تصمیم نتیجه خوبی نداشت و باعث شد عرضه مدل R2 با تاخیر مواجه بشه. آخر سر هم مجبور شدن دوباره برگردن سراغ همون تراشه‌های انویدیا که حداقل کارشون رو راه مینداخت.

تراشه هواوی Ascend 910C: جاه‌طلب اما پر از محدودیت

همه چیز روی کاغذ خوب به نظر می‌رسید. تراشه Ascend 910C هواوی به عنوان جوابی برای تراشه H100 انویدیا، یه جورایی نماد امید برای خودکفایی چین بود. اما نیت خوب به تنهایی برای کار کردن تکنولوژی کافی نیست. مشکلات از همون اول با کلاسترهای محاسباتی ناپایدار و اتصالات داخلی خراب شروع شد. اما مشکل اصلی و بزرگ‌تر یه چیز دیگه‌ است: نبود یه محیط نرم‌افزاری قوی و بالغ مثل CUDA.

کودا (CUDA) در واقع شمشیر داموکلس یا نقطه ضعف اصلی ماجرای خودکفایی هوش مصنوعی چینه. هیچ جایگزین واقعی و درست و حسابی براش وجود نداره، نه از طرف هواوی و نه از طرف شرکت‌های دیگه‌ای مثل Cambricon یا Biren. دقیقا به همین دلیله که DeepSeek بعد از هدر دادن چند ماه وقت و منابع روی یه سیستم «اول چین»، آخرش مجبور شد دوباره به انویدیا رو بیاره.

دوراهی پکن: اراده سیاسی در مقابل واقعیت فنی

دولت چین به دلایل ژئوپلیتیکی، امنیتی و تبلیغاتی، خیلی جدی دنبال اینه که شرکت‌های داخلی رو از تکنولوژی غربی مستقل کنه. اما ماجرای DeepSeek خیلی بی‌رحمانه نشون داد که عقب‌موندگی فنی خیلی جدیه. با وجود سرمایه‌گذاری‌های میلیارد دلاری، شرکت‌های چینی هنوز به رهبر بازار یعنی انویدیا وابسته‌اند. جالب اینجاست که در حالی که پکن هشدار میده ممکنه تراشه‌های انویدیا «بک‌دور» یا مکانیزم‌های ردیابی مبتنی بر GPS داشته باشن (اتهامی که هنوز در حال بررسیه)، شرکت‌هایی مثل DeepSeek مجبورن دقیقا از همین تراشه‌ها استفاده کنن تا بتونن توی رقابت جهانی هوش مصنوعی باقی بمونن. چون هواوی خیلی کنده، خیلی مستعد خطاست و مهم‌تر از همه، سازگاری لازم رو نداره.

بازگشت به انویدیا؛ یک مصالحه اجباری

بعد از اینکه DeepSeek با مدل R1 که روی سخت‌افزار انویدیا آموزش دیده بود به موفقیت رسید، مقامات چینی این شرکت رو تشویق کردن که برای مدل بعدی سراغ پلتفرم‌های Ascend هواوی بره. DeepSeek هم همین کار رو کرد اما سریعا با یه سری مشکلات اساسی روبرو شد:

عملکرد ناپایدار
اتصال کندتر بین تراشه‌ها
محدودیت‌های کیت نرم‌افزاری هواوی به نام CANN

این مشکلات باعث شد DeepSeek به یه راه حل ترکیبی برسه: برای آموزش مدل R2 دوباره به شتاب‌دهنده‌های هوش مصنوعی انویدیا برگشت، اما سخت‌افزار هواوی رو برای بخش «استنتاج» (inference) نگه داشت. آموزش هوش مصنوعی کار خیلی سنگینیه که مدل با استفاده از دیتاست‌های بزرگ یاد میگیره، اما استنتاج یعنی استفاده از اون مدلِ آموزش‌دیده برای کارهای واقعی مثل چت‌بات‌ها. این رویکرد ترکیبی از روی اجبار بود نه انتخاب. اما با توجه به کمبود پردازنده‌های انویدیا در چین، منطقی هم به نظر میرسه که مطمئن بشن مدل جدیدشون روی سخت‌افزار هواوی هم کار میکنه، چون خیلی از مشتری‌های DeepSeek قراره از R2 روی همین پلتفرم‌ها استفاده کنن.

گفته میشه هواوی یه تیم ویژه از مهندس‌هاش رو به دیتاسنترهای DeepSeek فرستاد تا مشکلات آموزش رو حل کنن، اما با وجود حضور اونها، این شرکت هیچوقت نتونست یه دور آموزش کامل و موفق روی پلتفرم Ascend داشته باشه.

اعداد و ارقام چه میگن؟

برای اینکه بزرگی ماجرا دستمون بیاد، خوبه بدونیم که مدل قبلی یعنی R1 روی یک کلاستر متشکل از ۵۰ هزار GPU از سری Hopper انویدیا آموزش دیده بود. این مجموعه شامل ۳۰ هزار واحد HGX H20، ۱۰ هزار واحد H800 و ۱۰ هزار واحد H100 بود که از طریق سرمایه‌گذارشون یعنی High-Flyer Capital Management تامین شده بود. طبیعتا مدل R2 به یک کلاستر خیلی قوی‌تر نیاز داره.

از طرف دیگه، هواوی هم بیکار ننشسته و ماه گذشته پیشرفته‌ترین سرور هوش مصنوعی خودش یعنی CloudMatrix 384 رو معرفی کرد که با ۳۸۴ پردازنده Ascend 910C کار میکنه و به عنوان رقیبی برای سیستم GB200 NVL72 انویدیا معرفی شد. هواوی ادعا کرد که این سیستم از نظر عملکرد پتافلاپس، حافظه بیشتر و پهنای باند بالاتر از سرور انویدیا بهتره، هرچند که «انرژی خیلی بیشتری» هم مصرف میکنه.

نگاه کارشناسان و آینده نامعلوم

با اینکه بعضی تحلیلگرای غربی سیستم CloudMatrix 384 هواوی رو تحسین کردن، بقیه معتقدن که تراشه‌های Ascend هنوز با مشکلات پایداری و اتصال کندتر نسبت به محصولات انویدیا دست و پنجه نرم میکنن. ریتویک گوپتا (Ritwik Gupta)، یه محقق هوش مصنوعی در دانشگاه کالیفرنیا، برکلی، معتقده که نرم‌افزار ارائه شده با تراشه‌های هواوی ضعیف‌تر از انویدیاست. اون میگه به نظر میرسه هواوی در حال تجربه «دردهای رشد» برای استفاده از Ascend در آموزش هوش مصنوعیه، اما انتظار داره این شرکت در نهایت چالش‌هاش رو حل کنه. به گفته اون، «فقط چون امروز مدل‌های پیشرو رو نمی‌بینیم که روی هواوی آموزش دیده باشن، به این معنی نیست که در آینده هم اتفاق نمیفته. این یه مسئله زمانه.»

این تاخیر باعث شده DeepSeek از رقبای آمریکاییش مثل OpenAI، Anthropic و Meta عقب بیفته. بنیان‌گذار DeepSeek، لیانگ ونفنگ (Liang Wenfeng)، به کارمندهاش گفته که از پیشرفت R2 ناامیده و میخواد زمان بیشتری رو برای بهبود مدل صرف کنه تا بتونه رقبای آمریکاییش رو کنار بزنه. با این حال، گزارش‌های رسانه‌های چینی میگن که ممکنه مدل R2 بالاخره در هفته‌های آینده عرضه بشه.

منابع

[۲] DeepSeek R2: The Chinese AI dream fails due to its own ambitions – Huawei out, NVIDIA in | igor´sLAB
[۴] DeepSeek’s R2 AI Model Is Reportedly Delayed After Chinese Authorities Encouraged the Firm to Use Huawei’s AI Chips; Beijing Is Still in Need of NVIDIA’s Alternatives

[۱] Client Challenge
[۳] DeepSeek reportedly urged by Chinese authorities to train new model on Huawei hardware — after multiple failures, R2 training to switch back to Nvidia hardware while Ascend GPUs handle inference | Tom’s Hardware
[۵] DeepSeek R2 model release reportedly held back by faulty Huawei chips – SiliconANGLE

چین دیپ‌سیک