خلاصه
- شرکت چینی DeepSeek میخواست مدل جدید هوش مصنوعیش، R2، رو با تراشههای هواوی آموزش بده.
- اما تراشههای هواوی Ascend 910C با مشکلات جدی مثل ناپایداری و نبود نرمافزار قوی مثل CUDA روبرو شدن.
- این باعث شد DeepSeek بعد از ماهها تلاش بینتیجه، مجبور بشه برگرده سراغ تراشههای انویدیا برای آموزش R2.
- مقامات چینی اصرار به خودکفایی دارن، اما این ماجرا نشون داد که عقبموندگی فنی خیلی جدیه.
- DeepSeek R2 بالاخره روی سختافزار انویدیا آموزش دید، اما برای اطمینان از سازگاری با محصولات مشتریها، بخش استنتاج رو روی هواوی نگه داشت.
- با وجود تلاشهای هواوی برای ساخت سرورهای قدرتمند مثل CloudMatrix 384، کارشناسها هنوز از پایداری و نرمافزارش راضی نیستن.
- این تاخیر، DeepSeek رو از رقبای آمریکایی مثل OpenAI عقب انداخته و بنیانگذار DeepSeek از این وضعیت ناراحته.
شرکت هوش مصنوعی چینی DeepSeek که اوایل امسال با مدل R1 خودش کلی سر و صدا کرده بود، قصد داشت با مدل جدیدش یعنی R2 دوباره بترکونه. اما یه اتفاقی افتاد که همه برنامهها رو به هم ریخت. قضیه از این قراره که این شرکت، احتمالا با تشویق مقامات چینی، تصمیم گرفت برای آموزش مدل جدیدش از تراشههای هواوی استفاده کنه، اما این تصمیم نتیجه خوبی نداشت و باعث شد عرضه مدل R2 با تاخیر مواجه بشه. آخر سر هم مجبور شدن دوباره برگردن سراغ همون تراشههای انویدیا که حداقل کارشون رو راه مینداخت.
تراشه هواوی Ascend 910C: جاهطلب اما پر از محدودیت
همه چیز روی کاغذ خوب به نظر میرسید. تراشه Ascend 910C هواوی به عنوان جوابی برای تراشه H100 انویدیا، یه جورایی نماد امید برای خودکفایی چین بود. اما نیت خوب به تنهایی برای کار کردن تکنولوژی کافی نیست. مشکلات از همون اول با کلاسترهای محاسباتی ناپایدار و اتصالات داخلی خراب شروع شد. اما مشکل اصلی و بزرگتر یه چیز دیگه است: نبود یه محیط نرمافزاری قوی و بالغ مثل CUDA.
کودا (CUDA) در واقع شمشیر داموکلس یا نقطه ضعف اصلی ماجرای خودکفایی هوش مصنوعی چینه. هیچ جایگزین واقعی و درست و حسابی براش وجود نداره، نه از طرف هواوی و نه از طرف شرکتهای دیگهای مثل Cambricon یا Biren. دقیقا به همین دلیله که DeepSeek بعد از هدر دادن چند ماه وقت و منابع روی یه سیستم «اول چین»، آخرش مجبور شد دوباره به انویدیا رو بیاره.
دوراهی پکن: اراده سیاسی در مقابل واقعیت فنی
دولت چین به دلایل ژئوپلیتیکی، امنیتی و تبلیغاتی، خیلی جدی دنبال اینه که شرکتهای داخلی رو از تکنولوژی غربی مستقل کنه. اما ماجرای DeepSeek خیلی بیرحمانه نشون داد که عقبموندگی فنی خیلی جدیه. با وجود سرمایهگذاریهای میلیارد دلاری، شرکتهای چینی هنوز به رهبر بازار یعنی انویدیا وابستهاند. جالب اینجاست که در حالی که پکن هشدار میده ممکنه تراشههای انویدیا «بکدور» یا مکانیزمهای ردیابی مبتنی بر GPS داشته باشن (اتهامی که هنوز در حال بررسیه)، شرکتهایی مثل DeepSeek مجبورن دقیقا از همین تراشهها استفاده کنن تا بتونن توی رقابت جهانی هوش مصنوعی باقی بمونن. چون هواوی خیلی کنده، خیلی مستعد خطاست و مهمتر از همه، سازگاری لازم رو نداره.
بازگشت به انویدیا؛ یک مصالحه اجباری
بعد از اینکه DeepSeek با مدل R1 که روی سختافزار انویدیا آموزش دیده بود به موفقیت رسید، مقامات چینی این شرکت رو تشویق کردن که برای مدل بعدی سراغ پلتفرمهای Ascend هواوی بره. DeepSeek هم همین کار رو کرد اما سریعا با یه سری مشکلات اساسی روبرو شد:
- عملکرد ناپایدار
- اتصال کندتر بین تراشهها
- محدودیتهای کیت نرمافزاری هواوی به نام CANN
این مشکلات باعث شد DeepSeek به یه راه حل ترکیبی برسه: برای آموزش مدل R2 دوباره به شتابدهندههای هوش مصنوعی انویدیا برگشت، اما سختافزار هواوی رو برای بخش «استنتاج» (inference) نگه داشت. آموزش هوش مصنوعی کار خیلی سنگینیه که مدل با استفاده از دیتاستهای بزرگ یاد میگیره، اما استنتاج یعنی استفاده از اون مدلِ آموزشدیده برای کارهای واقعی مثل چتباتها. این رویکرد ترکیبی از روی اجبار بود نه انتخاب. اما با توجه به کمبود پردازندههای انویدیا در چین، منطقی هم به نظر میرسه که مطمئن بشن مدل جدیدشون روی سختافزار هواوی هم کار میکنه، چون خیلی از مشتریهای DeepSeek قراره از R2 روی همین پلتفرمها استفاده کنن.
گفته میشه هواوی یه تیم ویژه از مهندسهاش رو به دیتاسنترهای DeepSeek فرستاد تا مشکلات آموزش رو حل کنن، اما با وجود حضور اونها، این شرکت هیچوقت نتونست یه دور آموزش کامل و موفق روی پلتفرم Ascend داشته باشه.
اعداد و ارقام چه میگن؟
برای اینکه بزرگی ماجرا دستمون بیاد، خوبه بدونیم که مدل قبلی یعنی R1 روی یک کلاستر متشکل از ۵۰ هزار GPU از سری Hopper انویدیا آموزش دیده بود. این مجموعه شامل ۳۰ هزار واحد HGX H20، ۱۰ هزار واحد H800 و ۱۰ هزار واحد H100 بود که از طریق سرمایهگذارشون یعنی High-Flyer Capital Management تامین شده بود. طبیعتا مدل R2 به یک کلاستر خیلی قویتر نیاز داره.
از طرف دیگه، هواوی هم بیکار ننشسته و ماه گذشته پیشرفتهترین سرور هوش مصنوعی خودش یعنی CloudMatrix 384 رو معرفی کرد که با ۳۸۴ پردازنده Ascend 910C کار میکنه و به عنوان رقیبی برای سیستم GB200 NVL72 انویدیا معرفی شد. هواوی ادعا کرد که این سیستم از نظر عملکرد پتافلاپس، حافظه بیشتر و پهنای باند بالاتر از سرور انویدیا بهتره، هرچند که «انرژی خیلی بیشتری» هم مصرف میکنه.
نگاه کارشناسان و آینده نامعلوم
با اینکه بعضی تحلیلگرای غربی سیستم CloudMatrix 384 هواوی رو تحسین کردن، بقیه معتقدن که تراشههای Ascend هنوز با مشکلات پایداری و اتصال کندتر نسبت به محصولات انویدیا دست و پنجه نرم میکنن. ریتویک گوپتا (Ritwik Gupta)، یه محقق هوش مصنوعی در دانشگاه کالیفرنیا، برکلی، معتقده که نرمافزار ارائه شده با تراشههای هواوی ضعیفتر از انویدیاست. اون میگه به نظر میرسه هواوی در حال تجربه «دردهای رشد» برای استفاده از Ascend در آموزش هوش مصنوعیه، اما انتظار داره این شرکت در نهایت چالشهاش رو حل کنه. به گفته اون، «فقط چون امروز مدلهای پیشرو رو نمیبینیم که روی هواوی آموزش دیده باشن، به این معنی نیست که در آینده هم اتفاق نمیفته. این یه مسئله زمانه.»
این تاخیر باعث شده DeepSeek از رقبای آمریکاییش مثل OpenAI، Anthropic و Meta عقب بیفته. بنیانگذار DeepSeek، لیانگ ونفنگ (Liang Wenfeng)، به کارمندهاش گفته که از پیشرفت R2 ناامیده و میخواد زمان بیشتری رو برای بهبود مدل صرف کنه تا بتونه رقبای آمریکاییش رو کنار بزنه. با این حال، گزارشهای رسانههای چینی میگن که ممکنه مدل R2 بالاخره در هفتههای آینده عرضه بشه.
منابع
- [۱] Client Challenge
- [۳] DeepSeek reportedly urged by Chinese authorities to train new model on Huawei hardware — after multiple failures, R2 training to switch back to Nvidia hardware while Ascend GPUs handle inference | Tom’s Hardware
- [۵] DeepSeek R2 model release reportedly held back by faulty Huawei chips – SiliconANGLE
دیدگاهتان را بنویسید