انویدیا از پلتفرم هوش مصنوعی Rubin رونمایی کرد: هیولای جدید با قدرت ۵ برابر بیشتر از Blackwell

- دسته بندی : هوش مصنوعی
- بازدید : 4 بار
- 0 دیدگاه
شرکت انویدیا امروز در اقدامی غافلگیرکننده و پیش از رویداد GTC، بهطور رسمی از پلتفرم انقلابی هوش مصنوعی خود با نام Rubin پردهبرداری کرد. این پلتفرم که قرار است قلب تپنده دیتاسنترهای نسل آینده باشد، با وعده جهش عملکرد ۵ برابری نسبتبه معماری بلکول (Blackwell) معرفی شده است. باتوجهبه هیاهوی هوش مصنوعی در نمایشگاه CES، انویدیا تصمیم گرفت تا زودتر از موعد، جدیدترین دستاورد خود را که شامل ۶ تراشه پیشرفته است، بهنمایش بگذارد.
خلاصه در یک نگاه
🔹معرفی پلتفرم روبین با ۶ تراشه مجزا شامل پردازنده گرافیکی Rubin و پردازنده مرکزی Vera.
🔹بهرهگیری از حافظههای نسل جدید HBM4 و پهنای باند خیرهکننده ۲۲ ترابایتبرثانیه.
🔹افزایش ۵ برابری قدرت استنتاج و ۳.۵ برابری قدرت آموزش هوش مصنوعی نسبتبه نسل قبل.
🔹استفاده از ۸۸ هسته سفارشی Olympus در پردازنده مرکزی با معماری آرم.
🔹تولید انبوه آغاز شده و اولین تراشهها اواخر امسال به دست مشتریان میرسد.

پلتفرم هوش مصنوعی انویدیا Rubin
پلتفرم هوش مصنوعی Rubin انویدیا از چه اجزایی تشکیل شده است؟
طبق اعلام انویدیا، پلتفرم Rubin مجموعهای از ۶ تراشه مختلف است که همگی مراحل تولید را پشتسر گذاشته و اکنون در آزمایشگاههای این شرکت درحال تست هستند. این اکوسیستم سختافزاری قدرتمند در سیستمهای DGX ،HGX و MGX بهکار گرفته خواهد شد. قلب تپنده هر دیتاسنتر، سوپرتراشه Vera Rubin خواهد بود که ترکیبی از دو پردازنده گرافیکی Rubin و یک پردازنده مرکزی Vera است.
لیست ۶ تراشه کلیدی این پلتفرم عبارتاند از:
پردازنده گرافیکی Rubin (با ۳۳۶ میلیارد ترانزیستور)
پردازنده مرکزی Vera (با ۲۲۷ میلیارد ترانزیستور)
سوئیچ NVLink 6 برای اتصال داخلی
تراشههای شبکه CX9 و BF4
Spectrum-X 102.4T CPO برای فوتونیک سیلیکونی



مشخصات فنی تراشه گرافیکی Rubin و پردازنده Vera چیست؟
تراشه گرافیکی Rubin که بهطور خاص برای بارهای کاری سنگین هوش مصنوعی طراحی شده، دارای ۳۳۶ میلیارد ترانزیستور است. این چیپست از حافظه HBM4 بهره میبرد که پهنای باندی معادل ۲۲ ترابایتبرثانیه (۲.۸ برابر بیشتر از بلکول) را ارائه میدهد. درمقابل، پردازنده مرکزی Vera با معماری سفارشی Arm و اسم رمز Olympus طراحی شده است که دارای ۸۸ هسته و ۱۷۶ رشته پردازشی میباشد.
در جدول زیر جزئیات عملکردی این تراشهها را مشاهده میکنید:
قدرت استنتاج (Inference)
۵۰ پتافلاپس (NVFP4) – ۵ برابر بلکول
قدرت آموزش (Training)
۳۵ پتافلاپس (NVFP4) – ۳.۵ برابر بلکول
پهنای باند حافظه
۲۲ ترابایت بر ثانیه (HBM4)
مشخصات پردازنده Vera
۸۸ هسته Olympus، حافظه سیستم ۱.۵ ترابایت
پهنای باند اتصال NVLink
۳.۶ ترابایت بر ثانیه (۲ برابر نسل قبل)
تحول در زیرساخت شبکه با سوئیچهای NVLink 6 و کارتهای ConnectX-9
بخش شبکه در پلتفرم Rubin با استفاده از سوئیچهای نسل ششم NVLink متحول شده است. این سوئیچها پهنای باند ۳.۶ ترابایتبرثانیه را برای هر پردازنده فراهم میکنند و مجموع پهنای باند را به ۲۸.۸ ترابایتبرثانیه میرسانند. همچنین، کارت شبکه ConnectX-9 SuperNIC با سرعت ۱.۶ ترابایتبرثانیه و شتابدهندههای قابلبرنامهریزی، برای مقیاسدهی عظیم هوش مصنوعی بهینهسازی شده است.


عملکرد سیستم یکپارچه NVL72
تمامی این قطعات در رکهای قدرتمند NVIDIA Vera Rubin NVL72 گرد هم میآیند. این سیستم نسبتبه نسل قبل یعنی بلکول، پیشرفتهای چشمگیری داشته است که شامل ۲.۵ برابر ظرفیت حافظه LPDDR5x (۵۴ ترابایت) و ۱.۵ برابر ظرفیت حافظه HBM4 (۲۰.۷ ترابایت) میشود.


انویدیا مدعی است که پلتفرم Rubin هزینه تولید توکنهای استنتاجی را تا ۱۰ برابر کاهش میدهد و برای آموزش مدلهای زبانی بزرگ، به ۴ برابر پردازنده گرافیکی کمتر نسبتبه بلکول نیاز دارد. این اکوسیستم هماکنون در مرحله تولید کامل قرار دارد و مشتریان اواخر سال جاری میلادی اولین نمونهها را دریافت خواهند کرد.

بهنظر شما آیا رقبایی مثل AMD یا اینتل میتوانند در آینده نزدیک به این سطح از قدرت پردازشی در حوزه هوش مصنوعی دست پیدا کنند؟
بفرست برای دوستات

