مدیاتک روی گوگل TPU v7 کار می‌کند تا کارایی دایمنسیتی ۹۶۰۰ را افزایش دهد

مدیاتک روی گوگل TPU v7 کار می‌کند تا کارایی دایمنسیتی ۹۶۰۰ را افزایش دهد
مدیاتک روی گوگل TPU v7 کار می‌کند تا کارایی دایمنسیتی ۹۶۰۰ را افزایش دهد

TPU جدید گوگل، Ironwood v7، اکنون به‌عنوان اولین مدار مجتمع اختصاصی (ASIC) قابل رقابت با GPUهای Blackwell انویدیا ظاهر شده است. این موضوع، به‌طور طبیعی، توجه زیادی به فرآیند طراحی TPU گوگل و شرکای آن، از جمله شرکت تایوانی مدیاتک، جلب کرده است. مدیاتک حالا می‌تواند تجربه‌ی خود را در این پروژه به بهبود کارایی واقعی تراشه‌های خود، از جمله Dimensity 9600، منتقل کند.

قبل از پرداختن به Dimensity 9600، بیایید ابتدا بررسی کنیم که همه‌ی هیاهو درباره TPU Ironwood v7 گوگل از چه قرار است. تا این لحظه، این اطلاعات از معماری TPU جدید منتشر شده است:

طراحی دو چیپ‌لت (dual-chiplet) که هر چیپ‌لت شامل موارد زیر است:

  • 1x TensorCore با معماری آرایه سیستولیک برای انجام عملیات ضرب ماتریسی به‌صورت بسیار کارآمد – این عملیات هسته اصلی پردازش‌های هوش مصنوعی، شامل آموزش و استنتاج شبکه‌های عصبی، است و با کاهش تعداد دسترسی‌ها به حافظه HBM، سرعت محاسبات را به‌طور چشمگیری افزایش می‌دهد.
  • واحد پردازش برداری (VPU) برای انجام عملیات عمومی و عنصری ضروری در مدل‌های هوش مصنوعی مانند توابع فعال‌سازی (مثل ReLU) و نرمال‌سازی‌ها.
  • واحد ضرب ماتریسی (MXU) که عملیات ضرب ماتریسی را انجام می‌دهد.
  • 2x SparseCore که برای مواردی که نیاز به دسترسی به حافظه نامنظم و وابسته به داده دارند بهینه شده است، از جمله پردازش embeddingهای بسیار بزرگ – که برای تبدیل ویژگی‌های دسته‌ای بزرگ (مانند فهرست‌های واژگان) به بردارهای متراکم کوچک ضروری هستند.
  • ۹۶ گیگابایت حافظه HBM.
  • اتصال دو چیپ‌لت از طریق die-to-die (D2D) interconnect که ۶ برابر سریع‌تر از لینک بین چیپ‌لت‌های یک‌بعدی (1D ICI) است.

یک رک TPU شامل ۶۴ چیپ متصل به هم از طریق ICI است و هر چیپ دارای ۱.۲ ترابایت بر ثانیه پهنای باند دوطرفه ICI می‌باشد. این پیکربندی پایه ۶۴ چیپی، «cube» نام دارد.
چند cube از طریق شبکه سوئیچ مدار نوری (OCS) به هم متصل شده و یک superpod تشکیل می‌دهند که شامل ۹,۲۱۶ چیپ و ۱۴۴ cube است.

عملکرد TPU جدید گوگل بسیار رقابتی است، به‌خصوص در زمینه استنتاج (inference) که اهمیت بیشتری پیدا کرده است، زیرا صنعت به سمت مدل‌های AI بزرگ‌تر نمی‌رود. در واقع، TPU آینده نه‌تنها هزینه کل مالکیت (TCO) پایین‌تری دارد، بلکه عملکرد آن تقریباً با GPUهای جدید انویدیا برابری می‌کند.

نقش مدیاتک در TPU v7 Ironwood گوگل

مدیاتک در طراحی TPU v7 Ironwood نقش مهمی ایفا کرده و اکنون می‌تواند آن تجربه را برای بهبود کارایی تراشه Dimensity 9600 خود به کار گیرد.

طبق گزارش‌هایی که در مارس ۲۰۲۵ منتشر شد، گوگل از مدیاتک خواسته بود تا ماژول‌های ورودی/خروجی (I/O) TPU Ironwood را طراحی کند تا ارتباط بین پردازنده و دستگاه‌های جانبی تسهیل شود. این رویکرد، تغییر سیاست گوگل در سال‌های اخیر بود، چرا که قبلاً طراحی نسل بعدی TPUها را به‌طور کامل با Broadcom انجام می‌داد.

براساس تخمین UBS، مدیاتک از همکاری با گوگل روی TPU نسل بعد، حدود ۴ میلیارد دلار درآمد خواهد داشت.

چگونه تجربه مدیاتک در TPU v7 می‌تواند به بهبود Dimensity 9600 کمک کند

هرچند ASICها و پردازنده‌های موبایل مانند Dimensity 9600 ذاتاً متفاوت هستند و مدیاتک نمی‌تواند تمام تجربه TPU را مستقیماً به Dimensity منتقل کند، اما هنوز می‌تواند تعدادی بهبود تدریجی اعمال کند:

  • توسعه استراتژی کارآمدتر Power Gating برای Dimensity 9600، تا بتواند بلوک‌های I/O خاص را زمانی که استفاده نمی‌شوند، به‌صورت هوشمند خاموش کند.
  • بهبود ولتاژ اسکیلینگ (voltage scaling) برای مصرف بهینه‌تر انرژی، که موجب بهبود مصرف برق تراشه می‌شود.
  • تعدیل استراتژی‌های Clock Gating برای افزایش عمر باتری و به دست آوردن بودجه انرژی کارآمدتر.

البته مدیاتک همچنین روی تراشه‌های AI خود نیز کار می‌کند که تجربه TPU برای آن‌ها اهمیت بیشتری دارد. با این حال، پردازنده‌های موبایل نیز می‌توانند از این بهبودها بهره‌مند شوند، به‌ویژه که مدیاتک پیش‌تر هسته‌های Efficiency را در معماری پردازنده موبایل خود حذف کرده است.

مهتاب جهاندار
فارغ‌التحصیل نرم‌افزار و علاقه‌مند به دنیای موبایل هستم. با عشق به تکنولوژی، اخبار و بررسی‌های گوشی‌های هوشمند را می‌نویسم تا به شما در انتخاب بهترین‌ها کمک کنم.