TPU جدید گوگل، Ironwood v7، اکنون بهعنوان اولین مدار مجتمع اختصاصی (ASIC) قابل رقابت با GPUهای Blackwell انویدیا ظاهر شده است. این موضوع، بهطور طبیعی، توجه زیادی به فرآیند طراحی TPU گوگل و شرکای آن، از جمله شرکت تایوانی مدیاتک، جلب کرده است. مدیاتک حالا میتواند تجربهی خود را در این پروژه به بهبود کارایی واقعی تراشههای خود، از جمله Dimensity 9600، منتقل کند.
قبل از پرداختن به Dimensity 9600، بیایید ابتدا بررسی کنیم که همهی هیاهو درباره TPU Ironwood v7 گوگل از چه قرار است. تا این لحظه، این اطلاعات از معماری TPU جدید منتشر شده است:
طراحی دو چیپلت (dual-chiplet) که هر چیپلت شامل موارد زیر است:
- 1x TensorCore با معماری آرایه سیستولیک برای انجام عملیات ضرب ماتریسی بهصورت بسیار کارآمد – این عملیات هسته اصلی پردازشهای هوش مصنوعی، شامل آموزش و استنتاج شبکههای عصبی، است و با کاهش تعداد دسترسیها به حافظه HBM، سرعت محاسبات را بهطور چشمگیری افزایش میدهد.
- واحد پردازش برداری (VPU) برای انجام عملیات عمومی و عنصری ضروری در مدلهای هوش مصنوعی مانند توابع فعالسازی (مثل ReLU) و نرمالسازیها.
- واحد ضرب ماتریسی (MXU) که عملیات ضرب ماتریسی را انجام میدهد.
- 2x SparseCore که برای مواردی که نیاز به دسترسی به حافظه نامنظم و وابسته به داده دارند بهینه شده است، از جمله پردازش embeddingهای بسیار بزرگ – که برای تبدیل ویژگیهای دستهای بزرگ (مانند فهرستهای واژگان) به بردارهای متراکم کوچک ضروری هستند.
- ۹۶ گیگابایت حافظه HBM.
- اتصال دو چیپلت از طریق die-to-die (D2D) interconnect که ۶ برابر سریعتر از لینک بین چیپلتهای یکبعدی (1D ICI) است.
یک رک TPU شامل ۶۴ چیپ متصل به هم از طریق ICI است و هر چیپ دارای ۱.۲ ترابایت بر ثانیه پهنای باند دوطرفه ICI میباشد. این پیکربندی پایه ۶۴ چیپی، «cube» نام دارد.
چند cube از طریق شبکه سوئیچ مدار نوری (OCS) به هم متصل شده و یک superpod تشکیل میدهند که شامل ۹,۲۱۶ چیپ و ۱۴۴ cube است.
عملکرد TPU جدید گوگل بسیار رقابتی است، بهخصوص در زمینه استنتاج (inference) که اهمیت بیشتری پیدا کرده است، زیرا صنعت به سمت مدلهای AI بزرگتر نمیرود. در واقع، TPU آینده نهتنها هزینه کل مالکیت (TCO) پایینتری دارد، بلکه عملکرد آن تقریباً با GPUهای جدید انویدیا برابری میکند.
نقش مدیاتک در TPU v7 Ironwood گوگل
مدیاتک در طراحی TPU v7 Ironwood نقش مهمی ایفا کرده و اکنون میتواند آن تجربه را برای بهبود کارایی تراشه Dimensity 9600 خود به کار گیرد.
طبق گزارشهایی که در مارس ۲۰۲۵ منتشر شد، گوگل از مدیاتک خواسته بود تا ماژولهای ورودی/خروجی (I/O) TPU Ironwood را طراحی کند تا ارتباط بین پردازنده و دستگاههای جانبی تسهیل شود. این رویکرد، تغییر سیاست گوگل در سالهای اخیر بود، چرا که قبلاً طراحی نسل بعدی TPUها را بهطور کامل با Broadcom انجام میداد.
براساس تخمین UBS، مدیاتک از همکاری با گوگل روی TPU نسل بعد، حدود ۴ میلیارد دلار درآمد خواهد داشت.
چگونه تجربه مدیاتک در TPU v7 میتواند به بهبود Dimensity 9600 کمک کند
هرچند ASICها و پردازندههای موبایل مانند Dimensity 9600 ذاتاً متفاوت هستند و مدیاتک نمیتواند تمام تجربه TPU را مستقیماً به Dimensity منتقل کند، اما هنوز میتواند تعدادی بهبود تدریجی اعمال کند:
- توسعه استراتژی کارآمدتر Power Gating برای Dimensity 9600، تا بتواند بلوکهای I/O خاص را زمانی که استفاده نمیشوند، بهصورت هوشمند خاموش کند.
- بهبود ولتاژ اسکیلینگ (voltage scaling) برای مصرف بهینهتر انرژی، که موجب بهبود مصرف برق تراشه میشود.
- تعدیل استراتژیهای Clock Gating برای افزایش عمر باتری و به دست آوردن بودجه انرژی کارآمدتر.
البته مدیاتک همچنین روی تراشههای AI خود نیز کار میکند که تجربه TPU برای آنها اهمیت بیشتری دارد. با این حال، پردازندههای موبایل نیز میتوانند از این بهبودها بهرهمند شوند، بهویژه که مدیاتک پیشتر هستههای Efficiency را در معماری پردازنده موبایل خود حذف کرده است.













دیدگاه ها