Google resmi mengumumkan kehadiran Tensor Processing Unit (TPU) Ironwood, akselerator kecerdasan buatan generasi ketujuh yang dirancang khusus untuk inferensi skala besar, dalam acara Google Cloud Next yang akan berlangsung pada 25 April 2025.
Amin Vahdat, Wakil Presiden dan Manajer Umum ML, Sistem, dan AI Cloud di Google, menyebut Ironwood sebagai TPU tercepat yang pernah dibuat Google, sekaligus menjadi desain TPU pertama yang dikembangkan secara eksklusif untuk proses inferensi model kecerdasan buatan.
“TPU ini dirancang untuk memproses pemikiran model AI inferensial secara besar-besaran,” jelas Amin dalam unggahan resmi di Google Blog, Rabu, 9 April 2025.
Masuki Era Inferensi AI
Ironwood disebut sebagai pendorong utama “era inferensi” oleh Google—yaitu tahap baru dalam perkembangan AI di mana sistem tidak hanya mengumpulkan data, tapi juga secara aktif menangkap, mengolah, dan menyajikan solusi berbasis informasi real-time.
“Ini bukan sekadar pengumpulan data, tetapi penyampaian pemikiran dari model-model AI berskala besar seperti LLM, MoE, dan tugas inferensi kompleks lainnya,” terang Amin.
Spesifikasi Gahar untuk Skala Masif
TPU Ironwood terdiri dari 9.216 prosesor pendingin cair, terhubung lewat sistem jaringan Inter-Chip Interconnect (ICI) berlatensi rendah dan bandwidth tinggi, dengan konsumsi daya hingga 10 megawatt per pod.
Beberapa peningkatan signifikan dibanding generasi sebelumnya (TPU Trilium) meliputi:
-
💾 Memori HBM: 192 GB per chip (naik 6x lipat)
-
⚡ Bandwidth Memori: 7,2 TBps per chip (naik 3,5x)
-
🔗 Bandwidth ICI: 1,2 Tbps dua arah (naik 1,5x)
Kombinasi ini dirancang untuk memenuhi kebutuhan inferensi AI generatif dan beban kerja komputasi berat secara efisien dan hemat energi.
Lebih Cepat dari Pendahulunya
CEO Google dan Alphabet, Sundar Pichai, turut mengonfirmasi bahwa Ironwood akan diluncurkan tahun ini. Ia mengklaim bahwa performa Ironwood hingga 3.600 kali lebih tinggi dibanding versi sebelumnya.
“Ini adalah prosesor AI paling kuat yang pernah kami kembangkan. Ironwood akan menjadi tulang punggung pemrosesan model AI generatif dan inferensial generasi berikutnya,” ujar Sundar.
Dari TPU v1 ke Ironwood
Ironwood melanjutkan evolusi TPU Google dari generasi pertama (TPU v1) hingga Trilium. Bila Trilium banyak digunakan untuk pelatihan (training), maka Ironwood difokuskan pada inferensi cepat dan efisien, menjadikannya ideal untuk produk dan layanan berbasis AI real-time seperti asisten virtual, model bahasa besar, dan pemrosesan cloud.
Kita tunggu bagaimana Ironwood bakal mengubah peta persaingan akselerator AI di pasar, terutama melawan NVIDIA dan AWS Trainium. Performa tingginya menjanjikan transformasi besar dalam ekosistem inferensi dan komputasi awan.

ASUS Perkenalkan ROG NeoCore, Router WiFi 8 Pertama di CES 2026
Rahasia Keyboard Mekanik Awet Bertahun-tahun: Jangan Sampai Salah Langkah!
Harga RAM Lebih Mahal Daripada Mobil Denza D9
ASUS ROG Zephyrus G14 2025: Tipis, Kencang, Siap untuk Kerja dan Gaming
ASUS Vivobook 14, Laptop Ringkas untuk Produktivitas Modern
Laptop Samsung Tipis dan Nyaman Mulai 900 Ribu: Pilihan Ideal untuk Pelajar dan Pejabat 2025
Lenovo Legion Pro Monitor Gen 10: Gaming Kompetitif & Kreativitas Terpadu
Ingin Buat Rakitan PC di Era RAM Mahal? Ini Rakitannya yang Paling Optimal