Ironwood – новітній чіп прискорювача ШІ від Google

0
509 views
Ironwood - новітній чіп прискорювача ШІ від Google

Цього тижня під час конференції Cloud Next компанія Google представила останнє покоління свого чіпа-прискорювача штучного інтелекту TPU.

Новий чіп, який отримав назву Ironwood, є сьомим поколінням TPU від Google і першим, оптимізованим для інференції, тобто запуску моделей штучного інтелекту. Запланований до запуску наприкінці цього року для клієнтів Google Cloud, Ironwood буде доступний у двох конфігураціях: 256-чиповий кластер та 9216-чиповий кластер.

“Ironwood – наш найпотужніший, найпродуктивніший та найенергоефективніший TPU”, – написав віце-президент Google Cloud Амін Вахдат у блозі, наданому TechCrunch. “І він спеціально створений для роботи з мислячими, інференційними моделями ШІ в масштабі”.

Ironwood з’являється в той час, коли конкуренція на ринку прискорювачів ШІ загострюється. Nvidia може бути лідером, але технологічні гіганти, включаючи Amazon і Microsoft, просувають свої власні рішення. Amazon має свої процесори Trainium, Inferentia та Graviton, доступні через AWS, а Microsoft розміщує екземпляри Azure для свого чіпа Cobalt 100 AI.

Ironwood може забезпечити 4,614 TFLOP обчислювальної потужності на піку, згідно з внутрішнім бенчмаркінгом Google. Кожен чіп має 192 ГБ виділеної оперативної пам’яті з пропускною здатністю, що наближається до 7,4 Тбіт/с.

Ironwood має вдосконалене спеціалізоване ядро SparseCore для обробки типів даних, поширених у робочих навантаженнях “розширеного ранжування” та “рекомендацій” (наприклад, алгоритм, який пропонує одяг, що може вам сподобатися). Архітектура TPU була розроблена таким чином, щоб мінімізувати рух даних і затримки на чіпі, що призводить до економії електроенергії, кажуть у Google.

Найближчим часом Google планує інтегрувати Ironwood зі своїм Гіперкомп’ютером штучного інтелекту, модульним обчислювальним кластером в Google Cloud, додав Вахдат.

“Ironwood являє собою унікальний прорив в епоху висновків, – сказав Вахдат, – зі збільшеною обчислювальною потужністю, об’ємом пам’яті, […] мережевими досягненнями та надійністю”.