Nvidia анонсує нові відкриті моделі штучного інтелекту

0
126 views
Nvidia анонсує нові відкриті моделі штучного інтелекту

У понеділок компанія Nvidia оголосила про нові інфраструктурні та AI-моделі, працюючи над створенням базової технології для фізичного AI, включаючи роботів та автономні транспортні засоби, які можуть сприймати реальний світ та взаємодіяти з ним.

Гігант напівпровідникової галузі оголосив про Alpamayo-R1, відкриту модель мови бачення для досліджень в галузі автономного водіння, на конференції NeurIPS AI в Сан-Дієго, Каліфорнія. Компанія стверджує, що це перша модель мови бачення, орієнтована на автономне водіння. Моделі візуального мовлення можуть обробляти як текст, так і зображення, дозволяючи транспортним засобам «бачити» своє оточення і приймати рішення на основі того, що вони сприймають.

Ця нова модель базується на моделі Cosmos-Reason від Nvidia, моделі міркування, яка обмірковує рішення перед тим, як відповісти. Nvidia спочатку випустила сімейство моделей Cosmos у січні 2025 року. Додаткові моделі були випущені в серпні.

Технологія, така як Alpamayo-R1, є критично важливою для компаній, які прагнуть досягти 4-го рівня автономного водіння, що означає повну автономність у визначеній області та за певних обставин, зазначила Nvidia у своєму блозі.

Nvidia сподівається, що цей тип моделі міркування надасть автономним транспортним засобам «здоровий глузд», щоб краще підходити до прийняття нюансованих рішень під час водіння, як це роблять люди.

Ця нова модель доступна на GitHub і Hugging Face.

Поряд з новою моделлю бачення, Nvidia також завантажила на GitHub нові покрокові інструкції, ресурси для інференції та робочі процеси після навчання — разом вони називаються Cosmos Cookbook — щоб допомогти розробникам краще використовувати та навчати моделі Cosmos для їхніх конкретних випадків використання. Посібник охоплює курацію даних, генерацію синтетичних даних та оцінку моделей.

Ці оголошення з’явилися в той час, коли компанія на повній швидкості просувається в напрямку фізичного ШІ як нового напрямку для своїх передових графічних процесорів ШІ.

Співзасновник і генеральний директор Nvidia Дженсен Хуанг неодноразово заявляв, що наступною хвилею ШІ буде фізичний ШІ. Білл Даллі, головний науковий співробітник Nvidia, підтримав цю думку в розмові з TechCrunch влітку, підкресливши важливість фізичного ШІ в робототехніці.

«Я думаю, що зрештою роботи стануть величезним гравцем у світі, і ми хочемо, по суті, створювати мізки для всіх роботів», — сказав тоді Даллі. «Для цього нам потрібно почати розробляти ключові технології».