Нова модель ШІ DeepMind допомагає роботам складати орігамі

0
281 views
Нова модель ШІ DeepMind допомагає роботам складати орігамі

З моменту свого дебюту наприкінці минулого року Gemini 2.0 стала основою для кількох продуктів Google, включаючи новий чат-бот AI Mode. Тепер Google DeepMind використовує цю ж технологію для чогось більш цікавого. У середу лабораторія штучного інтелекту анонсувала дві нові моделі на базі Gemini, які, за її словами, “закладуть основу для нового покоління корисних роботів”.

Перший, Gemini Robotics, був розроблений Deepmind для полегшення прямого управління роботами. На думку компанії, системи штучного інтелекту для роботів повинні мати три якості: загальність, інтерактивність і спритність.

Перша передбачає гнучкість робота, що дозволяє йому адаптуватися до нових ситуацій, в тому числі тих, які не були охоплені його навчанням. Інтерактивність – це здатність робота реагувати на людей і навколишнє середовище. Нарешті, спритність, яка здебільшого не потребує пояснень: багато завдань, які людина може виконати без зайвих роздумів, потребують дрібної моторики, яку роботам складно опанувати.

“Хоча наша попередня робота продемонструвала прогрес у цих сферах, Gemini Robotics являє собою значний крок у продуктивності за всіма трьома осями, що наближає нас до створення дійсно універсальних роботів”, – кажуть у DeepMind.

Наприклад, завдяки Gemini Robotics робот ALOHA 2 від DeepMind може складати орігамі та закривати пакети Ziploc. Дворукий робот також розуміє всі інструкції, які йому дають природною, повсякденною мовою. Як видно з відео, яким поділився Google, він навіть може виконувати завдання, незважаючи на перешкоди, наприклад, коли дослідник пересувається навколо Tupperware, в який він щойно попросив робота покласти фрукти.

Google співпрацює з Apptronik, компанією, яка створила двоногого робота Apollo, для створення наступного покоління людиноподібних роботів. У той же час DeepMind випускає Gemini Robotics-ER (або втілений розум). Друга модель, за словами компанії, дозволить робототехнікам запускати власні програми, використовуючи передові міркування Gemini. DeepMind надає доступ до системи “довіреним тестувальникам”, в тому числі дочірній компанії Google Boston Dynamics.