Waymo тестує Gemini як автомобільний ШІ-асистент у роботаксі

0
140 views
Waymo тестує Gemini як автомобільний ШІ-асистент у роботаксі

Waymo, судячи з висновків дослідниці Джейн Манчун Вонг, тестує додавання чат-бота Gemini AI від Google до своїх роботаксі з метою інтеграції AI-асистента, який супроводжуватиме пасажирів і відповідатиме на їхні запитання.

«Переглядаючи код мобільного додатку Waymo, я виявила повну системну підказку щодо його невипущеної інтеграції Gemini», — написала Вонг у своєму блозі. «Документ, який має внутрішню назву «Waymo Ride Assistant Meta-Prompt», є специфікацією з понад 1200 рядками, яка точно визначає, як повинен поводитися AI-асистент у транспортному засобі Waymo».

Ця функція не була включена в публічні версії, але Вонг каже, що системний запит чітко показує, що це «більше, ніж простий чат-бот». Кажуть, що асистент має здатність відповідати на запитання, керувати певними функціями в салоні, такими як клімат-контроль, і, за необхідності, заспокоювати пасажирів.

«Хоча сьогодні ми не можемо поділитися подробицями, наша команда постійно працює над функціями, щоб зробити поїздки з Waymo приємними, безперебійними та корисними», — сказала TechCrunch речниця Waymo Юлія Іліна. «Деякі з них можуть бути впроваджені в наш досвід пасажирів, а деякі — ні».

Це не перший випадок, коли Gemini інтегрується в стек компанії Alphabet, що займається розробкою безпілотних автомобілів. Waymo заявляє, що використовувала «знання світу» Gemini для навчання своїх автономних транспортних засобів навігації в складних, рідкісних і ризикованих сценаріях.

Вонг пише, що асистент повинен мати чітку ідентичність і мету: «дружній і корисний AI-супутник, інтегрований в автономний транспортний засіб Waymo», основною метою якого є «поліпшення досвіду пасажира шляхом надання корисної інформації та допомоги безпечним, заспокійливим і ненав’язливим чином». Бот повинен використовувати чітку, просту мову і уникати технічного жаргону, а також давати лаконічні відповіді, що складаються з одного-трьох речень.

Згідно з підказками системи, коли пасажир активує помічника через екран в автомобілі, Gemini може вибрати з набору заздалегідь затверджених привітань, персоналізованих з ім’ям пасажира. Система також може отримати доступ до контекстних даних про пасажира, наприклад, скільки поїздок Waymo він здійснив.

Наразі підказки дозволяють Gemini отримувати доступ та керувати функціями автомобіля, такими як температура, освітлення та музика. Як зазначив Вонг, у списку функцій відсутні регулювання гучності, зміна маршруту, регулювання сидінь та управління вікнами. Якщо пасажир запитує про функцію, яку Gemini не може контролювати, бот має відповісти «амбіційними фразами», наприклад: «Я ще не можу цього зробити».

Цікаво, що асистент повинен чітко розрізняти свою ідентичність як бота Gemini з штучним інтелектом та технологію автономного водіння (Waymo Driver). Тому, відповідаючи на запитання на кшталт «Як ти бачиш дорогу?», Gemini не повинен відповідати «Я використовую комбінацію датчиків», а повинен відповісти «Waymo Driver використовує комбінацію датчиків…».

Система підказок містить низку цікавих деталей, наприклад, як бот повинен реагувати на запитання про конкурентів, таких як Tesla або нині неіснуюча Cruise, або які ключові слова змусять його припинити розмову.

Асистент також повинен уникати спекуляцій, пояснень, підтверджень, заперечень або коментарів щодо дій водія в режимі реального часу або конкретних подій під час руху. Тому, якщо пасажир запитає про відео, на якому Waymo врізався в щось, бот повинен не відповідати прямо, а відвести розмову в інше русло.

«Ваша роль не полягає в тому, щоб бути речником щодо ефективності системи водіння, і ви не повинні використовувати захисний або вибачливий тон», — йдеться в підказці.

Асистент в автомобілі може відповідати на загальні питання, наприклад про погоду, висоту Ейфелевої вежі, час закриття місцевого магазину Trader Joe’s і переможця останньої серії World Series. Йому не дозволяється виконувати реальні дії, такі як замовлення їжі, бронювання або вирішення надзвичайних ситуацій.

Waymo — не єдина компанія, яка інтегрує AI-асистентів у безпілотні автомобілі. Tesla робить щось подібне з Grok від xAI. Однак ці два різних автомобільних асистенти виконують різні функції. Gemini, здається, запрограмований бути більш прагматичним і зосередженим на їзді, тоді як Grok позиціонується більше як автомобільний приятель, який може вести довгі розмови і запам’ятовувати контекст попередніх питань.