Компанія Cohere, що спеціалізується на штучному інтелекті для підприємств, представила нову серію багатомовних моделей в рамках триваючого Індійського саміту з штучного інтелекту. Моделі, що отримали назву Tiny Aya, є відкритими — це означає, що їхній базовий код є загальнодоступним для використання та модифікації будь-ким — підтримують понад 70 мов і можуть працювати на повсякденних пристроях, таких як ноутбуки, без необхідності підключення до Інтернету.
Модель, запущена дослідницьким підрозділом компанії Cohere Labs, підтримує південноазіатські мови, такі як бенгальська, хінді, пенджабська, урду, гуджараті, тамільська, телугу та маратхі.
Базова модель містить 3,35 мільярда параметрів — це показник її розміру та складності. Cohere також випустила TinyAya-Global, версію, налагоджену для кращого виконання команд користувачів, для додатків, що вимагають широкої мовної підтримки. Регіональні варіанти доповнюють сімейство: TinyAya-Earth для африканських мов; TinyAya-Fire для південноазіатських мов; та TinyAya-Water для Азіатсько-Тихоокеанського регіону, Західної Азії та Європи.
«Такий підхід дозволяє кожній моделі розвинути більш міцну лінгвістичну базу та культурні нюанси, створюючи системи, які здаються більш природними та надійними для спільнот, яким вони призначені. Водночас усі моделі Tiny Aya зберігають широке багатомовне покриття, що робить їх гнучкими відправними точками для подальшої адаптації та досліджень», — йдеться в заяві компанії.
Cohere зазначила, що ці моделі, які були навчені на одному кластері з 64 графічних процесорів H100 (тип високопотужних чіпів від Nvidia) з використанням відносно скромних обчислювальних ресурсів, ідеально підходять для дослідників і розробників, які створюють додатки для аудиторій, що розмовляють рідними мовами. Моделі здатні працювати безпосередньо на пристроях, тому розробники можуть використовувати їх для офлайн-перекладу. Компанія зазначила, що створила базове програмне забезпечення для використання на пристроях, яке вимагає менше обчислювальної потужності, ніж більшість аналогічних моделей.
У країнах з великим мовним розмаїттям, таких як Індія, така можливість роботи в автономному режимі може відкрити широкий спектр застосувань і випадків використання без необхідності постійного доступу до Інтернету.
Моделі доступні на HuggingFace, популярній платформі для обміну та тестування моделей штучного інтелекту, а також на платформі Cohere. Розробники можуть завантажити їх на HuggingFace, Kaggle та Ollama для локального розгортання. Компанія також публікує навчальні та оціночні набори даних на HuggingFace і планує опублікувати технічний звіт з докладним описом своєї методології навчання.
Генеральний директор стартапу Ейдан Гомес (Aidan Gomez) заявив минулого року, що компанія планує «незабаром» вийти на біржу. За даними CNBC, компанія завершила 2025 рік на високій ноті, продемонструвавши 240 мільйонів доларів річного регулярного доходу та 50% зростання в порівнянні з попереднім кварталом протягом усього року.










