Нова модель ШІ Gemini від Google зосереджена на ефективності

0
600 views
Нова модель ШІ Gemini від Google зосереджена на ефективності

Google випускає нову модель штучного інтелекту, розроблену для забезпечення високої продуктивності з акцентом на ефективність.

Модель, Gemini 2.5 Flash, незабаром буде запущена у Vertex AI, платформі для розробки штучного інтелекту Google. Компанія заявляє, що вона пропонує “динамічні та керовані” обчислення, дозволяючи розробникам регулювати час обробки залежно від складності запитів.

“[Ви можете налаштувати] швидкість, точність і баланс витрат відповідно до ваших конкретних потреб”, – пише Google у блозі, наданому TechCrunch. “Ця гнучкість є ключовим фактором для оптимізації продуктивності флеш-пам’яті у великих об’ємах, чутливих до витрат”.

Gemini 2.5 Flash з’являється в той час, коли вартість флагманських моделей штучного інтелекту продовжує зростати. Більш дешеві, продуктивні моделі, такі як 2.5 Flash, є привабливою альтернативою дорогим топовим варіантам за рахунок певної точності.

Gemini 2.5 Flash – це “міркувальна” модель, подібна до o3-mini від OpenAI та R1 від DeepSeek. Це означає, що йому потрібно трохи більше часу, щоб відповісти на питання і перевірити себе.

Google стверджує, що 2.5 Flash ідеально підходить для “великих обсягів” і додатків “реального часу”, таких як обслуговування клієнтів і синтаксичний аналіз документів.

“Ця робоча конячка оптимізована спеціально для низької затримки і зниження вартості, – йдеться у блозі Google. “Це ідеальний движок для чуйних віртуальних помічників та інструментів для підбиття підсумків у реальному часі, де ефективність у масштабі є ключовим фактором”.

Google не опублікував звіт про безпеку або технічний звіт для Gemini 2.5 Flash, що ускладнює розуміння того, в чому модель має переваги, а в чому недоліки. Раніше компанія повідомила TechCrunch, що не публікує звіти для моделей, які вона вважає “експериментальними”.

У середу Google також оголосила, що планує вивести моделі Gemini, такі як 2.5 Flash, у локальне середовище, починаючи з третього кварталу. Моделі Gemini будуть доступні в Google Distributed Cloud (GDC), локальному рішенні Google для клієнтів із суворими вимогами до управління даними. Google заявляє, що співпрацює з Nvidia, щоб перенести моделі Gemini на GDC-сумісні системи Nvidia Blackwell, які клієнти можуть придбати через Google або через інші канали.