OpenAI запускає Flex-обробку для дешевших завдань ШІ

0
1 000 views
OpenAI запускає Flex-обробку для дешевших завдань ШІ

Намагаючись більш агресивно конкурувати з конкуруючими AI-компаніями, такими як Google, OpenAI запускає Flex processing – опцію API, яка забезпечує нижчі ціни на використання AI-моделей в обмін на повільніший час відгуку та “періодичну недоступність ресурсів”.

Flex-обробка, доступна в бета-версії для нещодавно випущених моделей міркувань o3 і o4-mini від OpenAI, призначена для менш пріоритетних і “невиробничих” завдань, таких як оцінка моделей, збагачення даних і асинхронні робочі навантаження, кажуть в OpenAI.

Це знижує витрати на API рівно вдвічі. Для o3 обробка Flex коштує $5 за мільйон вхідних токенів (~750 000 слів) і $20 за мільйон вихідних токенів, порівняно зі стандартними $10 за мільйон вхідних токенів і $40 за мільйон вихідних токенів. Для o4-mini Flex знижує ціну до $0,55 за мільйон вхідних токенів і $2,20 за мільйон вихідних токенів з $1,10 за мільйон вхідних токенів і $4,40 за мільйон вихідних токенів.

Запуск Flex-обробки відбувається в той час, коли ціни на передові технології штучного інтелекту продовжують зростати, а конкуренти випускають дешевші та ефективніші моделі, орієнтовані на бюджет. У четвер Google випустив Gemini 2.5 Flash – модель міркувань, яка відповідає або перевершує R1 від DeepSeek за продуктивністю при меншій вартості вхідного токена.

В електронному листі клієнтам, в якому повідомляється про запуск гнучкого ціноутворення, OpenAI також вказала, що розробники, які знаходяться на 1-3 рівнях ієрархії рівнів використання, повинні будуть пройти нещодавно запроваджений процес перевірки ідентифікаційних даних, щоб отримати доступ до o3. Рівні визначаються кількістю грошей, витрачених на послуги OpenAI. Підсумки міркувань O3 та інших моделей, а також підтримка потокового API також пов’язані з верифікацією.

Раніше OpenAI заявляв, що верифікація ідентифікаторів призначена для того, щоб зупинити зловмисників від порушення його політики використання.