Модель OpenAI наступного покоління o3 з’явиться на початку наступного року

0
677 views
Модель OpenAI наступного покоління o3 з'явиться на початку наступного року

Після майже двох тижнів анонсів, OpenAI завершила серію прямих трансляцій “12 днів OpenAI” попереднім оглядом своєї пограничної моделі наступного покоління. “З поваги до друзів з Telefónica (власник мобільної мережі O2 в Європі) і за великою традицією OpenAI, яка дуже, дуже погано розбирається в іменах, вона називається o3″, – сказав генеральний директор OpenAI Сем Альтман тим, хто дивився анонс на YouTube.

Нова модель ще не готова до публічного використання. Замість цього OpenAI спочатку робить o3 доступним для дослідників, які хочуть отримати допомогу в тестуванні безпеки. OpenAI також оголосила про існування o3-mini. Альтман сказав, що компанія планує запустити цю модель “приблизно в кінці січня”, а o3 – “незабаром після цього”.

Як і слід було очікувати, o3 пропонує покращену продуктивність порівняно зі своїм попередником, але наскільки вона краща за o1 – це головна новина. Наприклад, під час цьогорічного американського запрошеного іспиту з математики o3 показав результат 96,7 відсотка. На відміну від нього, o1 отримав скромніший результат – 83,3 відсотка. “Це означає, що o3 часто пропускає лише одне питання”, – сказав Марк Чен, старший віце-президент з досліджень OpenAI. Насправді, o3 настільки добре впорався зі звичайним набором тестів, через які OpenAI проходить зі своїми моделями, що компанії довелося знайти більш складні тести для порівняння.

Модель OpenAI наступного покоління o3 з'явиться на початку наступного року

Одним з них є ARC-AGI – тест, який перевіряє здатність алгоритму ШІ до інтуїції та навчання на місці. За словами творця тесту, некомерційної організації ARC Prize, АІ-система, яка зможе успішно пройти ARC-AGI, стане “важливою віхою на шляху до штучного загального інтелекту”. З моменту свого дебюту в 2019 році жодна модель штучного інтелекту не змогла перемогти ARC-AGI. Тест складається з питань на введення-виведення, з якими більшість людей можуть розібратися інтуїтивно. Наприклад, у наведеному вище прикладі правильною відповіддю буде створення квадратів з чотирьох поліміно за допомогою темно-синіх блоків.

На низьких обчислювальних налаштуваннях o3 набрала 75,7% у тесті. З додатковою обчислювальною потужністю модель досягла 87,5%. “Продуктивність людини можна порівняти з 85-відсотковим порогом, тому перевищення цього показника є важливою віхою”, – сказав Грег Камрадт, президент фонду ARC Prize Foundation.

Модель OpenAI наступного покоління o3 з'явиться на початку наступного року

OpenAI також представила o3-mini. Нова модель використовує нещодавно анонсований OpenAI Adaptive Thinking Time API, щоб запропонувати три різні режими міркувань: Низький, Середній і Високий. На практиці це дозволяє користувачам регулювати час, протягом якого програма “думає” над проблемою, перш ніж надати відповідь. Як ви можете бачити з наведеного вище графіка, o3-mini може досягти результатів, порівнянних з поточною моделлю міркувань OpenAI o1, але з меншими обчислювальними витратами. Як уже згадувалося, o3-mini стане загальнодоступним раніше, ніж o3.