Аналіз, проведений Epoch AI, некомерційним дослідницьким інститутом ШІ, свідчить про те, що індустрія ШІ, можливо, не зможе ще довго отримувати значний приріст продуктивності від моделей штучного інтелекту, що мислять, як правило, на основі міркувань. Згідно з висновками звіту, вже через рік прогрес від моделей міркувань може сповільнитися.
Моделі міркувань, такі як o3 від OpenAI, за останні місяці призвели до значного покращення результатів у тестах ШІ, зокрема, у тестах, що вимірюють математичні навички та навички програмування. Моделі можуть застосовувати більше обчислень для вирішення завдань, що може покращити їхню продуктивність, але недоліком є те, що їм потрібно більше часу, ніж звичайним моделям, щоб виконати завдання.
Моделі міркувань розробляють, спочатку навчаючи звичайну модель на великій кількості даних, а потім застосовуючи техніку під назвою навчання з підкріпленням, яка ефективно дає моделі “зворотний зв’язок” щодо її рішень складних проблем.
За даними Epoch, поки що передові лабораторії ШІ, такі як OpenAI, не застосовували величезну кількість обчислювальних потужностей на етапі навчання моделей міркувань з підкріпленням.
Це змінюється. OpenAI заявила, що застосувала приблизно в 10 разів більше обчислень для навчання o3, ніж для його попередника o1, і Epoch припускає, що більша частина цих обчислень була присвячена навчанню з підкріпленням. А дослідник OpenAI Ден Робертс (Dan Roberts) нещодавно повідомив, що в планах компанії на майбутнє – пріоритетне навчання з підкріпленням, щоб використовувати набагато більше обчислювальних потужностей, навіть більше, ніж для початкового навчання моделі.
Але все ще існує верхня межа того, скільки обчислень може бути застосовано для навчання з підкріпленням в кожній Епосі.

Image credits: Epoch AI
Джош Ю (Josh You), аналітик Epoch і автор дослідження, пояснює, що приріст продуктивності від стандартного навчання на моделі ШІ наразі збільшується вчетверо щороку, тоді як приріст продуктивності від навчання з підкріпленням зростає вдесятеро кожні 3-5 місяців. Прогрес у навчанні міркувань “ймовірно, зблизиться із загальною межею до 2026 року”, продовжує він.
Аналіз Epoch робить низку припущень і частково спирається на публічні коментарі керівників ШІ-компаній. Але він також доводить, що масштабування моделей міркувань може виявитися складним завданням з інших причин, окрім обчислень, зокрема через високі накладні витрати на дослідження.
“Якщо існують постійні накладні витрати на дослідження, моделі міркувань можуть не масштабуватися настільки, наскільки очікувалося”, – пише Ю. Ю.. “Швидке масштабування обчислень потенційно є дуже важливою складовою прогресу моделей міркувань, тому варто уважно за цим стежити”.
Будь-які ознаки того, що моделі міркувань можуть досягти певної межі в найближчому майбутньому, ймовірно, занепокоять індустрію ШІ, яка інвестувала величезні ресурси в розробку цих типів моделей. Дослідження вже показали, що моделі міркувань, які можуть бути неймовірно дорогими у використанні, мають серйозні недоліки, як-от схильність до галюцинацій, більшу, ніж у деяких звичайних моделей.










