Функцію створення зображень у ChatGPT оновлено

0
484 views
Функцію створення зображень у ChatGPT оновлено

Під час прямого ефіру у вівторок генеральний директор OpenAI Сем Альтман оголосив про перше за останній рік велике оновлення можливостей генерації зображень у ChatGPT.

Тепер ChatGPT може використовувати модель GPT-4o компанії OpenAI для створення та модифікації зображень і фотографій. GPT-4o вже давно лежить в основі платформи чат-ботів зі штучним інтелектом, але до цього часу модель могла генерувати та редагувати лише текст, а не зображення.

За словами Альтмана, нативна генерація зображень GPT-4o вже доступна в ChatGPT і Sora, продукті OpenAI для створення відео зі штучним інтелектом, для передплатників Pro-плану компанії вартістю 200 доларів на місяць. OpenAI заявляє, що незабаром ця функція буде доступна користувачам ChatGPT з підпискою Plus і безкоштовно, а також розробникам, які використовують сервіс API компанії.

GPT-4o з виведенням зображень “думає” трохи довше, ніж модель генерації зображень, яку він фактично замінює, DALL-E 3, щоб зробити те, що OpenAI описує як більш точні і детальні зображення. GPT-4o може редагувати існуючі зображення, включаючи зображення з людьми, трансформуючи їх або “домальовуючи” деталі, такі як об’єкти переднього і заднього плану.

Щоб забезпечити нову функцію роботи з зображеннями, OpenAI повідомила Wall Street Journal, що навчила GPT-4o на “загальнодоступних даних”, а також на власних даних, отриманих у результаті партнерства з такими компаніями, як Shutterstock.

Багато постачальників генеративного ШІ розглядають навчальні дані як конкурентну перевагу, тому вони тримають їх і будь-яку інформацію, пов’язану з ними, близько до грудей. Але навчальні дані також є потенційним джерелом судових позовів, пов’язаних з інтелектуальною власністю, що є ще одним стримуючим фактором для компаній, які не бажають розкривати багато інформації.

“Ми поважаємо права художників у тому, як ми створюємо результати, і у нас є політика, яка не дозволяє нам генерувати зображення, що безпосередньо імітують роботи живих художників”, – сказав Бред Лайткап, операційний директор OpenAI, у своїй заяві для журналу.

OpenAI пропонує форму відмови, яка дозволяє авторам вимагати, щоб їхні роботи були видалені з навчальних наборів даних. Компанія також заявляє, що поважає прохання заборонити своїм ботам збирати навчальні дані, в тому числі зображення, з веб-сайтів.

Оновлена функція генерації зображень у ChatGPT з’явилася після того, як Google запустив експериментальний вивід власних зображень для Gemini 2.0 Flash, однієї з флагманських моделей компанії. Ця потужна функція стала вірусною в соціальних мережах – але не обов’язково з найкращих причин. Зображувальний компонент Gemini 2.0 Flash виявився мало захищеним, що дозволило людям видаляти водяні знаки і створювати зображення із зображеннями персонажів, захищених авторським правом.