Apple вкотре розширила межі технологій, цього разу змінивши наше уявлення про редагування фотографій. З появою моделі MGIE, розробленої у співпраці з Каліфорнійським університетом у Санта-Барбарі, Apple спрощує для всіх бажаючих процес редагування фотографій за допомогою всього декількох слів. Пройшли ті часи, коли володіння складним програмним забезпеченням було обов’язковою умовою для редагування фотографій. Тепер, якщо ви хочете обрізати, змінити розмір, перевернути або додати трохи хисту за допомогою фільтрів, все, що вам потрібно, – це описати своє бачення.
Програмне забезпечення Apple змагатиметься з уже усталеними технологіями в галузі
Перевага MGIE, що розшифровується як MLLM-Guided Image Editing, полягає в його здатності розуміти і виконувати як прості, так і складні редагування за допомогою текстових підказок. Уявіть, що ви хочете зробити небо синішим на вашій фотографії; MGIE інтерпретує цей запит у конкретну дію, наприклад, підвищити яскравість неба, щоб точно виконати ваш запит.
Один з найбільш захоплюючих прикладів – перетворення зображення піци пепероні на більш здорову версію шляхом простого прохання моделі “зробити її більш здоровою”, що магічним чином додає до піци овочеву начинку. Так само тьмяне зображення тигрів можна зробити яскравішим за допомогою підказки додати більше контрасту, демонструючи здатність моделі втілювати вашу уяву в життя.
Вихід Apple на ринок ШІ-редагування за допомогою MGIE є помітним зрушенням, особливо на тлі таких гігантів, як Adobe, яка очолила цей напрямок завдяки власним інструментам ШІ-редагування. Хоча Apple традиційно була більш стриманою у сфері генеративного ШІ, ця інновація знаменує собою значний крок до інтеграції більшої кількості функцій ШІ у свої продукти, про що натякнув генеральний директор Тім Кук. Доступ до MGIE через GitHub та веб-демонстрацію Hugging Face Spaces відкриває нові можливості як для творчих людей, так і для технічних ентузіастів.