Anthropic запускає інструмент для контролю коду, згенерованого ШІ

0
150 views
Anthropic запускає інструмент для контролю коду, згенерованого ШІ

Що стосується кодування, відгуки колег мають вирішальне значення для раннього виявлення помилок, забезпечення узгодженості коду та поліпшення загальної якості програмного забезпечення.

Поява «vibe coding» — використання інструментів штучного інтелекту, які приймають інструкції, подані простою мовою, і швидко генерують великі обсяги коду — змінила спосіб роботи розробників. Хоча ці інструменти прискорили розробку, вони також привели до появи нових помилок, ризиків для безпеки та незрозумілого коду. 

Рішення Anthropic — це AI-рецензент, призначений для виявлення помилок до того, як вони потраплять у кодову базу програмного забезпечення. Новий продукт під назвою Code Review був запущений у понеділок у Claude Code.

«Ми спостерігаємо значне зростання Claude Code, особливо в корпоративному секторі, і одне з питань, яке нам постійно задають керівники підприємств, — це: тепер, коли Claude Code надсилає безліч запитів на витяг, як я можу переконатися, що вони будуть ефективно перевірені?» — розповіла TechCrunch Кет Ву, керівник відділу продуктів Anthropic. 

Запити на витяг — це механізм, який розробники використовують для подання змін до коду на розгляд, перш ніж ці зміни потраплять до програмного забезпечення. Ву зазначила, що Claude Code значно збільшив обсяг коду, що призвело до зростання кількості запитів на витяг, які стали причиною затримки у випуску коду.

Запуск Code Review компанією Anthropic — спочатку для клієнтів Claude for Teams і Claude for Enterprise у дослідницькій попередній версії — відбувається у вирішальний для компанії момент. 

У понеділок компанія Anthropic подала два позови проти Міністерства оборони у відповідь на рішення відомства визнати Anthropic ризиком для ланцюга поставок. У ході судового розгляду Anthropic, ймовірно, буде спиратися на свій бурхливий розвиток у корпоративному секторі, де з початку року кількість передплатників зросла в чотири рази. За даними компанії, з моменту запуску дохід Claude Code перевищив 2,5 мільярда доларів.

«Цей продукт в основному орієнтований на наших великих корпоративних користувачів, таких як Uber, Salesforce, Accenture, які вже використовують Claude Code і тепер потребують допомоги з величезною кількістю [запитів на витяг], які він допомагає створювати», — сказала Ву.

Вона додала, що керівники розробників можуть увімкнути Code Review, щоб він працював за замовчуванням для кожного інженера в команді. Після увімкнення він інтегрується з GitHub і автоматично аналізує запити на витяг, залишаючи коментарі безпосередньо в коді, що пояснюють потенційні проблеми та пропонують способи їх виправлення.

Ву зазначила, що основна увага приділяється виправленню логічних помилок, а не стилю.

«Це дуже важливо, тому що багато розробників вже бачили автоматизовані відгуки AI і дратуються, коли їх неможливо відразу ж застосувати», — сказала Ву. «Ми вирішили зосередитися виключно на логічних помилках. Таким чином ми виявляємо найважливіші проблеми, які потрібно виправити».

Штучний інтелект пояснює своє міркування крок за кроком, окреслюючи, у чому, на його думку, полягає проблема, чому вона може бути проблематичною і як її можна потенційно виправити. Система позначає серйозність проблем за допомогою кольорів: червоний — найвища серйозність, жовтий — потенційні проблеми, які варто переглянути, і фіолетовий — проблеми, пов’язані з існуючим кодом або історичними помилками. 

Ву сказав, що це робиться швидко та ефективно завдяки паралельній роботі декількох агентів, кожен з яких перевіряє кодову базу з іншої перспективи або виміру. Останній агент агрегує та ранжує результати, видаляючи дублікати та визначаючи пріоритетність найважливіших питань.

Цей інструмент забезпечує легкий аналіз безпеки, а керівники інженерних підрозділів можуть налаштовувати додаткові перевірки на основі внутрішніх найкращих практик. Ву сказав, що нещодавно запущений Anthropic продукт Claude Code Security забезпечує більш глибокий аналіз безпеки. 

Багатоагентна архітектура означає, що це може бути ресурсоємний продукт, сказала Ву. Як і в інших послугах штучного інтелекту, ціноутворення базується на токенах, і вартість варіюється залежно від складності коду, хоча Ву оцінила, що кожна перевірка коштуватиме в середньому від 15 до 25 доларів. Вона додала, що це преміальний досвід, і він є необхідним, оскільки інструменти штучного інтелекту генерують все більше і більше коду. 

«[Перевірка коду] — це щось, що походить від шаленого попиту на ринку», — сказала Ву. «У міру того, як інженери розробляють Claude Code, вони бачать, що тертя при створенні нової функції [зменшується], і вони бачать набагато вищий попит на перевірку коду. Тому ми сподіваємося, що завдяки цьому ми дамо підприємствам можливість будувати швидше, ніж будь-коли раніше, і з набагато меншою кількістю помилок, ніж будь-коли раніше».