Італія надіслала перший запит на перевірку даних до DeepSeek

0
647 views
Італія надіслала перший запит на перевірку даних до DeepSeek

Журі все ще не вирішило, чи є китайський стартап DeepSeek, що займається розробкою штучного інтелекту, тим, що змінює правила гри, чи частиною ретельно продуманого плану його материнської компанії-хедж-фонду з продажу акцій Nvidia та інших технологічних компаній. Як би там не було (а може, і те, і інше?), DeepSeek та її велика мовна модель здійняли велику хвилю. І тепер вони привертають увагу наглядових органів у сфері захисту даних.

Здається, це перший серйозний крок з боку одного з таких наглядових органів після того, як DeepSeek набув широкого розголосу останніми днями: Euroconsumers, коаліція європейських груп споживачів, подала скаргу до Італійського органу захисту даних щодо того, як DeepSeek обробляє персональні дані відповідно до GDPR, європейської нормативно-правової бази захисту даних.

Італійський DPA підтвердив сьогодні, що згодом надіслав DeepSeek запит на отримання інформації. “A rischio i dati di milioni di persone in Italia”, – зазначає агентство. (“Дані мільйонів італійців під загрозою”.) DeepSeek має 20 днів на відповідь.

Дві ключові деталі про DeepSeek, які багато хто помітив, полягають у тому, що сервіс створений і працює в Китаї. Згідно з політикою конфіденційності, це включає в себе інформацію та дані, які DeepSeek збирає і зберігає, і які також розміщуються в його рідній країні.

У своїй політиці DeepSeek також коротко зазначає, що коли вона передає дані до Китаю з країни, де використовується DeepSeek, вона робить це “відповідно до вимог чинного законодавства про захист даних”.

Але Euroconsumers – організація, яка минулого року виграла справу проти Grok через те, як компанія використовувала дані для навчання свого штучного інтелекту – та італійська DPA вимагають більше подробиць.

Звертаючись до Hangzhou DeepSeek Artificial Intelligence і Beijing DeepSeek Artificial Intelligence, італійська DPA заявила, що хоче знати, які персональні дані збираються, з яких джерел і з якою метою – в тому числі, яка інформація використовується для навчання їхньої системи штучного інтелекту – а також яка правова основа для обробки. Він також хоче отримати більше інформації про сервери в Китаї.

Крім того, у своєму інформаційному запиті вона пише, що хоче знати, “якщо персональні дані збираються за допомогою веб-скрепінгу”, яким чином користувачі, які “зареєстровані і не зареєстровані на сервісі, були поінформовані або поінформовані про обробку їхніх даних”.

Видання MLex зазначає, що Euroconsumers також підкреслює, що немає жодних деталей щодо того, як DeepSeek захищає або обмежує доступ неповнолітніх до своїх послуг, починаючи з перевірки віку і закінчуючи тим, як він обробляє дані неповнолітніх.

(У віковій політиці DeepSeek зазначено, що вона не призначена для користувачів віком до 18 років, хоча не передбачено способу забезпечення дотримання цього правила. Для користувачів віком від 14 до 18 років DeepSeek пропонує прочитати політику конфіденційності разом з дорослими).

Євроспоживачі та італійський наглядовий орган є першою спробою зробити крок проти DeepSeek. Вони можуть бути не останніми, хоча подальші дії можуть бути не такими швидкими.

Раніше сьогодні DeepSeek був головною темою на прес-конференції в Європейській комісії. Томаса Реґньє, речника Комісії з питань технічного суверенітету, запитали, чи є на європейському рівні занепокоєння з приводу DeepSeek, пов’язане з безпекою, конфіденційністю та цензурою. Наразі, однак, основний меседж виявився таким: поки що занадто рано говорити про будь-які розслідування.

“Сервіси, що пропонуються в Європі, поважатимуть наші правила”, – зазначив Реньє у відповідь на запитання про конфіденційність даних, додавши, що Закон про штучний інтелект застосовується до всіх послуг зі штучного інтелекту, що пропонуються в регіоні.

Він відмовився відповісти, чи дотримується DeepSeek цих правил, на думку ЄС, чи ні. Тоді його запитали, чи не суперечить цензура додатку на політично чутливі теми в Китаї правилам свободи слова в Європі і чи заслуговує це на розслідування. “Це дуже ранні стадії, я ще не говорю про розслідування”, – швидко відповів Реньє. “Наша структура досить міцна, щоб вирішити потенційні проблеми, якщо вони виникнуть”.

На запитання TechCrunch, надіслані до ICO у Великій Британії щодо DeepSeek, було отримано схожу відповідь: DeepSeek, по суті, буде піддаватися тій же перевірці, що і будь-який інший розробник GenAI. Але поки що ніяких подальших дій.

“Розробники і впроваджувачі генеративного ШІ повинні переконатися, що люди мають змістовну, стислу і легкодоступну інформацію про використання їхніх персональних даних, а також чіткі та ефективні процеси, що дозволяють людям користуватися своїми інформаційними правами”, – сказав представник компанії. “Ми продовжимо співпрацювати із зацікавленими сторонами щодо просування ефективних заходів прозорості, не ухиляючись від вжиття заходів, коли наші регуляторні очікування ігноруються”.

Тим часом, чи можуть відкритися нові шляхи для регуляторних питань у таких сферах, як авторське право та захист інтелектуальної власності?

Багато хто дивувався тому, як саме існування DeepSeek, схоже, кидає виклик припущенням про реальні витрати на навчання та експлуатацію LLM або сервісу генеративного ШІ: його дешевша інфраструктура і база витрат підривають ідею про те, що створення фундаментального ШІ і запуск додатків генеративного ШІ повинні коштувати цілий статок у вигляді чіпів, використання центрів обробки даних і енергоспоживання.

Але останнім часом дехто почав ставити під сумнів усе це. Microsoft і OpenAI стверджують, що є докази того, що вони частково навчалися на “дистиляціях” з їхніх власних моделей. Якщо це виявиться правдою, це буде дивна іронія долі – з огляду на численні юридичні та інші драми, які розгорнулися навколо того, як деякі розробники LLM нібито ставляться до інтелектуальної власності та авторських прав.

Ми зв’язалися з DeepSeek щодо скарги італійського DPA і будемо оновлювати цю публікацію по мірі надходження додаткової інформації.