Придобиване на право на ползване върху данни с цел обучение на AI
Разработването на системи с изкуствен интелект стъпва върху разнообразни по своя правен режим категории данни, чието разграничаване е ключово за законосъобразното им използване.
Изрична и задължителна регулация се прилага при ползване на личните данни, включително псевдонимизирани набори, при които рискът от повторна идентификация остава. Наред с тях често се използват анонимизирани данни, при които идентификацията на лицето е необратимо изключена. В обхвата на правна закрила попадат също обекти на авторско право (текст, изображения, аудио, видео, софтуер) и бази данни, защитени чрез специалното право на производителя поради съществена инвестиция в създаването и поддържането им. Разработчиците работят и с публични данни, включително от регистри и отворени държавни масиви, които могат да се използват повторно при определени условия
Как като разработчик да ползвате законосъобразно и без риск от понасяне на санкции или отговорност спрямо трети лица, която и да е категория от изброените данни?
Представяме ви основните възможности, както и реализирането им съобразно правните институти и норми на ЕС
Придобиване директно на данни от физически лица
Това е първичната конструкция, при която данни се получават директно от физическите лица – например чрез регистрация в услуга, използване на платформа, попълване на профили, качване на съдържание или участие в тестови и изследователски среди.
Ползването на данните се основава на създадените отношенията със субекта въз основа на договор или чрез изричното му съгласие.
Тук ключова роля играят общите условия на услугата и политиките за поверителност, които формират договорната рамка. Чрез тях следва ясно да бъдат уредени едновременно:
правно основание за обработване, ако се предоставят лични данни по GDPR;
право за използване на съдържанието като обект на интелектуална собственост;
избягване на неправомерно използване на търговска тайна.
Изготвянето на изчерпателни и ясни условия за придобиване на данни от субекти превръщат фактическото предоставяне на информация от потребителя в правно допустимо използване за целите на разработка и обучение на AI системи.
Придобиване на данни от друга организация
Често разработчикът получава данни от друга организация, която вече ги е събрала в рамките на своята дейност. При тези случай правната форма за придобиване се определя от категорията на данните и статута на организацията.
Лични или псевдонимизирани данни се споделят и обработват съобразно правилата на GDPR. Основен риск тук е определяне ролята на разработчика по смисъла на регламента – администратор или обработващ. Неправилната квалификация на ролята поставя под съмнение законосъобразността на обработването и е основание за налагане на сериозни санкции
Моделът на съвместни администратори е правилният избор, ако се разработва AI проекти, в които страните съвместно планират обучението на модел, избират категориите данни, определят методите на обработване (вкл. анонимизация, валидиране, филтриране), както и бъдещото използване на резултатите. Отношенията между страните се уреждат със споразумение за съвместни администратори, което освен всички основни елементи на един договор за обработка на лични данни следва да определя
разпределението на задълженията по GDPR между страните.
Ползването на данни като обработващ по смисъла на GDPR е приложимо относно разработчик на AI модели, когато последният действа единствено като технологичен/технически изпълнител на модел по идея и структура на конкретен клиент. Обичайно в този случай разработчикът няма право да използва данните за обучение на други модели или за собствени цели. Отношенията между страните се определят с договор за обработка на лични данни, които освен всичко останало следва да уреди собствеността на данните получени във връзка с обработването, съответно връщане или заличаване на данните след приключване на услугата.
На следващо място като ресурс за създаване на AI модел, много често се използват данни, включително база данни, обект на защита като интелектуална собственост или търговска тайна. Законосъобразното им ползване изисква съобразяване със законодателството за защита на авторското право и търговското ноу хау.
Страните уговарят условията за ползване с договор за лиценз на данни, с който една организация предоставя на друга право да използва определен набор от данни като ресурс, без да прехвърля собственост, а само разрешение за конкретни начини на употреба. Специфично съдържание на тези споразумения е обхвата на ползването, собствеността върху данните и производните резултати, възможни ограничения за комбиниране с други набори.
В практиката по разработване на AI модели правото на ползване на данни рядко се отнася до една единствена категория информация – много по-често наборите са смесени данни, които включват едновременно лични данни, обекти на интелектуална собственост, елементи на защитени бази данни и потенциално търговска тайна. Независимо, че спрямо тях се прилага различна правна регулация, като основание за използването им следва да се търси не в отделни договори за всяка правна материя, а в единно, многопластово споразумение, което едновременно урежда ролите по защитата на личните данни, лицензионните права върху съдържанието и базите данни, както и режима на конфиденциалност.

