Meta Platforms е използвала публични съобщения в Instagram и Facebook, за да обучи части от своите нови виртуални асистенти с изкуствен интелект, но е изключила личните публикации, споделени само със семейството и приятелите, в опит да зачете поверителността на потребителите, коментира пред Ройтерс директорът на компанията, отговарящ за нейните политики.
Освен това Meta не е използвала лични чатове в своите услуги за изпращане на съобщения като данни за обучение на моделите, коментира президентът на Meta по глобалните въпроси Ник Клег в кулоарите на годишната конференция на компанията тази седмица.
„Опитахме се да изключим масиви от данни, в които има голям превес на лична информация“, посочва Клег, допълвайки, че „по-голямата част от данните“, използвани от Meta за обучение, са публично достъпни.
Той цитира LinkedIn като пример за уебсайт, чието съдържание Meta умишлено е избрала да не използва поради опасения за поверителността.
Клег направи коментарите си в момент, в който технологични компании като Meta, OpenAI и Google са критикувани за използването на данни, събрани от интернет без позволение, за да обучат своите модели с изкуствен интелект, за да обобщават информация и да генерират изображения.
Компаниите обмислят как да се справят с личните материали или тези, защитени с авторски права, които попадат в полезрението на моделите, които след това системите с изкуствен интелект могат да възпроизведат. Същевременно се водят редица съдебни дела от автори, обвиняващи подобни модели в нарушаване на техните авторски права.
Meta AI беше най-значимият продукт сред първите ориентирани към потребителите инструменти с изкуствен интелект на компанията, представен от изпълнителния директор Марк Зукърбърг на продуктовата конференция на Meta – Connect. Тази година събитието беше доминирано от разговори за изкуствен интелект, за разлика от минали конференции, които се фокусираха върху добавената и виртуалната реалност.
Meta е създала асистента, използвайки персонализиран модел, базиран на мощния голям езиков модел Llama 2, който компанията пусна за публична търговска употреба през юли, както и нов модел, наречен Emu, който генерира изображения в отговор на текстови заявки.
Новият продукт ще може да генерира текст, аудио и изображения и ще има достъп до информация в реално време чрез партньорство с търсачката Bing на Microsoft.
Публичните публикации във Facebook и Instagram, използвани за обучение на Meta AI, включват както текст, така и снимки, казва Клег.
Тези публикации са ползвани за обучение на Emu за генериране на елементи от продукта, докато чат функциите са базирани на Llama 2, с някои добавени публично достъпни и анотирани масиви от данни, коментира говорител на Meta пред Ройтерс.
Интеракциите с Meta AI освен това могат да бъдат използвани за подобряване на функциите в бъдеще, коментира говорителят.
Клег посочва, че Meta е наложила ограничения за безопаност върху съдържанието, което инструментът Meta AI може да генерира, като забрана за създаване на фотореалистични изображения на публични личности.
Някои компании с инструменти за генериране на изображения улесняват възпроизвеждането на емблематични герои като Мики Маус, докато други са платили за материалите или умишлено са избягвали включването им в данните за обучение.
OpenAI например подписа шестгодишна сделка с доставчика на съдържание Shutterstock това лято за използване на каталозите с изображения, видео и музика на компанията.
Запитан дали Meta е предприела подобни стъпки, за да избегне възпроизвеждането на защитени с авторски права изображения, говорител на Meta посочи новите условия на услугата, забраняващи на потребителите да генерират съдържание, което нарушава поверителността и правата на интелектуална собственост.