Meta е обучила изкуствения си интелект с публични данни от Facebook и Instagram

Компанията представи услугата Meta AI на своята конференция Connect

11:46 | 29.09.23 г.

Снимка: David Paul Morris/Bloomberg

Meta Platforms е използвала публични съобщения в Instagram и Facebook, за да обучи части от своите нови виртуални асистенти с изкуствен интелект, но е изключила личните публикации, споделени само със семейството и приятелите, в опит да зачете поверителността на потребителите, коментира пред Ройтерс директорът на компанията, отговарящ за нейните политики.

Освен това Meta не е използвала лични чатове в своите услуги за изпращане на съобщения като данни за обучение на моделите, коментира президентът на Meta по глобалните въпроси Ник Клег в кулоарите на годишната конференция на компанията тази седмица.

„Опитахме се да изключим масиви от данни, в които има голям превес на лична информация“, посочва Клег, допълвайки, че „по-голямата част от данните“, използвани от Meta за обучение, са публично достъпни.

Той цитира LinkedIn като пример за уебсайт, чието съдържание Meta умишлено е избрала да не използва поради опасения за поверителността.

Клег направи коментарите си в момент, в който технологични компании като Meta, OpenAI и Google са критикувани за използването на данни, събрани от интернет без позволение, за да обучат своите модели с изкуствен интелект, за да обобщават информация и да генерират изображения.

Компаниите обмислят как да се справят с личните материали или тези, защитени с авторски права, които попадат в полезрението на моделите, които след това системите с изкуствен интелект могат да възпроизведат. Същевременно се водят редица съдебни дела от автори, обвиняващи подобни модели в нарушаване на техните авторски права.

Meta AI беше най-значимият продукт сред първите ориентирани към потребителите инструменти с изкуствен интелект на компанията, представен от изпълнителния директор Марк Зукърбърг на продуктовата конференция на Meta – Connect. Тази година събитието беше доминирано от разговори за изкуствен интелект, за разлика от минали конференции, които се фокусираха върху добавената и виртуалната реалност.

Meta е създала асистента, използвайки персонализиран модел, базиран на мощния голям езиков модел Llama 2, който компанията пусна за публична търговска употреба през юли, както и нов модел, наречен Emu, който генерира изображения в отговор на текстови заявки.

Новият продукт ще може да генерира текст, аудио и изображения и ще има достъп до информация в реално време чрез партньорство с търсачката Bing на Microsoft.

Публичните публикации във Facebook и Instagram, използвани за обучение на Meta AI, включват както текст, така и снимки, казва Клег.

Тези публикации са ползвани за обучение на Emu за генериране на елементи от продукта, докато чат функциите са базирани на Llama 2, с някои добавени публично достъпни и анотирани масиви от данни, коментира говорител на Meta пред Ройтерс.

Интеракциите с Meta AI освен това могат да бъдат използвани за подобряване на функциите в бъдеще, коментира говорителят.

Клег посочва, че Meta е наложила ограничения за безопаност върху съдържанието, което инструментът Meta AI може да генерира, като забрана за създаване на фотореалистични изображения на публични личности.

Някои компании с инструменти за генериране на изображения улесняват възпроизвеждането на емблематични герои като Мики Маус, докато други са платили за материалите или умишлено са избягвали включването им в данните за обучение.

OpenAI например подписа шестгодишна сделка с доставчика на съдържание Shutterstock това лято за използване на каталозите с изображения, видео и музика на компанията.

Запитан дали Meta е предприела подобни стъпки, за да избегне възпроизвеждането на защитени с авторски права изображения, говорител на Meta посочи новите условия на услугата, забраняващи на потребителите да генерират съдържание, което нарушава поверителността и правата на интелектуална собственост.

Всяка новина е актив, следете Investor.bg и в Google News Showcase.

Последна актуализация:

11:46 | 29.09.23 г.