Компанията майка на Facebook – Meta Platforms, пусна модел с изкуствен интелект, способен да превежда и транскрибира реч на десетки езици. Той има потенциала да бъде съществена част от инструменти, които позволяват комуникация в реално време на различни езици, предава Ройтерс.
В публикация в блога си компанията пише, че моделът SeamlessM4T ще поддържа преводи между текст и реч на близо 100 езика, както и пълен превод „говор към говор“ на 35 езика, като комбинира технология, която преди е била достъпна само в отделни модели.
Главният изпълнителен директор Марк Зукърбърг предвижда, че подобни инструменти ще улесняват взаимодействието между потребителите по целия свят в метавселената – набор от взаимосвързани виртуални светове, на които той залага бъдещето на компанията.
Meta прави модела достъпен за обществеността за некомерсиална употреба, гласи още публикацията в блога.
Най-голямата социална мрежа в света пусна вълна от предимно безплатни модели с изкуствен интелект през миналата година, включително голям езиков модел, наречен Llama, който представлява сериозно предизвикателство за патентованите модели, продавани от OpenAI и Google.
Зукърбърг твърди, че една отворена AI екосистема работи в полза на Meta, тъй като компанията може да спечели повече от това.
Независимо от това, Meta е изправена пред подобни правни въпроси като останалата част от индустрията що се касае до данните за обучение, които се ползват при създаването на нейните модели.
През юли комикът Сара Силвърман и двама други автори заведоха дела за нарушаване на авторските им права срещу Meta и OpenAI, обвинявайки компаниите, че използват техни книги като данни за обучаване без позволение.
За модела SeamlessM4T изследователите на Meta посочват, че са събрали аудиоданни за обучение от 4 млн. часа от „сурово аудио, идващо от публично достъпно хранилище на уеб данни“, без да уточняват кое е то.
Говорител на Meta не е отговорил на въпрос относно произхода на аудиоданните.
Текстовите данни са от масиви от информация, създадени миналата година, които извличат съдържание от Wikipedia и свързани уебсайтове, посочват още изследователите.