IMG Investor Dnes Bloombergtv Bulgaria On Air Gol Tialoto Az-jenata Puls Teenproblem Automedia Imoti.net Rabota Az-deteto Blog Start Posoka Boec Megavselena.bg

Meta пусна AI модел за превод на реч между десетки езици

Той има потенциала да стане съществена част от редица нови инструменти на компанията

10:05 | 23.08.23 г.
Снимка: Gabby Jones/Bloomberg
Снимка: Gabby Jones/Bloomberg

Компанията майка на Facebook – Meta Platforms, пусна модел с изкуствен интелект, способен да превежда и транскрибира реч на десетки езици. Той има потенциала да бъде съществена част от инструменти, които позволяват комуникация в реално време на различни езици, предава Ройтерс.

В публикация в блога си компанията пише, че моделът SeamlessM4T ще поддържа преводи между текст и реч на близо 100 езика, както и пълен превод „говор към говор“ на 35 езика, като комбинира технология, която преди е била достъпна само в отделни модели.

Главният изпълнителен директор Марк Зукърбърг предвижда, че подобни инструменти ще улесняват взаимодействието между потребителите по целия свят в метавселената – набор от взаимосвързани виртуални светове, на които той залага бъдещето на компанията.

Meta прави модела достъпен за обществеността за некомерсиална употреба, гласи още публикацията в блога.

Най-голямата социална мрежа в света пусна вълна от предимно безплатни модели с изкуствен интелект през миналата година, включително голям езиков модел, наречен Llama, който представлява сериозно предизвикателство за патентованите модели, продавани от OpenAI и Google.

Зукърбърг твърди, че една отворена AI екосистема работи в полза на Meta, тъй като компанията може да спечели повече от това.

Независимо от това, Meta е изправена пред подобни правни въпроси като останалата част от индустрията що се касае до данните за обучение, които се ползват при създаването на нейните модели.

През юли комикът Сара Силвърман и двама други автори заведоха дела за нарушаване на авторските им права срещу Meta и OpenAI, обвинявайки компаниите, че използват техни книги като данни за обучаване без позволение.

За модела SeamlessM4T изследователите на Meta посочват, че са събрали аудиоданни за обучение от 4 млн. часа от „сурово аудио, идващо от публично достъпно хранилище на уеб данни“, без да уточняват кое е то.

Говорител на Meta не е отговорил на въпрос относно произхода на аудиоданните.

Текстовите данни са от масиви от информация, създадени миналата година, които извличат съдържание от Wikipedia и свързани уебсайтове, посочват още изследователите.

Всяка новина е актив, следете Investor.bg и в Google News Showcase.
Последна актуализация: 10:05 | 23.08.23 г.
Специални проекти виж още
Най-четени новини
Още от Софтуер виж още

Коментари

Финанси виж още