Nvidia представи нов модел с изкуствен интелект за генериране на музика и аудио, който може да променя гласове и да генерира нови звуци – технология, насочена към продуцентите на музика, филми и видео игри, предава Ройтерс.
Nvidia, най-големият в света доставчик на чипове и софтуер, използвани за създаване на системи с изкуствен интелект (AI), заяви, че няма планове за незабавно пускане на технологията, която нарича Fugatto, съкращение от Foundational Generative Audio Transformer Opus 1.
Тя се присъединява към други технологии, показани от стартъпи като Runway и по-големи играчи като Meta Platforms, които могат да генерират аудио или видео по текстова подкана.
Софтуерът на Nvidia генерира звукови ефекти и музика по текстово описание, включително нови звуци, например звук от тромпет, но лаещ като куче.
Това, което го прави по-различен от другите AI технологии, е способността му да приема и модифицира съществуващ звук, например като вземе линия, изсвирена на пиано, и я трансформира в изпята от човешки глас, или като взема запис на изговорена дума и променя използвания акцент или изразеното настроение.
„Ако помислим за изкуственото аудио през последните 50 години, музиката сега звучи различно заради компютрите, заради синтезаторите“, коментира Брайън Катанцаро, вицепрезидент приложни изследвания за дълбоко учене в Nvidia. „Мисля, че генеративният изкуствен интелект ще донесе нови възможности на музиката, видео игрите и на хората, които искат да създават неща“.
Въпреки че компании като OpenAI преговарят с холивудски студиа за това дали и как AI може да се използва в развлекателната индустрия, отношенията между технологията и Холивуд станаха особено обтегнати, особено след като холивудската звезда Скарлет Йохансон обвини OpenAI в имитация на нейния глас.
OpenAI и Meta по подобен начин не разкриват кога планират да пуснат публично своите модели, които могат да генерират аудио и видео.
Новият модел на Nvidia е обучен с данни с отворен код, а компанията твърди, че все още обсъжда дали и как да го пусне публично.
„Всяка генеративна технология винаги носи известни рискове, защото хората могат да я използват, за да генерират неща, които бихме предпочели да не правят“, коментира Катанцаро. „Трябва да сме внимателни с това, ето защо нямаме незабавни планове за пускането“.