По-рано този месец ръководители на Google DeepMind на Alphabet, Microsoft и Meta Platforms се присъединиха към основателите на технологични компании в Бангалор, за да наблюдават как един от най-добрите стартъпи за изкуствен интелект (AI) в Индия представя нов продукт, който може да промени начина, по който най-населената страна в света използва технологията, пише Bloomberg.
Sarvam AI, често описванa като "индийския OpenAI", представи софтуер за фирми, който може да взаимодейства с клиенти, използвайки глас, а не само текст. Технологията е разработена с данни на 10 местни индийски диалекта и се предлага на цена от рупия за минута с цел да завладее пазара. Във видео на събитието Винод Косла - милиардер, рисков инвеститор и инвеститор в Sarvam, казва: „Тези гласови ботове имат потенциала да достигнат до 1 млрд. души.“
Индия се опитва да бъде в крак с глобалната еуфория по изкуствения интелект през почти двете години от пускането на ChatGPT, но чатботовете често са ограничени от липсата на данни на много от езиците в страната. Мнозина, които живеят в големите градове, могат да въвеждат подкани към чатботовете на английски, но на по-голямата част от Индия ѝ липсват езиковите умения за това. Сега нарастващ брой стартъпи залагат, че гласовите ботове, създадени с данни на местен език, могат да достигнат до по-широка част от Индия и може би дори да се харесат на потребители в други страни.
По този начин тези стартиращи компании могат да превърнат Индия в тестова площадка за това, което може да е следващия фронт на пазара на продукти с генеративен изкуствен интелект, макар и такава, която повдига някои опасения за безопасността на други пазари. Чрез включването на AI гласови функции, технологичните компании се надяват да създадат по-динамични, разговорни услуги, които могат да отговарят на потребителите вербално в реално време и да автоматизират определени задачи. В Индия това вече се прилага в широк спектър от потребителски и бизнес приложения.
Подкрепената от Samsung Gnani AI извършва милиони гласови разговори всеки ден за най-големите банки, застрахователи и автомобилни компании в Индия. CoRover AI предлага гласови ботове на 14 индийски диалекта на държавната железопътна корпорация и регионална полиция. А гласовият бот на Haloocom Technologies може да говори на пет индийски диалекта, за да се справя със задачи по обслужване на клиенти и да помага при проверката на кандидатите за работа.
Според Анкус Сабхарвал, съосновател и главен изпълнителен директор на CoRover, гласът е „най-интуитивният начин за използване на технологията“.
Гласовият бот Ash Disha на CoRover беше пуснат този месец за индийската компания за резервации на влакове IRCTC. Ботът може да резервира билети за влак и да завършва плащания от името на клиентите изцяло чрез гласови команди. Страната се нуждае от AI агенти, които могат да извършват задачи, не само да предоставят информация, казва Сабхарвал.
Gnani предлага бот, който помага на заемодателите да разговарят с потенциални клиенти, за да разберат техните финансови нужди, да събират лична информация и да определят дали отговарят на изискванията за заеми. Стартъпът също така работи с един от най-големите производители на автомобили в Индия, Tata Motors, за да получи обратна връзка за най-новите модели автомобили и да продава разширени гаранции и аксесоари.
Гласовите ботове на Sarvam могат да обработват разговори на различни езици и да предприемат действия от името на клиентите, като например назначаване на срещи и улесняване на плащанията. Компанията има около 50 клиента, включително Sri Mandir, приложение, което има повече от 10 млн. изтегляния в Play Store. Използвайки гласовия софтуер на Sarvam, приложението Sri Mandir може да насочва хората към конкретни ритуали в различни храмове и как да поискат различни видове благословии.
Нещо подобно не би могло да се изпълни от ChatGPT или Claude, смята Вивек Рагаван, съосновател на Sarvam, визирайки модерните AI модели на OpenAI и Anthropic. По думите му американските компании нямат достъп до достатъчно данни за говоримия индийски език, включително акцентите и диалектите, които варират в различните региони.
Някои водещи компании за изкуствен интелект в САЩ, включително OpenAI, разработиха технология, която може да генерира убедителни гласове, но я пускат бавно на пазара. Наскоро OpenAI предупреди, че потребителите могат да станат емоционално зависими от нейния гласов продукт и също така заяви, че е предприела стъпки за предотвратяване на имитирането и генериране на защитено с авторски права аудио. Стартъпът започна да предлага нови гласови функции за ограничен брой потребители след известно забавяне.
Въпреки опасенията индийските AI стартъпи са оптимисти за технологията. „AI, създаден за специфични случаи на употреба, езици и аудитории, е по-точен, по-евтин за работа и има значително по-малко халюцинации“, казва Ганеш Гопалан, съосновател и главен изпълнителен директор на Gnani, използвайки термин, който се отнася до системи с изкуствен интелект, измислящи факти.
Въпреки че тези стартъпи са фокусирани върху Индия, някои отправят поглед и към международни пазари, включително Близкия изток и Япония. Всъщност гласовите ботове на Gnani вече са разположени в предверието на Силициевата долина, помагайки на голяма калифорнийска лизингова компания да достигне до испаноговорящи клиенти.