От роботите може да станат чудесни журналисти. Ако не вярвате, помислете върху това: много е вероятно от години да четете текстове, създадени от компютърен софтуер, а не от човек, пише технологичното издание Mashable.
Независимо дали става въпрос за резюме на спортно събитие, метеорологична прогноза за времето, отчет на застрахователна компания или техническите данни на някой автомобил, не е изключено текстът да е дело на Wordsmith. Това е базирана в облака софтуерна платформа, която има изкуствен интелект. Тя борави с огромни количества информация, която анализира и структурира в милиони статии годишно, разчитайки на предварително зададени стилно-езикови правила.
Софтуерът е дело на базираната в Северна Каролина компания Automated Insights, чийто главен изпълнителен директор Роби Алън преди е работил за софтуерния гигант Cisco. Наскоро компанията сключи голям договор с информационната агенция Associated Press за произвеждането на автоматично генерирани текстове за финансовите отчети на големите компании. AP са придобили и част от компанията. Според Алън софтуерът ще помогне на агенцията да създава 15 пъти повече такива статии през всяко тримесечие на годината.
Първите автоматично генерирани текстове на AP трябва да бъдат публикувани още през този месец.
Интересното в случая е, че това не е първата сделка от такъв тип в света. Конкурентната компания Narrative Science вече “пише” счетоводни материали за бизнес изданието Forbes.
Всичко, което Wordsmith прави, за да създаде текст, който в много случаи не се различава по нищо от тези, написани от хората, е базирано на информация. Специално в случая на AP софтуерът извлича числа от корпоративните прессъобщения, пратени до редакционната поща, след което ги комбинира с историческа финансова информация за съответната компания, която набавя от базата данни на чикагската анализаторска къща Zacks.
“Обикновено, за да е пълноценен един текст, в него трябва да има и малко история,” казва Алън.
Wordsmith черпи информация и от базираната в облака услуга на Amazon – AWS, откъдето получава достъп до хиляди сървъри. Така системата може за секунди да подготви техническите спецификации за най-новия модел автомобил или да опише случилото се в завършилия преди минути футболен мач.
AWS помага на Automated Insights да контролира разходите си. “Използваме сървърите за два часа, след което преустановяваме връзката с тях, като по този начин плащаме само за тези два часа достъп до информация,” казва Алън.
Трудно е да се създаде приятен и достъпен за четене текст само от суха информация. Алън казва за Mashable, че компанията му работи усилено по подобряването на изреченията и параграфите, които Wordsmith създава, както и по стила на написания текст. “Всеки път, когато работим по нов проект, казвам на екипа си да се увери, че крайният продукт не звучи изкуствено”.
Wordsmith може да пише и заглавия. По-сложен е обаче казусът с реда под заглавието/заглавията, който разкрива автора на материала. Компании като AP ще подписват автоматично генерираните текстове с името на агенцията, но други “също толкова важни клиенти” не биха желали читателите им да знаят, че съдържанието е написано от софтуер. В такива случаи Automated Insights ще въведе съответните промени в програмния код на Wordsmith, за да може софтуерът да използва псевдоним или просто да не подписва материалите си.
През 2013 г. Wordsmith e написал 300 милиона статии – повече от големите международни агенции взети заедно. През 2014 г., Automated Insights, в която в момента работят 35 души, очаква да произведе 1 милиард журналистически материала. И тук идва големият проблем пред софтуера. Когато пишеш 5 милиона истории всяка седмица, пита Алън, как избягваш повторенията?
Wordsmith процедира така, както човек би постъпил – променя структурата на текста, използва различна фразеология и исторически факти, където е възможно. Работата на софтуера е толкова добра, че при направено изследване от учени в областта на лингвистиката е станало ясно, че текстовете почти не се различават от тези, написани от хора.
Automated Insights работи по разширяване на дейността си. Софтуерът на компанията може да отговаря на хиляди любопитни въпроси, свързани с всеки голям спортен отбор в Щатите. В момента тя води и преговори с управата на различни области в страната за осигуряването на информация за случващото се в различни училища, както и за достъп до криминалната хроника.
От компанията уточняват, че Wordsmith няма за цел да открадне работата на журналистите. “Това, което искаме, е чисто и просто да увеличим капацитета на информационните агенции,” казва Алън. Хората, които са работили по прессъобщенията от фирмите в АP, ще продължат да си вършат работата, но ще могат да използват Wordsmith за допълнителна информация или за оформянето на по-скучната част от материала, след което човекът ще обогатява текста.
Визията на Алън и екипа му не е да създадат легиони от роботи, които да бълват информация за масите. Целта на Automated Insights е да разработи инструменти, които да променят и оптимизират различни индустрии. “В следващите 5 години ролята на анализа и изучаването на информацията ще бъде много по-различна от днес,” казва Алън.
Хората, занимаващи се с информационен анализ, ще започнат да програмират системите, които задвижват програми като Wordsmith, които пък ще извършват самия анализ.
Според Алън автоматизираното създаване на новини има потенциала да бъде много по-персонализирано към всеки отделен човек, нещо което традиционните медии и журналисти нямат ресурса да правят в голям мащаб.