Десетки милиони хора използват интелигентни високоговорители и техния гласов софтуер, за да играят игри, да намират музика или да търсят любопитни факти. Но много повече хора не са склонни да канят устройствата и техните мощни микрофони в домовете си поради безпокойството, че някой може да ги слуша. А понякога се случва точно това.
Американският концерн Amazon.com Inc. използва хиляди хора по целия свят, за да подобри дигиталния асистент на Alexa, използвайки линията си във високоговорителите Echo. Екипът слуша гласови записи от домовете и офисите на собствениците на джаджата, предава Bloomberg. Записите се транскрибират, анотират и след това се връщат обратно в софтуера, като част от усилията за премахване на пропуските в разбирането на Alexa за човешката реч и за по-доброто реагиране на команди.
Процесът за преглед на гласа на Alexa, описан пред агенцията от седем души, които са работили по програмата, подчертава често пренебрегваната роля на човека в алгоритмите за обучение на софтуерите. В маркетинговите си материали Amazon подчертава, че Alexa „живее в облака и винаги става по-умна”. Но както много софтуерни инструменти, създадени, за да се учат от опита, хората осъществяват част от преподаването.
Екипът включва смесица от външни изпълнители и служители на щат на Amazon, които работят в офиси по целия свят - от Бостън до Коста Рика, Индия и Румъния. Те работят по девет часа на ден, като всеки рецензент анализира до 1000 аудиозаписа за смяна, поясняват двама служители, базирани в офиса на Amazon в Букурещ, който заема първите три етажа на сградата Globalworth в новия квартал Pipera на румънската столица. Съвременното съоръжение се откроява сред разрушаващата се инфраструктура, но на него няма никакъв външен знак, който да анонсира присъствието на Amazon.
„Служителите нямат пряк достъп до информацията, която идентифицира лицата или акаунтите в процеса", пояснява Amazon в изявлението си за Bloomberg. Според агенцията обаче на екранна снимка на подобна транскрипция се вижда номер на акаунт, име на потребителя и сериен номер на устройството. Групата заяви, че цялата информация е строго поверителна и че работи с ограничения за достъпа и с криптиране.
От информацията на Amazon за Alexa все пак не е изрично ясно, че може и хора да слушат записите. „Например, ние използваме вашите команди към Alexa, за да обучаваме системите за разпознаване на реч и естествен език", се казва в раздела за въпроси и отговори на сайта на Amazon. В същото време самите потребители могат да възразят срещу по-нататъшното развитие на услугата при настройките за използването на своите записи.