Следващата голяма стъпка на AI - да слезе от облака

Големите езикови модели може би ще отстъпят място на по-малки, работещи на потребителски устройства

Изминаха две години, откакто ChatGPT дебютира публично, като даде началото на прилив на инвестиции в генеративния изкуствен интелект (AI). Еуфорията доведе до скок на оценките на стартъпи като OpenAI, разработчикът на популярния чатбот, както и на технологични гиганти, чиито платформи за облачни изчисления обучават и хостват моделите, на които са базирани тези услуги. Сегашният бум вече показва признаци на пропукване. Следващата фаза на растеж на AI може да е в ръцете ви, пише Робин Мак за Ройтерс.

Т. нар. генеративен AI, при който моделът създава ново съдържание въз основа на данните, върху които е обучен, днес до голяма степен съществува в облака. OpenAI например използва платформата Azure на Microsoft, за да обучава и управлява своите големи езикови модели. Всеки с интернет връзка може да направи заявка в ChatGPT, използвайки центровете за данни на Azure по целия свят. Но тъй като моделите стават все по-големи и по-сложни, се развива и инфраструктурата за тяхното обучение и обработка на заявки от потребителите.

Резултатът е борба за изграждане на по-големи и по-мощни центрове за данни. OpenAI и Microsoft например преговарят за проект за център за данни, който трябва да стартира през 2028 г. и се очаква да струва колосалните 100 млрд. долара според The Information.

Като цяло Alphabet, Microsoft и Meta Platforms, която притежава Instagram и Facebook, се очаква да направят капиталови разходи за общо 160 млрд. долара през следващата година, сочат данни на LSEG. Това е с три четвърти повече спрямо сумата за 2022 г. По-голямата част от сумата ще отиде за графичните процесори на Nvidia, струващи по 25 хил. долара, както и за друга свързана инфраструктура за обучение на моделите. Главният изпълнителен директор на Nvidia Дженсън Хуанг прогнозира, че инвестициите в центрове за данни ще се удвоят до 2 трлн. долара в следващите четири до пет години.

Тези суми повдигат неудобни въпроси за това доколко въпросното ниво на разходи е устойчиво и дали чатботовете и другите приложения могат да донесат достатъчно приходи, за да генерират положителна възвръщаемост на тези зашеметяващи инвестиции.

Компаниите също така се борят с предизвикателството да намерят земя за нови центрове за данни и да осигурят достатъчно електроенергия за захранване и охлаждане на чиповете. Доминацията на технологичните гиганти в големите езикови модели и облачните изчисления привлича и повече контрол от страна на регулаторите. Миналата година Microsoft, Amazon и Google отговаряха за 58% от глобалните доставки на AI сървъри, показва анализ на Morgan Stanley.

Тези фактори обясняват най-новия моден технологичен израз: „edge AI”. Тази фраза се отнася до алгоритми и модели, които работят на смартфони или персонални компютри в периферията на мрежата, а не на централизирана сървърна ферма.

Този подход има няколко предимства пред базирания в облак AI. Потребителите ще получават отговори на своите устройства в реално време, без да е необходима високоскоростна интернет връзка. Техните лични данни също ще останат на устройството, вместо да бъдат предадени на сървър, собственост на трета страна. И като се има предвид повсеместното разпространение на мобилни телефони и компютри, навлизането на този подход може да бъде бързо. Анализаторите от UBS смятат, че близо 50% от смартфоните, приблизително 583 млн. бройки, ще имат генеративни AI възможности до 2027 г., спрямо едва 4% през 2023 г.

Следващата голяма стъпка на AI - да слезе от облака

Албания забранява TikTok за поне една година

Google: Планът за продажбата на Chrome е прекален

Следващата голяма стъпка на AI - да слезе от облака

"Умората от AI" застигна акциите на Microsoft

Мартин Гисвайн: Ефектът от изкуствения интелект ще е подобен на този от смартфоните

Албания забранява TikTok за поне една година

Google: Планът за продажбата на Chrome е прекален