Иллюзия разума. Правда об искусственном интеллекте - страница 4



Эволюция AlphaGo демонстрирует ещё один важный аспект. Первые версии обучались на партиях профессиональных игроков, имитируя человеческий стиль. Но настоящий прорыв случился с AlphaGo Zero, которая начала с чистого листа и через самообучение открыла принципиально новые стратегии. За несколько дней она прошла путь, на который человечеству потребовались тысячелетия. Особенно показательно, что её стиль игры сначала казался «неестественным» профессионалам, но затем радикально изменил современное понимание го.

Эти три примера раскрывают парадокс современного ИИ. С одной стороны, системы демонстрируют феноменальные результаты в узких областях. С другой – их «понимание» остаётся поверхностным, основанным на статистике, а не на осмыслении. GPT не размышляет о смысле текста, StableDiffusion не испытывает эмоций от создаваемых образов, AlphaGo не чувствует азарта от победы. Они лишь невероятно точно оптимизируют свои функции, создавая иллюзию разумности.

Такой подход порождает удивительные последствия. Когда нейросеть пишет стихотворение или рисует картину, она не следует культурным традициям и не выражает внутреннего состояния. Она вычисляет наиболее вероятные комбинации элементов, которые люди склонны считать осмысленными. Это принципиально иной способ «творчества» – без интенции, но с впечатляющей результативностью.

Но что именно позволяет этим системам достигать таких результатов? Всё дело в том сырье, из которого они строят свои предсказания – огромных массивах человеческого творчества, знаний и опыта. Но здесь же скрываются и главные ограничения – ведь нейросеть не может выйти за рамки того, что уже было создано и зафиксировано людьми.

Глава 3. Данные – «топливо» для ИИ

Почему Big Data5 так важны?

В 2012 году произошёл переломный момент: нейросеть AlexNet, обученная на миллионе изображений из базы ImageNet, впервые показала точность, превосходящую человеческую в задаче распознавания объектов. Это был не просто технический успех – это доказательство простой истины: современный ИИ становится умнее не благодаря хитрым алгоритмам, а благодаря огромным объёмам данных.

Но почему «больше данных» значит «лучше работает»? Представьте, что вы учитесь отличать оливки от винограда. Если вам покажут всего три примера, вы легко ошибётесь. Десять – уже лучше. Сотня – почти безошибочно. Нейросети работают по тому же принципу, только масштаб другой: где человеку хватает десятков примеров, алгоритму требуются миллионы.

Современные модели поглощают данные с ненасытностью, которая поражает воображение. GPT-4 обучалась на триллионах слов – это всё равно что прочитать всю библиотеку Конгресса десятки раз. Системы компьютерного зрения анализируют миллиарды изображений – больше, чем любой человек увидит за всю жизнь. И это не прихоть разработчиков, а фундаментальная необходимость.

Дело в том, что нейросети ищут закономерности в чистом виде – без здравого смысла, без врождённых знаний, без способности к абстракции. Они подобны инопланетянину, который изучает человеческую культуру исключительно через статистику. Чем больше данных, тем точнее выявляются корреляции: какие пиксели чаще встречаются у кошек, какие сочетания слов характерны для поэзии, какие ходы ведут к победе в шахматах.

Однако здесь кроется парадокс. С одной стороны, нейросети достигают невероятной точности именно благодаря масштабам информации. С другой – они остаются «узкими специалистами»: модель, блестяще диагностирующая рак по рентгеновским снимкам, окажется беспомощной перед задачей отличить грустное лицо от весёлого. Она знает только то, чему её научили данные, и ровно в тех границах, которые эти данные определяют.