Иллюзия разума. Правда об искусственном интеллекте - страница 3




Как это работает:

– Вы показываете системе тысячи помеченных изображений: «это кошка», «это собака»;

– Нейросеть настраивает веса, чтобы минимизировать ошибки;

– Когда ошибок становится мало – модель готова.


Примеры из жизни:

– Распознавание спама в почте (письма помечены как «спам/не спам»);

– Медицинская диагностика по снимкам (с указанием, где есть опухоль);

– Прогнозирование цен на жильё (на основе исторических данных).


«В 90% коммерческих проектов мы используем Supervisedlearning, – отмечает Эрик Вандерсен. – Это надёжно, но требует тысячи размеченных данных. Иногда разметка стоит дороже, чем сама разработка модели.»


2. Обучение без учителя (Unsupervised Learning)

Здесь нейросеть получает только сырые данные без подсказок – как ребёнок, который сам догадывается, что мячи бывают круглые, а кубики квадратные.


Как это работает:

– Система ищет скрытые закономерности в данных;

– Группирует похожее (кластеризация);

– Выявляет аномалии или сокращает размерность данных.


Примеры из жизни:

– Сегментация клиентов (без заранее заданных категорий);

– Поиск неочевидных связей в финансовых транзакциях;

– Сжатие данных (например, уменьшение размерности изображений).


Личное наблюдение

Когда я впервые увидел, как unsupervised-алгоритм без подсказок разделил статьи из новостной ленты на темы (политика, спорт, технологии), это напомнило мне, как человек интуитивно группирует предметы в комнате.


3. Почему это важно?

– Обучение с учителем даёт точные результаты, но требует дорогой разметки;

– Обучение без учителя экономнее, но менее предсказуем;

– В реальных проектах часто комбинируют оба подхода.


Но как нейросети применяют на практике? Где граница между академическими экспериментами и реальными технологиями?


GPT, StableDiffusion, AlphaGo – как нейросети переосмыслили реальность

Когда в 2016 году AlphaGo сделала тот самый 37-й ход в партии против Ли Седоля, весь мир замер. Профессиональные игроки сначала решили, что это ошибка – такой ход не встречался за четыре тысячелетия истории го. Но к концу игры стало ясно: нейросеть открыла новую стратегию, неочевидную для человеческого мышления. Этот момент прекрасно иллюстрирует, как современные нейросети, будучи созданными человеком, начали превосходить его в отдельных областях.

Возьмем GPT – языковую модель, которая перевернула наше представление о работе с текстом. В её основе лежит простая на первый взгляд идея: предсказывать следующее слово в последовательности. Но масштаб реализации делает её революционной. Обрабатывая триллионы слов, GPT выявляет сложнейшие языковые паттерны, учится стилистическим нюансам и даже имитирует творческий процесс. При этом она не понимает текст в человеческом смысле – просто невероятно точно угадывает статистические взаимосвязи. Это, как если бы кто-то выучил наизусть все книги в библиотеке и научился бесконечно комбинировать фразы, сохраняя видимость смысла.

StableDiffusion предложил совершенно иной подход к генерации изображений. В отличие от GPT, работающей с дискретными токенами4, эта модель оперирует в непрерывном пространстве изображений. Процесс напоминает художника, который начинает с хаотичных мазков и постепенно уточняет их, сверяясь с текстовым описанием. Особенно поражает, как система научилась соединять абстрактные концепции – например, визуализировать «любовь в стиле киберпанк» или «экзистенциальный ужас в акварели». При этом каждый такой запрос раскрывает удивительный факт: нейросеть не оперирует смыслами, а лишь устанавливает сложные корреляции между фрагментами текста и элементами изображений.