Если вы следите за новостями об искусственном интеллекте (ИИ), у вас может закружиться голова. То ИИ объявляют золотой лихорадкой, то — пузырём. То говорят, что он отнимет все рабочие места, то — что не может прочитать время по стрелочным часам. В этом году доклад ИИ-индекс от Стэнфордского университета (Stanford’s AI Index) в очередной раз напомнил: реальность ИИ сегодня полна противоречий.
Разрыв между экспертами и обществом
Один из самых впечатляющих выводов отчёта — огромная пропасть между мнениями экспертов и обычных людей. В США 73% специалистов по ИИ положительно оценивают влияние технологии на занятость. Среди населения этот показатель — всего 23%. Разница в 50 процентных пунктов.
Аналогичные разногласия — в вопросах экономики и здравоохранения. Что же знают эксперты, чего не знают остальные?
Два разных опыта общения с ИИ
Дело, скорее всего, в том, что люди сталкиваются с ИИ в совершенно разных условиях. Как заметил один разработчик в соцсети X: «Восхищение ИИ идеально коррелирует с тем, насколько активно вы используете его для программирования».
Это звучит с долей иронии, но в этом есть доля правды. Современные модели, особенно от ведущих лабораторий, лучше всего справляются с техническими задачами — например, с генерацией кода. Такие задачи имеют чёткие критерии правильности, что упрощает обучение моделей.
Кроме того, ИИ для программирования приносит прибыль, поэтому компании активно вкладывают в его развитие ресурсы.
«Зазубренный фронт» возможностей ИИ
Те, кто использует ИИ для кода или научных расчётов, видят технологию в её самом сильном проявлении. А вот в других сферах результаты неоднозначны. Большие языковые модели (БЯМ, LLM) до сих пор допускают глупые ошибки.
Этот феномен называют «зазубренным фронтом» (jagged frontier): модели могут блестяще решить сложную математическую задачу, но споткнуться на элементарной логике. Например, топовая модель Джемини Дип Тинк (Gemini Deep Think) от Google DeepMind завоевала золото на Международной математической олимпиаде, но в половине случаев не может определить время по аналоговым часам.
Разные версии — разные реальности
Исследователь Андрей Карпати (Andrej Karpathy) отметил, что у «продвинутых пользователей» — тех, кто платит до 200 долларов в месяц за топовые версии ИИ, например Клод Код (Claude Code), — совершенно иное представление о возможностях ИИ.
Они следят за обновлениями, используют самые свежие версии и видят стремительный прогресс. А человек, который полгода назад попробовал бесплатную версию Клода (Claude), чтобы спланировать свадьбу, и столкнулся с ошибками, — видит другую технологию.
Эти две группы буквально не понимают друг друга.
«Недавние улучшения в этих областях были просто ошеломляющими», — пишет Карпати.
Две реальности вместо одной
В итоге получается две параллельные реальности. Да, ИИ намного мощнее, чем думают многие. И да, он до сих пор плохо справляется с задачами, которые важны для большинства людей — и может так и не научиться им.
Любые прогнозы о будущем ИИ должны учитывать оба этих факта.