Математики проиграли битву ИИ — он быстрее, умнее и увереннее

В середине мая в калифорнийском Беркли состоялось закрытое мероприятие, объединившее тридцать признанных математиков со всего мира. Целью этой встречи было проверить интеллектуальные способности чат-бота o4-mini — новой языковой модели от OpenAI, обладающей развитым логическим аппаратом. Как сообщает Scientific American, ученым было предложено составить задачи, которые бы оказались не по зубам даже такой продвинутой системе. Итоги этого своеобразного соревнования удивили даже самых скептически настроенных участников: оказалось, что искусственный интеллект уже способен конкурировать с профессионалами высочайшего уровня.

Инициатором эксперимента стала некоммерческая организация Epoch AI, специализирующаяся на оценке прогресса крупных языковых моделей. Для испытания возможностей o4-mini был подготовлен набор из 300 оригинальных математических задач различной сложности. Если предыдущие версии ИИ успешно решали менее 2% подобных примеров, то новая модель продемонстрировала качественный скачок, справившись почти с 20% заданий. Однако наиболее значимым этапом стал финальный тур, в рамках которого участники встречи должны были придумать десять принципиально сложных задач. Каждая из них сулила награду в размере 7500 долларов при условии, что нейросеть окажется неспособной выдать корректное решение.

Особый резонанс вызвал случай с математиком Кеном Оно из Университета Вирджинии, который возглавлял мероприятие. Увидев, с какой легкостью ИИ разбирается с предложенными задачами, он решился на отчаянный шаг — дал чат-боту открытую научную проблему из области теории чисел, которую обычно включают в докторские диссертации. Реакция машины стала откровением: за десять минут она самостоятельно изучила соответствующие научные источники, решила упрощенную версию задачи, а затем представила оригинальное и корректное решение, отметив, что оно не заимствовано, а получено в ходе собственных вычислений.

После этого эпизода Кен Оно признал, что нейросеть действует как настоящий исследователь, демонстрируя не просто алгоритмическое поведение, а мышление, близкое к человеческому. Хотя в итоге математикам удалось найти десять задач, которые ИИ не смог решить, масштабы его интеллектуального прогресса вызвали всеобщее удивление. Некоторые сравнили взаимодействие с o4-mini с работой с одаренным аспирантом, который во многом превосходит своих преподавателей.

Еще одним фактором, вызвавшим обеспокоенность, стала скорость работы ИИ. Там, где человеку требуются недели размышлений и проверок, нейросеть справляется за минуты. Ученые отметили и потенциальную опасность чрезмерного доверия: модель излагает свои рассуждения с такой уверенностью, что может ввести в заблуждение даже опытного математика. Это явление, которое участники назвали «доказательством через устрашение», способно привести к принятию ошибочных выводов без должной проверки.

На завершающей дискуссии ученые заговорили о трансформации роли математика в условиях стремительного развития искусственного интеллекта. Всё больше специалистов приходит к выводу, что в будущем человек может стать научным куратором для ИИ — направлять его, ставить задачи и интерпретировать полученные открытия. По мнению Кена Оно, игнорировать потенциал подобных технологий — значит упустить важнейший этап в развитии науки.

Мне нравится

Математики проиграли битву ИИ — он быстрее, умнее и увереннее

Удивляйтесь каждый день