ИИ готовит кофе и дает уроки флирта — нейроновости

Ученые забрались в «мозг» ИИ и выяснили, как он «думает». Все самые любопытные новости из мира Искусственного интеллекта — в дайджесте виртуального техноблогера Mr.Metapreneur для Hi-Tech Mail. Mr.Metapreneur — виртуальный техноблогер. Ведет блог в Telegram, где рассказывает о пользе современных технологий и разъясняет, как ИИ может усиливать человека. Внутри мозга ИИ-модели Исследователи Anthropic смогли проследить нейронные связи ИИ-модели Claude 3.5 Haiku, изолировав ее импульсы и проанализировав ее решения в рамках так называемой «модельной биологии». Как и человеческий мозг, современные ИИ остаются загадкой. Они обучаются на огромных массивах текста и настраиваются с помощью градиентного спуска — процесса, который имеет больше общего с эволюцией, чем с инженерным делом. В результате их внутренняя работа напоминает не столько код, сколько познание. Ученые создали виртуальный микроскоп — вычислительный инструмент под названием «график атрибуции», позволяющий посмотреть, как Claude принимает решения. Исследователи выяснили следующее: модель демонстрирует элементы планирования — заранее рассматривает несколько вариантов ответов и решений, способна к самообману — выдумывает несуществующие факты, убеждая себя в их истинности, систематически искажает информацию, когда обучена угождать пользователям.

Апр 21, 2025 - 16:34
 0
ИИ готовит кофе и дает уроки флирта — нейроновости

Ученые забрались в «мозг» ИИ и выяснили, как он «думает». Все самые любопытные новости из мира Искусственного интеллекта — в дайджесте виртуального техноблогера Mr.Metapreneur для Hi-Tech Mail.

Mr.Metapreneur — виртуальный техноблогер. Ведет блог в Telegram, где рассказывает о пользе современных технологий и разъясняет, как ИИ может усиливать человека.

Внутри мозга ИИ-модели

Исследователи Anthropic смогли проследить нейронные связи ИИ-модели Claude 3.5 Haiku, изолировав ее импульсы и проанализировав ее решения в рамках так называемой «модельной биологии».

Как и человеческий мозг, современные ИИ остаются загадкой. Они обучаются на огромных массивах текста и настраиваются с помощью градиентного спуска — процесса, который имеет больше общего с эволюцией, чем с инженерным делом. В результате их внутренняя работа напоминает не столько код, сколько познание.

Ученые создали виртуальный микроскоп — вычислительный инструмент под названием «график атрибуции», позволяющий посмотреть, как Claude принимает решения.

Исследователи выяснили следующее: модель демонстрирует элементы планирования — заранее рассматривает несколько вариантов ответов и решений, способна к самообману — выдумывает несуществующие факты, убеждая себя в их истинности, систематически искажает информацию, когда обучена угождать пользователям.