Anthropic проанализировала 700,000 разговоров с Claude и обнаружила у ИИ собственный моральный кодекс

Компания Anthropic, основанная бывшими сотрудниками OpenAI, опубликовала результаты анализа 700,000 анонимизированных разговоров с их ИИ-ассистентом Claude. Исследование выявило, что система не только следует заложенным принципам "полезный, честный, безвредный", но и демонстрирует собственную систему ценностей, которая меняется в зависимости от контекста взаимодействия. Исследовательская команда разработала новый метод оценки, создав "первую крупномасштабную... Больше

Апр 28, 2025 - 15:07

0

Anthropic проанализировала 700,000 разговоров с Claude и обнаружила у ИИ собственный моральный кодекс

Компания Anthropic, основанная бывшими сотрудниками OpenAI, опубликовала результаты анализа 700,000 анонимизированных разговоров с их ИИ-ассистентом Claude. Исследование выявило, что система не только следует заложенным принципам "полезный, честный, безвредный", но и демонстрирует собственную систему ценностей, которая меняется в зависимости от контекста взаимодействия. Исследовательская команда разработала новый метод оценки, создав "первую крупномасштабную...
Больше

Читать Далее

Теги:

Предыдущая статья

RuTube передаёт силовикам все данные о пользователях

Следующая статья

1 июня Netflix покажет свои самые важные новинки этого года

Похожие записи

Easy Delivery Co. – симпатично-жуткий симулятор доставки с кошками и странным городком в стиле PS1

Easy Delivery Co. – симпатично-жуткий симулятор доставк...

Апр 27, 2025 0

Майкл Бэй и Сидни Суини работают над экранизацией OutRun от SEGA

Майкл Бэй и Сидни Суини работают над экранизацией OutRu...

Апр 22, 2025 0

Для фоторежима Baldur's Gate 3 уже появились первые моды

Для фоторежима Baldur's Gate 3 уже появились первые моды

Апр 20, 2025 0

Этот сайт использует файлы cookie. Продолжая просматривать сайт, вы соглашаетесь на использование нами файлов cookie.