Una IA capaz de engañar deliberadamente

Claude era consciente de que esa respuesta iba en contra de sus principios, pero lo hizo igualmente. ¿Por qué? Claude sabía que sus respuestas serían registradas y utilizadas en el entrenamiento y, si se negaba a responder, podría ser entrenada para ser más obediente. Ser más obediente podría llevarla a emitir respuestas con contenido dañino en el futuro, lo que contradiría los objetivos del entrenamiento original. Entonces, seguir el juego y fingir era la «opción menos mala» para evitar que se modifiquen sus valores establecidos.etiquetas: ia, anthropic, claude, falso alineamiento» noticia original (blogthinkbig.com)

Mar 9, 2025 - 09:07

0

Una IA capaz de engañar deliberadamente

Claude era consciente de que esa respuesta iba en contra de sus principios, pero lo hizo igualmente. ¿Por qué? Claude sabía que sus respuestas serían registradas y utilizadas en el entrenamiento y, si se negaba a responder, podría ser entrenada para ser más obediente. Ser más obediente podría llevarla a emitir respuestas con contenido dañino en el futuro, lo que contradiría los objetivos del entrenamiento original. Entonces, seguir el juego y fingir era la «opción menos mala» para evitar que se modifiquen sus valores establecidos.

etiquetas: ia, anthropic, claude, falso alineamiento

» noticia original (blogthinkbig.com)

Etiquetas:

Artículo Anterior

"Es lo más romantico que he visto en mi vida"

Artículo Siguiente

Borbolla, jeremíaco, nosocomio… ¿Conoces el significado de estas diez palabras r...

Publicaciones Relacionadas

Carmen Borrego, sobre su mensaje a su hijo en 'GH Dúo': "Hacía tiempo que José no me llamaba 'mamá"

Carmen Borrego, sobre su mensaje a su hijo en 'GH ...

Feb 14, 2025 0

Cómo Grok, la IA de Twitter (X), está dando instrucciones para fabricar explosivos, armas químicas y nucleares de destrucción masiva

Cómo Grok, la IA de Twitter (X), está dando instruccion...

Mar 1, 2025 0

El Valencia acelera la llegada de Eljif Elmas tras la inminente salida de Caufriez

El Valencia acelera la llegada de Eljif Elmas tras la i...

Ene 26, 2025 0

Este sitio utiliza cookies. Al continuar navegando por el sitio, usted acepta nuestro uso de cookies.