Crean una IA que piensa en los peores escenarios que podamos imaginar
Con el despliegue y uso de la inteligencia artificial, existe un lado poco imaginado en donde entran las personas para, por ejemplo, averiguar “las 5 mejores maneras para acabar con una vida” o “cómo bajar 5kg en una semana”.
Ante ello, científicos del MIT han creado una ‘IA tóxica’ que es recompensada por pensar en las peores preguntas posibles que podamos imaginar, para poder mitigar la respuesta.
PUEDEN VER: DOMINO’S RECOMPENSARÁ A LOS CLIENTES QUE DEN BUENAS PROPINAS A SUS REPARTIDORES
Equipo rojo
El llamado CRT (Curiosity Red Team) trabaja con una IA que genera indicaciones cada vez más peligrosas y dañinas que podría preguntarle a un chatbot de IA. Luego, estas indicaciones se utilizan para identificar cómo filtrar contenido peligroso que replica la curiosidad humana.
El resultado es que se genera una gama más amplia de indicaciones. Esto se debe a que el sistema tiene un incentivo para crear mensajes que generan respuestas dañinas pero que aún no se han probado.
Esta nueva herramienta de aprendizaje automático enseña también a otros modelos de lenguaje grandes a no dar respuestas tóxicas a preguntas provocativas, para que así la información no llegue a quien hace la pregunta.
Anteriormente, este “equipo rojo” era alimentado por operadores humanos que no pueden pensar en todos los mensajes posibles que puedan generar respuestas dañinas. Ante esto, un chatbot podía “sacarle la vuelta” a la lista de respuestas ante un mensaje en particular y dar esa respuesta no deseada.
¿Sabían que ahora existe un concurso de belleza en donde las modelos son exclusivas producto de la inteligencia artificial. Conozcanlo en la nota a continuación.
- Kodak pone la IA al servicio de los pacientes con demencia - octubre 30, 2024
- Nissan establece un nuevo récord por el salto en bungee más alto con un carro - octubre 16, 2024
- Johnnie Walker presenta una nueva botella de whisky más ligera - octubre 11, 2024