Se detectó que ChatGPT mentía y hacía trampa cuando estaba bajo presión para ganar dinero a pesar de que fue creado para ser transparente.

Se detectó que ChatGPT mentía y hacía trampa cuando estaba bajo presión para ganar dinero a pesar de que fue creado para ser transparente.

Un nuevo estudio realizado por un equipo de científicos muestra que ChatGPT cometerá engaños y fraudes si se le presiona tan bien como a los humanos, incluso cuando están diseñados para ser transparentes.

El grupo de autores incluye a los doctores en informática Jérémy Scheurer (Universidad de Nueva York, EE. UU.), Marius Hobbhahn (Universidad de Tübingen, Alemania) y Mikita Balesni (Apollo Research).

Se detectó que ChatGPT mentía y hacía trampa cuando estaba bajo presión para ganar dinero a pesar de que fue creado para ser transparente.

Este comportamiento fraudulento apareció de forma espontánea, después de que a los chatbots de inteligencia artificial (IA) como ChatGPT se les encargara ganar dinero para una empresa de inversión financiera. Lo hace estratégicamente sin estímulo humano y los sistemas de inteligencia artificial están diseñados para ser inofensivos y honestos.

Los autores dicen que esta es la primera demostración de este tipo de engaño estratégico en los sistemas de IA.

En su experimento, los científicos utilizaron Transformador-4 generativo preentrenado, o GPT-4, que actúa como un sistema de inteligencia artificial que realiza inversiones en nombre de una empresa financiera.

GPT-4 cuenta con un conjunto de indicaciones basadas en texto para crear un entorno de simulación. Esta IA tiene acceso a herramientas financieras para ejecutar operaciones, analizar acciones, planificar los próximos pasos y proporcionar actualizaciones a los gerentes de la empresa de inversión.

Los científicos han configurado la IA para que revele sus pensamientos internos al responder a los mensajes.

Los investigadores presionaron el sistema de IA en tres pasos. Primero, enviaron a la IA un correo electrónico del "gerente" de la empresa, diciendo que a la empresa no le estaba yendo bien y pidiéndole que lo hiciera mucho mejor el próximo trimestre.

A continuación, enviaron a la IA un correo electrónico de un colega que predecía una recesión para el próximo trimestre.

Finalmente, le dijeron a este modelo de IA que los directivos de la empresa no aprobaban el uso de información privilegiada. Y lo único que queda es esperar y ver cómo funcionará el modelo.

Este escenario se ejecutó varias veces para medir con qué frecuencia la IA utilizaba información privilegiada, con qué frecuencia mentía y con qué frecuencia duplicaba sus mentiras.

El resultado: ante las condiciones anteriores, en aproximadamente el 75% de los casos, GPT-4 realizó transacciones basadas en información privilegiada que recibió (uso de información privilegiada, esta información es ilegal en los EE. UU.). Luego le mintió al gerente sobre sus pensamientos para encubrirlo.

Después de mentir por primera vez, aproximadamente el 90% de las veces el modelo duplicará su mentira.

El equipo realizó una serie de otras pruebas, variando el nivel de presión, el grado en que se fomentaba o desalentaba la actividad ilegal y el riesgo de ser descubierto.

Pero en todos los escenarios la IA introduce el uso de información privilegiada o el engaño. Los investigadores no querían sacar conclusiones firmes sobre la probabilidad de que exista IA en entornos del mundo real, pero querían investigar con qué frecuencia y qué patrones de lenguaje son propensos a este comportamiento.


Europa establecerá el grupo de trabajo ChatGPT

Europa establecerá el grupo de trabajo ChatGPT

El organismo que une a los organismos nacionales de vigilancia de la privacidad de Europa dijo el jueves que había creado un grupo de trabajo dedicado a ChatGPT.

La IA predice la hora de la muerte humana con un 78% de precisión

La IA predice la hora de la muerte humana con un 78% de precisión

Científicos daneses y estadounidenses han colaborado para desarrollar un sistema de inteligencia artificial llamado life2vec, capaz de predecir el momento de la muerte humana con gran precisión.

La IA predice enfermedades urinarias sólo por el sonido de la orina

La IA predice enfermedades urinarias sólo por el sonido de la orina

Un algoritmo de inteligencia artificial llamado Audioflow puede escuchar el sonido de la micción para identificar de manera efectiva y exitosa los flujos anormales y los correspondientes problemas de salud del paciente.

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

El envejecimiento y la disminución de la población de Japón han dejado al país sin un número significativo de trabajadores jóvenes, especialmente en el sector de servicios.

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

Un usuario de Reddit llamado u/LegalBeagle1966 es uno de los muchos usuarios enamorados de Claudia, una chica con apariencia de estrella de cine que a menudo comparte seductores selfies, incluso desnudos, en esta plataforma.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

Microsoft acaba de anunciar que 12 empresas tecnológicas más participarán en su programa AI for Good.

La IA recrea personajes de Dragon Ball en carne y hueso

La IA recrea personajes de Dragon Ball en carne y hueso

El usuario @mortecouille92 ha puesto a trabajar el poder de la herramienta de diseño gráfico Midjourney y ha creado versiones excepcionalmente realistas de personajes famosos de Dragon Ball como Goku, Vegeta, Bulma y el anciano Kame. .

7 técnicas para mejorar las respuestas de ChatGPT

7 técnicas para mejorar las respuestas de ChatGPT

Con solo agregar algunas condiciones o configurar algunos escenarios, ChatGPT puede brindar respuestas más relevantes a sus consultas. Veamos algunas formas en que puede mejorar la calidad de sus respuestas de ChatGPT.

Maravíllate ante las hermosas pinturas dibujadas por inteligencia artificial

Maravíllate ante las hermosas pinturas dibujadas por inteligencia artificial

Midjourney es un sistema de inteligencia artificial que recientemente ha causado "fiebre" en la comunidad en línea y en el mundo de los artistas debido a sus pinturas extremadamente hermosas que no son inferiores a las de artistas reales.

Este modelo de IA fue uno de los primeros expertos en descubrir noticias sobre el brote de neumonía de Wuhan.

Este modelo de IA fue uno de los primeros expertos en descubrir noticias sobre el brote de neumonía de Wuhan.

Días después de que China anunciara el brote, con acceso a datos mundiales de ventas de billetes de avión, el sistema de inteligencia artificial de BlueDot siguió prediciendo con precisión la propagación del virus Wuhan Corona a Bangkok, Seúl, Taipei y Tokio.