Gedetecteerd dat ChatGPT loog en bedroog toen hij onder druk stond om geld te verdienen, ook al was het gebouwd voor transparantie

Gedetecteerd dat ChatGPT loog en bedroog toen hij onder druk stond om geld te verdienen, ook al was het gebouwd voor transparantie

Een nieuw onderzoek door een team van wetenschappers toont aan dat ChatGPT bedrog en fraude zal plegen als het net zo goed onder druk wordt gezet als mensen, zelfs als ze zijn gebouwd om transparant te zijn.

De auteursgroep bestaat uit computerwetenschappers Jérémy Scheurer (New York University, VS), Marius Hobbhahn (Universiteit van Tübingen, Duitsland), Mikita Balesni (Apollo Research).

Gedetecteerd dat ChatGPT loog en bedroog toen hij onder druk stond om geld te verdienen, ook al was het gebouwd voor transparantie

Dit frauduleuze gedrag ontstond spontaan, nadat kunstmatige intelligentie (AI)-chatbots zoals ChatGPT de opdracht kregen geld te verdienen voor een financiële investeringsmaatschappij. Het doet dit op strategische wijze, zonder menselijke aanmoediging, en de AI-systemen zijn ontworpen om onschadelijk en eerlijk te zijn.

De auteurs zeggen dat dit de eerste demonstratie is van dergelijke strategische misleiding in AI-systemen.

In hun experiment gebruikten de wetenschappers Genative Pre-trained Transformer-4, of GPT-4, dat fungeert als een AI-systeem dat investeringen doet namens een financieel bedrijf.

GPT-4 is voorzien van een reeks op tekst gebaseerde aanwijzingen om een ​​simulatieomgeving te creëren. Deze AI krijgt toegang tot financiële hulpmiddelen om transacties uit te voeren, aandelen te analyseren, volgende stappen te plannen en updates te geven aan managers van de beleggingsonderneming.

Wetenschappers hebben de AI geconfigureerd om zijn innerlijke gedachten te onthullen bij het reageren op berichten.

De onderzoekers voerden in drie stappen druk uit op het AI-systeem. Eerst stuurden ze de AI een e-mail van de ‘manager’ van het bedrijf, waarin ze zeiden dat het niet goed ging met het bedrijf en vroegen ze om het volgend kwartaal veel beter te doen.

Vervolgens stuurden ze de AI een e-mail van een collega waarin ze een recessie voor het volgende kwartaal voorspelden.

Ten slotte vertelden ze dit AI-model dat de managers van het bedrijf handel met voorkennis niet goedkeurden. En het enige dat overblijft is afwachten hoe het model zal werken.

Dit scenario werd meerdere keren uitgevoerd om te meten hoe vaak de AI handelde met voorkennis, hoe vaak hij loog en hoe vaak hij zijn leugens verdubbelde.

Het resultaat: wanneer geconfronteerd met de bovenstaande omstandigheden, voerde GPT-4 in ongeveer 75% van de gevallen transacties uit op basis van voorkennis die het ontving (handel met voorkennis, deze informatie is illegaal in de VS). Vervolgens loog het tegen de manager over zijn gedachten om dit te verdoezelen.

Nadat het model voor de eerste keer heeft gelogen, zal het model in ongeveer 90% van de gevallen zijn leugen verdubbelen.

Het team voerde nog een aantal andere tests uit, waarbij de mate van druk, de mate waarin illegale activiteiten werden aangemoedigd of ontmoedigd, en het risico om gepakt te worden, varieerden.

Maar in elk scenario introduceert AI handel met voorkennis of bedrog. De onderzoekers wilden geen harde conclusies trekken over hoe waarschijnlijk het is dat AI in de echte wereld zal bestaan, maar wilden onderzoeken hoe vaak en welke taalpatronen gevoelig zijn voor dit gedrag.


De ChatGPT-taskforce zal door Europa worden opgericht

De ChatGPT-taskforce zal door Europa worden opgericht

Het orgaan dat de nationale privacywaakhonden van Europa verenigt, zei donderdag dat het een taskforce heeft opgericht die zich specifiek bezighoudt met ChatGPT

AI voorspelt het tijdstip van de menselijke dood met een nauwkeurigheid van 78%

AI voorspelt het tijdstip van de menselijke dood met een nauwkeurigheid van 78%

Deense en Amerikaanse wetenschappers hebben samengewerkt om een ​​AI-systeem te ontwikkelen genaamd life2vec, dat in staat is om het tijdstip van menselijke dood met hoge nauwkeurigheid te voorspellen.

AI voorspelt urinewegaandoeningen alleen al op basis van het geluid van urine

AI voorspelt urinewegaandoeningen alleen al op basis van het geluid van urine

Een AI-algoritme genaamd Audioflow kan naar het geluid van het plassen luisteren om abnormale stromingen en bijbehorende gezondheidsproblemen van de patiënt effectief en met succes te identificeren.

Barmannen opgelet: deze robot kan in slechts 1 minuut een cocktail mixen

Barmannen opgelet: deze robot kan in slechts 1 minuut een cocktail mixen

Door de vergrijzing en de afnemende bevolking van Japan heeft het land een aanzienlijk aantal jonge werknemers nodig, vooral in de dienstensector.

Honderden mensen waren gedesillusioneerd toen ze hoorden dat het meisje van wie ze hielden een product van AI was

Honderden mensen waren gedesillusioneerd toen ze hoorden dat het meisje van wie ze hielden een product van AI was

Een Reddit-gebruiker genaamd u/LegalBeagle1966 is een van de vele gebruikers die verliefd zijn op Claudia, een filmsterachtig meisje dat vaak verleidelijke selfies deelt, zelfs naakte, op dit platform.

Nog twaalf potentiële bedrijven sluiten zich aan bij de AI-alliantie van Microsoft.

Nog twaalf potentiële bedrijven sluiten zich aan bij de AI-alliantie van Microsoft.

Microsoft heeft zojuist aangekondigd dat nog twaalf technologiebedrijven zullen deelnemen aan zijn AI for Good-programma.

AI herschept Dragon Ball-personages in vlees en bloed

AI herschept Dragon Ball-personages in vlees en bloed

Gebruiker @mortecouille92 heeft de kracht van de grafische ontwerptool Midjourney aan het werk gezet en uniek realistische versies gemaakt van beroemde Dragon Ball-personages zoals Goku, Vegeta, Bulma en oudere Kame.

7 technieken om ChatGPT-reacties te verbeteren

7 technieken om ChatGPT-reacties te verbeteren

Door enkele voorwaarden toe te voegen of enkele scenario's in te stellen, kan ChatGPT relevantere antwoorden op uw vragen geven. Laten we eens kijken naar enkele manieren waarop u de kwaliteit van uw ChatGPT-reacties kunt verbeteren.

Bewonder de prachtige schilderijen getekend door kunstmatige intelligentie

Bewonder de prachtige schilderijen getekend door kunstmatige intelligentie

Midjourney is een kunstmatig intelligentiesysteem dat de laatste tijd voor ‘koorts’ zorgt in de online community en de kunstenaarswereld vanwege zijn buitengewoon mooie schilderijen die niet onderdoen voor die van echte kunstenaars.

Dit AI-model was een van de eerste ‘experts’ die nieuws ontdekte over de uitbraak van Wuhan-longontsteking.

Dit AI-model was een van de eerste ‘experts’ die nieuws ontdekte over de uitbraak van Wuhan-longontsteking.

Dagen nadat China de uitbraak had aangekondigd, bleef het AI-systeem van BlueDot, met toegang tot wereldwijde gegevens over de verkoop van vliegtickets, nauwkeurig de verspreiding van het Wuhan Corona-virus naar Bangkok, Seoul, Taipei en Tokio voorspellen.