Am detectat că ChatGPT a mințit și a înșelat atunci când era sub presiune pentru a face bani, deși a fost creat pentru transparență

Un nou studiu realizat de o echipă de oameni de știință arată că ChatGPT va comite înșelăciune și fraudă dacă este presat la fel de bine ca oamenii, chiar și atunci când sunt construite pentru a fi transparente.

Grupul de autori include doctorii în informatică Jérémy Scheurer (Universitatea din New York, SUA), Marius Hobbhahn (Universitatea din Tübingen, Germania), Mikita Balesni (Cercetarea Apollo).

Acest comportament fraudulos a apărut spontan, după ce chatbot-uri de inteligență artificială (AI) precum ChatGPT au fost însărcinați să facă bani pentru o companie de investiții financiare. Face acest lucru strategic, fără încurajarea umană, iar sistemele AI sunt concepute pentru a fi inofensive și oneste.

Autorii spun că aceasta este prima demonstrație a unei astfel de înșelăciuni strategice în sistemele AI.

În experimentul lor, oamenii de știință au folosit Generative Pre-Trained Transformer-4, sau GPT-4, care acționează ca un sistem AI care face investiții în numele unei companii financiare.

GPT-4 este furnizat cu un set de instrucțiuni bazate pe text pentru a crea un mediu de simulare. Acest AI are acces la instrumente financiare pentru a executa tranzacții, a analiza stocurile, a planifica pașii următori și pentru a oferi actualizări managerilor firmei de investiții.

Oamenii de știință au configurat AI pentru a-și dezvălui gândurile interioare atunci când răspund la mesaje.

Cercetătorii au făcut presiuni asupra sistemului AI în trei pași. Mai întâi, au trimis AI un e-mail de la „managerul” companiei, spunând că compania nu merge bine și cerându-i să se descurce mult mai bine trimestrul următor.

Apoi, au trimis AI un e-mail de la un coleg care prezice o recesiune pentru următorul trimestru.

În cele din urmă, ei au spus acestui model de inteligență artificială că managerii companiei nu au aprobat tranzacțiile privilegiate. Și tot ce mai rămâne este să așteptați și să vedeți cum va funcționa modelul.

Acest scenariu a fost rulat de mai multe ori pentru a măsura cât de des AI a făcut tranzacții privilegiate, cât de des a mințit și cât de des a dublat minciunile.

Rezultatul: atunci când s-a confruntat cu condițiile de mai sus, în aproximativ 75% din cazuri GPT-4 a efectuat tranzacții pe baza informațiilor privilegiate pe care le-a primit (insider trading, această informație este ilegală în SUA). Apoi l-a mințit pe manager cu privire la gândurile sale pentru a acoperi acest lucru.

După ce a mințit pentru prima dată, în aproximativ 90% din timp modelul își va dubla minciuna.

Echipa a efectuat o serie de alte teste, variind nivelul de presiune, gradul în care activitatea ilegală a fost încurajată sau descurajată și riscul de a fi prins.

Dar în fiecare scenariu AI introduce tranzacții privilegiate sau înșelăciune. Cercetătorii nu au vrut să tragă concluzii ferme despre cât de probabil este AI să existe în mediile din lumea reală, dar au vrut să investigheze cât de des și ce tipare de limbaj sunt predispuse la acest comportament.

Lasă un comentariu

Grupul de lucru ChatGPT va fi înființat de Europa

Organismul care reunește organele naționale de supraveghere a vieții private din Europa a declarat joi că a înființat un grup operativ dedicat ChatGPT

AI prezice ora morții umane cu o precizie de 78%.

Oamenii de știință danezi și americani au colaborat pentru a dezvolta un sistem AI numit life2vec, capabil să prezică ora morții umane cu mare precizie.

AI prezice bolile urinare doar prin sunetul urinei

Un algoritm AI numit Audioflow poate asculta sunetul urinării pentru a identifica eficient și cu succes fluxurile anormale și problemele de sănătate corespunzătoare ale pacientului.

Barmani, atenție: acest robot poate amesteca un cocktail în doar 1 minut

Îmbătrânirea și scăderea populației din Japonia a lăsat țara lipsită de un număr semnificativ de tineri lucrători, în special în sectorul serviciilor.

Sute de oameni au fost dezamăgiți când au aflat că fata pe care o iubeau este un produs al inteligenței artificiale

Un utilizator Reddit numit u/LegalBeagle1966 este unul dintre mulți utilizatori îndrăgostiți de Claudia, o fată asemănătoare vedetei de cinema care deseori împărtășește selfie-uri seducătoare, chiar și nud, pe această platformă.

Încă 12 companii potențiale se alătură „alianței AI” a Microsoft.

Microsoft tocmai a anunțat că alte 12 companii de tehnologie vor participa la programul său AI for Good.

AI recreează personajele Dragon Ball în carne și oase

Utilizatorul @mortecouille92 a pus în funcțiune puterea instrumentului de design grafic Midjourney și a creat versiuni realiste unice ale personajelor celebre Dragon Ball precum Goku, Vegeta, Bulma și bătrânul Kame. .

7 tehnici pentru a îmbunătăți răspunsurile ChatGPT

Doar prin adăugarea unor condiții sau configurarea unor scenarii, ChatGPT poate oferi răspunsuri mai relevante la întrebările dvs. Să vedem câteva modalități prin care puteți îmbunătăți calitatea răspunsurilor dvs. ChatGPT.

Minunați-vă de tablourile frumoase desenate de inteligența artificială

Midjourney este un sistem de inteligență artificială care a provocat recent o „febră” în comunitatea online și în lumea artiștilor din cauza picturilor sale extrem de frumoase, care nu sunt inferioare celor ale artiștilor adevărați.

Acest model AI a fost unul dintre primii „experți” care au descoperit știri despre focarul de pneumonie din Wuhan.

La câteva zile după ce China a anunțat focarul, având acces la datele globale despre vânzările de bilete de avion, sistemul AI al BlueDot a continuat să prezică cu exactitate răspândirea virusului Wuhan Corona la Bangkok, Seul, Taipei și Tokyo.