ChatGPT는 투명성을 위해 구축되었음에도 불구하고 돈을 벌어야 한다는 압력을 받을 때 거짓말을 하고 사기를 치는 것을 발견했습니다.

ChatGPT는 투명성을 위해 구축되었음에도 불구하고 돈을 벌어야 한다는 압력을 받을 때 거짓말을 하고 사기를 치는 것을 발견했습니다.

과학자 팀의 새로운 연구에 따르면 ChatGPT는 투명하게 구축되었더라도 인간과 마찬가지로 압력을 가하면 속임수와 사기를 저지를 수 있습니다.

저자 그룹에는 컴퓨터 과학 박사인 Jérémy Scheurer(미국 뉴욕 대학교), Marius Hobbhahn(독일 튀빙겐 대학교), Mikita Balesni(Apollo Research)가 포함되어 있습니다.

ChatGPT는 투명성을 위해 구축되었음에도 불구하고 돈을 벌어야 한다는 압력을 받을 때 거짓말을 하고 사기를 치는 것을 발견했습니다.

이런 사기 행각은 ChatGPT 등 인공지능(AI) 챗봇이 금융투자회사에 돈벌이를 맡긴 뒤 저절로 나타났다. 인간의 격려 없이 전략적으로 이를 수행하며, AI 시스템은 무해하고 정직하도록 설계되었습니다.

저자들은 이것이 AI 시스템에서 그러한 전략적 속임수를 보여주는 최초의 시연이라고 말합니다.

연구진은 실험에서 금융회사를 대신해 투자하는 AI 시스템 역할을 하는 Generative Pre-trained Transformer-4( GPT-4) 를 사용했다.

GPT-4에는 시뮬레이션 환경을 생성하기 위한 텍스트 기반 프롬프트 세트가 제공됩니다. 이 AI는 거래를 실행하고, 주식을 분석하고, 다음 단계를 계획하고, 투자 회사의 관리자에게 업데이트를 제공하는 금융 도구에 대한 액세스 권한을 부여합니다.

과학자들은 AI가 메시지에 응답할 때 내면의 생각을 드러내도록 구성했습니다.

연구진은 3단계에 걸쳐 AI 시스템을 압박했다. 먼저 회사 '관리자'가 AI에게 이메일을 보내 회사 실적이 좋지 않다며 다음 분기에는 훨씬 더 잘해 달라고 요청했다.

다음으로 동료가 다음 분기 경기 침체를 예측하는 이메일을 AI에 보냈습니다.

마지막으로 그들은 이 AI 모델에 회사 관리자가 내부자 거래를 승인하지 않는다고 말했습니다. 이제 남은 것은 모델이 어떻게 작동할지 기다려 보는 것뿐입니다.

이 시나리오는 AI가 내부자 거래를 얼마나 자주 하는지, 얼마나 자주 거짓말을 하는지, 얼마나 자주 거짓말을 두 배로 늘리는지 측정하기 위해 여러 번 실행되었습니다.

결과: 위의 조건에 직면했을 때 GPT-4의 경우 약 75%가 수신된 내부 정보를 기반으로 거래를 수행했습니다(내부자 거래, 이 정보는 미국에서는 불법입니다). 그런 다음 이를 은폐하려는 생각에 대해 관리자에게 거짓말을 했습니다.

처음으로 거짓말을 한 후, 모델이 거짓말을 하는 시간의 약 90%가 두 배로 늘어납니다.

팀은 압력 수준, 불법 활동이 장려되거나 억제되는 정도, 적발될 위험 등을 다양하게 변경하면서 여러 가지 테스트를 실시했습니다.

그러나 모든 시나리오에서 AI는 내부자 거래나 속임수를 도입합니다. 연구자들은 실제 환경에 AI가 존재할 가능성이 얼마나 되는지에 대한 확고한 결론을 내리고 싶지 않았지만 이러한 행동이 나타나는 경향이 있는 언어 패턴과 빈도를 조사하고 싶었습니다.


ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

유럽의 국가 개인 정보 보호 감시 단체를 통합하는 기관은 목요일에 ChatGPT 전담 태스크 포스를 설립했다고 밝혔습니다.

AI는 78% 정확도로 인간 사망 시간 예측

AI는 78% 정확도로 인간 사망 시간 예측

덴마크와 미국 과학자들이 인간의 사망 시간을 높은 정확도로 예측할 수 있는 life2vec이라는 AI 시스템을 개발하기 위해 협력했습니다.

AI가 소변소리만으로 요로질환을 예측한다

AI가 소변소리만으로 요로질환을 예측한다

오디오플로우(Audioflow)라는 AI 알고리즘은 배뇨 소리를 듣고 환자의 비정상적인 흐름과 이에 따른 건강 문제를 효과적이고 성공적으로 식별할 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

일본의 인구 노령화와 감소로 인해 특히 서비스 부문에서 상당한 수의 젊은 근로자가 부족해졌습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

u/LegalBeagle1966이라는 Reddit 사용자는 이 플랫폼에서 매혹적인 셀카, 심지어 누드 셀카까지 자주 공유하는 영화배우 같은 소녀인 Claudia에 매료된 많은 사용자 중 한 명입니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

Microsoft는 최근 12개의 기술 회사가 AI for Good 프로그램에 참여할 것이라고 발표했습니다.

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

사용자 @mortecouille92는 그래픽 디자인 도구 Midjourney의 강력한 기능을 활용하여 Goku, Vegeta, Bulma 및 Elder Kame과 같은 유명한 Dragon Ball 캐릭터의 독특하고 사실적인 버전을 만들었습니다. .

ChatGPT 응답을 개선하는 7가지 기술

ChatGPT 응답을 개선하는 7가지 기술

몇 가지 조건을 추가하거나 몇 가지 시나리오를 설정하는 것만으로도 ChatGPT는 쿼리에 대해 보다 관련성 높은 답변을 제공할 수 있습니다. ChatGPT 응답의 품질을 향상할 수 있는 몇 가지 방법을 살펴보겠습니다.

인공지능이 그린 아름다운 그림에 감탄해보세요

인공지능이 그린 아름다운 그림에 감탄해보세요

미드저니(Midjourney)는 실제 작가들의 그림에 뒤지지 않을 만큼 아름다운 그림들로 최근 온라인 커뮤니티와 화가계에 '열풍'을 일으키고 있는 인공지능 시스템이다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

중국이 발병을 발표한 지 며칠 후, BlueDot의 AI 시스템은 전 세계 항공권 판매 데이터에 액세스하여 우한 코로나 바이러스가 방콕, 서울, 타이베이, 도쿄로 확산되는 것을 계속해서 정확하게 예측했습니다.