Libratus - ปัญญาประดิษฐ์เพิ่งเอาชนะผู้เชี่ยวชาญ 4 คนในเกมโป๊กเกอร์

Libratus - ปัญญาประดิษฐ์เพิ่งเอาชนะผู้เชี่ยวชาญ 4 คนในเกมโป๊กเกอร์

ปัญญาประดิษฐ์Libratusเพิ่งเอาชนะปรมาจารย์ 4 คนในเกมโป๊กเกอร์ ด้วย วิธีการฝึกอบรม AI ใหม่ แทนที่จะเป็นเทคนิคทั่วไปในปัจจุบัน

เป็นเวลาเกือบสามสัปดาห์ที่ Dong Kim นั่งอยู่ที่คาสิโนในพิตต์สเบิร์กและเล่นโป๊กเกอร์ด้วยเครื่องจักร อย่างไรก็ตาม ดงคิมไม่ได้เป็นเพียงผู้เล่นโป๊กเกอร์ธรรมดา และเครื่องจักรที่เขาเล่นก็ไม่ใช่เครื่องจักรโป๊กเกอร์ธรรมดาเหมือนกับคนอื่นๆ

ดง คิมอายุ 28 ปี เป็นหนึ่งในผู้เล่นโป๊กเกอร์ที่เก่งที่สุดในโลก ในขณะเดียวกัน เครื่องโป๊กเกอร์อีกเครื่องหนึ่งคือ Libratus ที่สร้างขึ้นโดยนักวิจัยด้านวิทยาการคอมพิวเตอร์สองคนที่มหาวิทยาลัย Carnegie Mellon เป็นเพียงระบบปัญญาประดิษฐ์ที่ทำงานบน ซูเปอร์คอมพิวเตอร์ ของPittsburgh เป็นเวลา 20 วันติดต่อกัน ปรมาจารย์โป๊กเกอร์สี่คนต่อสู้กับ Libratus ใน Texas Hold'Em แบบไม่จำกัดซึ่งเป็นรูปแบบโป๊กเกอร์ที่ซับซ้อนเป็นพิเศษซึ่งรวมถึงกลยุทธ์การเดิมพันเพื่อช่วยให้ผู้เล่น ผู้เล่นต้องเอาชนะไพ่หลายสิบใบ

Libratus - ปัญญาประดิษฐ์เพิ่งเอาชนะผู้เชี่ยวชาญ 4 คนในเกมโป๊กเกอร์

ครึ่งทางของการแข่งขัน ดงคิมเริ่มรู้สึกเหมือนเครื่องโป๊กเกอร์ Libratus มองเห็นไพ่ของเขา “ ฉันไม่คิดว่ามันโกง ฉันแค่คิดว่ามันดีมาก ” ดงคิมกล่าว จริงๆ แล้ว Libratus ไม่เพียงแต่เอาชนะ Dong Kim เท่านั้น แต่ยังเอาชนะผู้เล่นโป๊กเกอร์ชั้นนำของโลกอีกสามคนด้วย ซึ่งนับเป็นครั้งแรกที่ปัญญาประดิษฐ์สามารถทำได้

ตลอดการแข่งขัน ผู้สร้าง Libratus ยังคงลังเลที่จะแบ่งปันว่าระบบปัญญาประดิษฐ์นี้ทำงานอย่างไร - มันประสบความสำเร็จขนาดไหน สามารถเลียนแบบได้โดยตรงอย่างไร รับรู้ถึงมนุษย์ในแบบที่ไม่มีเครื่องจักรใดสามารถทำได้ อย่างไรก็ตาม จากสิ่งที่นักวิจัยเปิดเผย Libratus ได้มาถึงระดับที่เป็นมากกว่า AI ธรรมดา แต่มันขึ้นอยู่กับระบบที่แตกต่างกันสามระบบที่ทำงานร่วมกัน

โปรดทราบว่า AI สมัยใหม่ในปัจจุบันดำเนินการโดยเทคโนโลยีหลายอย่างในเวลาเดียวกัน ไม่ใช่เทคโนโลยีเดียว โครงข่ายประสาทเทียมระดับลึกกำลังได้รับความสนใจอย่างมากในช่วงไม่กี่วันที่ผ่านมา และด้วยเหตุผลที่ดี: " โครงข่ายประสาทเทียมเหล่านี้ขับเคลื่อนทุกสิ่งตั้งแต่การจดจำรูปภาพ การแปลภาษา ไปจนถึงการค้นหา ค้นหาผลิตภัณฑ์หลักของบริษัทเทคโนโลยีที่ใหญ่ที่สุดในโลก อย่างไรก็ตาม ความสำเร็จของโครงข่ายประสาทเทียมก็เช่นกัน นำอากาศบริสุทธิ์มาสู่เทคนิค AI อื่นๆ อีกมากมาย ช่วยให้คอมพิวเตอร์เลียนแบบหรือก้าวข้ามความสามารถของมนุษย์

อย่างไรก็ตาม Libratus ไม่ได้ใช้โครงข่ายประสาทเทียมนี้ Libratus มีพื้นฐานอยู่บนรูปแบบอื่นของ AI หรือที่เรียกว่า " การเรียนรู้แบบเสริมกำลัง " ซึ่งเป็นวิธีการลองผิดลองถูกที่เข้มงวดอย่างยิ่ง โดยพื้นฐานแล้ว เครื่องโป๊กเกอร์ Libratus จะเล่นเกมแข่งกับตัวเองซ้ำแล้วซ้ำเล่า

Libratus - ปัญญาประดิษฐ์เพิ่งเอาชนะผู้เชี่ยวชาญ 4 คนในเกมโป๊กเกอร์

Deep Mind Lab ของ Google ใช้การเรียนรู้แบบเสริมกำลังในการสร้าง AlphaGo ซึ่งเป็นระบบที่เอาชนะผู้เล่นระดับโลก Lee Sedol เมื่อต้นปีที่แล้ว อย่างไรก็ตาม มีความแตกต่างที่สำคัญระหว่างสองระบบนี้ AlphaGo เรียนรู้การเล่น Go โดยการวิเคราะห์การเคลื่อนไหวของมนุษย์ 30 ล้านครั้ง ก่อนที่จะกำหนดทักษะด้วยการเล่นกับตัวเอง แต่ Libratus ตรงกันข้าม เขาเรียนรู้ที่จะเล่นโป๊กเกอร์ตั้งแต่เริ่มต้น

ผ่านอัลกอริธึมที่เรียกว่าCounterfactual Regret Minimization มันเริ่มต้นด้วยการเล่นแบบสุ่ม และในที่สุด หลังจากฝึกฝนหลายเดือนด้วยมือโป๊กเกอร์หลายล้านล้านมือ มันก็มาถึงระดับไม่เพียงแต่ท้าทายผู้เล่นที่เก่งที่สุดเท่านั้น แต่ยังเล่นในแบบที่ผู้เล่นที่เก่งที่สุดไม่สามารถเล่นได้ ด้วยการเดิมพันที่หลากหลายและสุ่มเดิมพันเหล่านี้ ดังนั้นฝ่ายตรงข้ามจะเดาไพ่ที่ Libratus ถือได้ยากขึ้น

เราให้คำอธิบายเกมแก่ AI เราไม่ได้บอกว่าจะเล่นอย่างไร จากนั้นมันจะพัฒนากลยุทธ์ที่ไม่ขึ้นอยู่กับการเล่นของมนุษย์โดยสิ้นเชิงและอาจแตกต่างอย่างมากจากวิธีที่มนุษย์เล่นเกมนี้” Noam กล่าว Brown นักศึกษาปริญญาโทที่ Carnegie Mellon University - CMU ผู้สร้างระบบ AI นี้ร่วมกับศาสตราจารย์ Tuomas Sandholm

Libratus - ปัญญาประดิษฐ์เพิ่งเอาชนะผู้เชี่ยวชาญ 4 คนในเกมโป๊กเกอร์

อย่างไรก็ตามนั่นเป็นเพียงช่วงแรกเท่านั้น ในระหว่างการแข่งขันในพิตส์เบิร์ก ระบบที่สองจะวิเคราะห์สถานะการแข่งขันและมุ่งเน้นไปที่ความสนใจของระบบแรก ด้วยความช่วยเหลือจากระบบที่สองนี้ รายละเอียด " เอนเกมเมอร์ " ในกระดาษ Sandholm และ Brown ทำให้ระบบแรกไม่จำเป็นต้องผ่านทุกสถานการณ์ที่สามารถสำรวจได้ ซึ่งเกิดขึ้นในอดีต และเพียงแค่ต้องผ่านสถานการณ์เหล่านั้นบางส่วนเท่านั้น สิ่งที่พิเศษคือ Libratus ไม่เพียงแค่เรียนรู้ก่อนเกมเท่านั้น แต่ยังเรียนรู้ต่อไปแม้ในขณะเล่นอีกด้วย

แม้ว่าทั้งสองระบบนี้เพียงอย่างเดียวก็มากเกินพอที่จะเล่นโป๊กเกอร์ได้อย่างมีประสิทธิภาพ แต่ดงคิมและผู้เล่นคนอื่นๆ ยังคงพบรูปแบบการเล่นของคอมพิวเตอร์และใช้ประโยชน์จากมัน นั่นเป็นสาเหตุที่บราวน์และแซนด์โฮล์มสร้างระบบที่สามขึ้นมา ทุกเย็น Brown จะใช้อัลกอริธึมที่สามารถระบุรูปแบบเหล่านั้นและกำจัดมันได้ “ มันสามารถคำนวณได้ในชั่วข้ามคืน และทุกอย่างจะพร้อมในวันถัดไป ” บราวน์กล่าว

Libratus - ปัญญาประดิษฐ์เพิ่งเอาชนะผู้เชี่ยวชาญ 4 คนในเกมโป๊กเกอร์

หากคุณรู้สึกว่าสิ่งนี้ดูไม่ยุติธรรม คุณยังคงต้องยอมรับมัน เพราะนั่นคือวิธีการทำงานของ AI อย่างไรก็ตาม ไม่เพียงแต่ AI เท่านั้นที่ทำเช่นนั้น แต่มนุษย์ยังสามารถรวมกระบวนการต่าง ๆ เข้าด้วยกัน ปรับปรุง ดำเนินการ และปรับปรุง AI อย่างจริงจัง กล่าวโดยสรุป Libratus เป็นเหตุการณ์สำคัญอย่างแท้จริง โดยแสดงให้เราเห็นว่า AI ประเภทใหม่สามารถมีบทบาทสำคัญในทุกสิ่งตั้งแต่การซื้อขายใน Wall Street ไปจนถึงความปลอดภัยทางไซเบอร์ การประมูล และการเจรจาทางการเมือง

" โป๊กเกอร์เป็นหนึ่งในเกมที่ยากที่สุดสำหรับ AI ที่จะเจาะเข้าไป เพราะคุณจะเห็นเพียงข้อมูลบางส่วนเกี่ยวกับสถานะของเกมเท่านั้น ไม่มีการเคลื่อนไหวใดที่เหมาะสมที่สุด แต่ AI จะต้องสุ่มการกระทำของมันเพื่อทำให้ฝ่ายตรงข้ามไม่แน่ใจว่าเมื่อใด หลอกลวงพวกเขา ” Andrews Ng ผู้สนับสนุนห้องปฏิบัติการ AI กลางของ Google กล่าวและปัจจุบันเป็นหัวหน้านักวิทยาศาสตร์ของ Baidu

ลิบราตัสทำดีที่สุดแล้ว มันสุ่มการเดิมพันไปสู่ระดับที่เกินกว่าความคิดของผู้เล่นที่เก่งที่สุด และหากไม่ได้ผล อัลกอริธึมตลอดทั้งคืนของบราวน์ก็จะเข้ามาเติมเต็มช่องว่าง เทรดเดอร์ทางการเงินสามารถทำงานในลักษณะเดียวกันได้ สิ่งเดียวกันนี้เกิดขึ้นกับนักการทูต ดังนั้น Libratus จึงออกแถลงการณ์ที่ชัดเจน: เครื่องจักรสามารถหลอกมนุษย์ได้

อ้างถึงบทความเพิ่มเติมบางส่วน:

ขอให้สนุก!


คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

หน่วยงานที่รวบรวมหน่วยงานเฝ้าระวังความเป็นส่วนตัวระดับชาติของยุโรป ระบุเมื่อวันพฤหัสบดีว่า ได้จัดตั้งคณะทำงานเฉพาะกิจเพื่อ ChatGPT

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

นักวิทยาศาสตร์ชาวเดนมาร์กและชาวอเมริกันได้ร่วมมือกันพัฒนาระบบ AI ที่เรียกว่า life2vec ซึ่งสามารถทำนายเวลาการตายของมนุษย์ได้อย่างแม่นยำสูง

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

อัลกอริธึม AI ที่เรียกว่า Audioflow สามารถฟังเสียงปัสสาวะเพื่อระบุการไหลที่ผิดปกติและปัญหาสุขภาพที่เกี่ยวข้องของผู้ป่วยได้อย่างมีประสิทธิภาพและประสบความสำเร็จ

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

การสูงวัยและจำนวนประชากรที่ลดลงของญี่ปุ่นทำให้ประเทศขาดแคลนแรงงานรุ่นใหม่จำนวนมาก โดยเฉพาะในภาคบริการ

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้ใช้ Reddit ชื่อ u/LegalBeagle1966 เป็นหนึ่งในผู้ใช้จำนวนมากที่หลงรัก Claudia เด็กสาวที่เหมือนดาราภาพยนตร์ที่มักจะแชร์ภาพเซลฟี่ที่เย้ายวนใจ แม้กระทั่งภาพเปลือย บนแพลตฟอร์มนี้

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

Microsoft เพิ่งประกาศว่าบริษัทเทคโนโลยีอีก 12 แห่งจะเข้าร่วมในโครงการ AI for Good

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

ผู้ใช้ @mortecouille92 ได้นำพลังของเครื่องมือออกแบบกราฟิก Midjourney มาใช้งาน และสร้างตัวละคร Dragon Ball อันโด่งดังในเวอร์ชันสมจริงที่ไม่เหมือนใคร เช่น Goku, Vegeta, Bulma และพี่ Kame

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

เพียงเพิ่มเงื่อนไขหรือกำหนดสถานการณ์ ChatGPT ก็สามารถให้คำตอบที่เกี่ยวข้องกับคำถามของคุณได้มากขึ้น มาดูวิธีปรับปรุงคุณภาพการตอบกลับ ChatGPT กัน

ตื่นตาตื่นใจกับภาพวาดที่สวยงามซึ่งวาดโดยปัญญาประดิษฐ์

ตื่นตาตื่นใจกับภาพวาดที่สวยงามซึ่งวาดโดยปัญญาประดิษฐ์

Midjourney คือระบบปัญญาประดิษฐ์ที่เพิ่งทำให้เกิด "กระแส" ขึ้นในชุมชนออนไลน์และโลกของศิลปิน เนื่องจากมีภาพวาดที่สวยงามอย่างยิ่งที่ไม่ด้อยไปกว่าภาพวาดของศิลปินตัวจริง

แบบจำลอง AI นี้เป็นหนึ่งใน ผู้เชี่ยวชาญ คนแรก ๆ ที่ค้นพบข่าวเกี่ยวกับการระบาดของโรคปอดบวมในหวู่ฮั่น

แบบจำลอง AI นี้เป็นหนึ่งใน ผู้เชี่ยวชาญ คนแรก ๆ ที่ค้นพบข่าวเกี่ยวกับการระบาดของโรคปอดบวมในหวู่ฮั่น

ไม่กี่วันหลังจากที่จีนประกาศการระบาด ด้วยการเข้าถึงข้อมูลการขายตั๋วเครื่องบินทั่วโลก ระบบ AI ของ BlueDot ยังคงคาดการณ์การแพร่กระจายของไวรัสโคโรน่าหวู่ฮั่นไปยังกรุงเทพฯ โซล ไทเป และโตเกียวได้อย่างแม่นยำ