นักวิจัยของ Google ปล่อยให้ AI เล่นเกมเพื่อปรับปรุงการเรียนรู้แบบเสริมกำลัง
การเรียนรู้แบบเสริมกำลัง - สาขาย่อยของการเรียนรู้ของเครื่อง - เกี่ยวข้องกับเทคนิคการฝึกอบรม AI ที่ใช้ "รางวัล" เพื่อขับเคลื่อนนโยบายซอฟต์แวร์ไปสู่เป้าหมายที่กำหนดเป้าหมายโดยเฉพาะ