ระบบ AI ของ Amazon ช่วยลดข้อผิดพลาดในการจดจำเสียงบน Alexa ได้ถึง 15%

ระบบ AI ของ Amazon ช่วยลดข้อผิดพลาดในการจดจำเสียงบน Alexa ได้ถึง 15%

เมื่อไม่กี่เดือนที่ผ่านมา Amazon ให้รายละเอียดปัญหาหลายประการที่ทำให้ Alexa ไม่สามารถให้การตอบสนองที่แม่นยำเมื่อผู้ใช้ปลุกผู้ช่วยเสมือนในทีวีบางรุ่น ในโฆษณาทางอินเทอร์เน็ตหรือวิทยุ ท้ายที่สุดแล้ว ปัญหาหลักที่นี่คือวิธีที่ผู้ช่วยเสียงของ Amazon สามารถกรองเสียงรบกวนรอบข้างออกจากสภาพแวดล้อมได้อย่างมีประสิทธิภาพเพื่อให้ข้อเสนอแนะที่แม่นยำยิ่งขึ้นแก่ผู้ใช้ เมื่อเร็ว ๆ นี้ ในบล็อกโพสต์และรายงานการวิจัยที่แนบมากับ End-to-End Anchored Speech Recognition วิศวกรของ Amazon ได้นำเสนอเทคนิคการแยกเสียงรบกวนแบบใหม่โดยอาศัยปัญญาประดิษฐ์ที่สร้างขึ้นโดยเฉพาะ สามารถช่วยปรับปรุงการจดจำเสียงและคำสั่งของ Alexa ได้ 15% ข้อมูลรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการทำงานของระบบคาดว่าจะนำเสนอในการประชุมนานาชาติด้านเสียง คำพูด และการประมวลผลสัญญาณที่จะจัดขึ้นที่เมืองไบรตันในปลายปีนี้

ระบบ AI ของ Amazon ช่วยลดข้อผิดพลาดในการจดจำเสียงบน Alexa ได้ถึง 15%

“ในความเป็นจริง เราพยายามปรับปรุงประสิทธิภาพของ Alexa อยู่เสมอโดยสอนให้เธอ "เพิกเฉย" คำสั่งที่ไม่ได้มีไว้สำหรับเธอ กล่าวคือ รู้วิธีเลือกคำสั่งท่ามกลางเสียงนับไม่ถ้วนที่เล็ดลอดออกมาจากสภาพแวดล้อมโดยรอบ เราถือว่าผู้พูดเปิดใช้งานอุปกรณ์ที่เปิดใช้งาน Alexa โดยพูดคำปลุกเฉพาะบางคำ - โดยปกติคือ "Alexa" - และนี่คือวลีสำคัญที่ผู้ช่วยเสมือนจะต้องแยกและระบุด้วยความสับสนวุ่นวายของเสียงจากภายนอก สิ่งแวดล้อม. โดยพื้นฐานแล้ว เทคนิคของเราจะช่วย "จับ" เสียงที่อาจเป็นคำปลุกได้อย่างรวดเร็ว (โดยปกติจะขึ้นอยู่กับความคล้ายคลึงกันของน้ำเสียงหรือหน่วยเสียง) และเปรียบเทียบกับคำปลุก ซึ่งเป็นมาตรฐานในการระบุประโยคได้อย่างแม่นยำ จากนั้น Alexa จะเข้าใจประโยคที่มีองค์ประกอบใกล้เคียงกับคำปลุกมาตรฐานมากที่สุด ในขณะที่ประโยคอื่นๆ จะถือเป็นเสียงรบกวนเบื้องหลัง” Xin Fan หัวหน้าทีมนักวิทยาศาสตร์ที่รับผิดชอบโครงการกล่าว เอไออธิบาย

แทนที่จะฝึกระบบ AI ที่แยกจากกันเพื่อแยกความแตกต่างระหว่างเสียงพื้นหลังและคำพูดที่ตื่น Xin Fan และเพื่อนร่วมงานได้รวมกลไกการจับคู่คำของพวกเขาเข้ากับโมเดลการรู้จำเสียงพูดแบบอัจฉริยะซึ่งเป็นมาตรฐานประดิษฐ์ นักวิทยาศาสตร์ได้ทดสอบสถาปัตยกรรม AI ของตัวถอดรหัสสองรูปแบบตามลำดับ นั่นคือ การใช้สถาปัตยกรรมที่ประมวลผลข้อมูลอินพุต (ภาพสแนปชอตของสัญญาณเสียงความยาวมิลลิวินาที) เพื่อสร้างลำดับเอาต์พุตที่สอดคล้องกัน (การเรนเดอร์สัทศาสตร์ของเสียง) และ เช่นเดียวกับเทคนิคการเข้ารหัส-ถอดรหัสทั่วไป องค์ประกอบการเข้ารหัสจะสรุปข้อมูลอินพุตเป็นเวกเตอร์ความยาวคงที่ (ชุดตัวเลข) แล้วแปลงเป็นข้อมูลเอาท์พุต ในขณะเดียวกัน กลไกความสนใจพิเศษ "ที่ได้รับการฝึกอบรม" เพื่อตรวจจับลักษณะพื้นฐานบางประการของคำปลุกในสตริงคำพูดตั้งแต่หนึ่งสตริงขึ้นไปจากสภาพแวดล้อมโดยรอบจะรับผิดชอบในการ "นำทาง" ชุด การถอดรหัสจะให้ความสำคัญกับคุณสมบัติเหล่านั้นในเวกเตอร์มากขึ้น

ระบบ AI ของ Amazon ช่วยลดข้อผิดพลาดในการจดจำเสียงบน Alexa ได้ถึง 15%

ในการทดลอง นักวิจัยได้ฝึกหนึ่งในโมเดล AI ของตนเพื่อให้ความสำคัญกับการรู้จำการออกเสียงคำมากขึ้น ขั้นแรกโดยการเพิ่มองค์ประกอบที่เปรียบเทียบเสียงของคำโดยตรง ปลุกคำ ด้วยการออกเสียงที่หลากหลาย จากนั้นใช้ข้อมูลผลลัพธ์นี้เป็นอินพุตไปยังอีกคำหนึ่งที่แยกจากกัน ส่วนประกอบที่ได้รับการฝึกอบรมให้บีบอัดบิตของเวกเตอร์การเข้ารหัส ผลลัพธ์มีความน่าสนใจ โมเดลนี้ลดอัตราข้อผิดพลาดลงเหลือ 13% เทียบกับ 15%


คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

หน่วยงานที่รวบรวมหน่วยงานเฝ้าระวังความเป็นส่วนตัวระดับชาติของยุโรป ระบุเมื่อวันพฤหัสบดีว่า ได้จัดตั้งคณะทำงานเฉพาะกิจเพื่อ ChatGPT

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

นักวิทยาศาสตร์ชาวเดนมาร์กและชาวอเมริกันได้ร่วมมือกันพัฒนาระบบ AI ที่เรียกว่า life2vec ซึ่งสามารถทำนายเวลาการตายของมนุษย์ได้อย่างแม่นยำสูง

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

อัลกอริธึม AI ที่เรียกว่า Audioflow สามารถฟังเสียงปัสสาวะเพื่อระบุการไหลที่ผิดปกติและปัญหาสุขภาพที่เกี่ยวข้องของผู้ป่วยได้อย่างมีประสิทธิภาพและประสบความสำเร็จ

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

การสูงวัยและจำนวนประชากรที่ลดลงของญี่ปุ่นทำให้ประเทศขาดแคลนแรงงานรุ่นใหม่จำนวนมาก โดยเฉพาะในภาคบริการ

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้ใช้ Reddit ชื่อ u/LegalBeagle1966 เป็นหนึ่งในผู้ใช้จำนวนมากที่หลงรัก Claudia เด็กสาวที่เหมือนดาราภาพยนตร์ที่มักจะแชร์ภาพเซลฟี่ที่เย้ายวนใจ แม้กระทั่งภาพเปลือย บนแพลตฟอร์มนี้

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

Microsoft เพิ่งประกาศว่าบริษัทเทคโนโลยีอีก 12 แห่งจะเข้าร่วมในโครงการ AI for Good

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

ผู้ใช้ @mortecouille92 ได้นำพลังของเครื่องมือออกแบบกราฟิก Midjourney มาใช้งาน และสร้างตัวละคร Dragon Ball อันโด่งดังในเวอร์ชันสมจริงที่ไม่เหมือนใคร เช่น Goku, Vegeta, Bulma และพี่ Kame

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

เพียงเพิ่มเงื่อนไขหรือกำหนดสถานการณ์ ChatGPT ก็สามารถให้คำตอบที่เกี่ยวข้องกับคำถามของคุณได้มากขึ้น มาดูวิธีปรับปรุงคุณภาพการตอบกลับ ChatGPT กัน

ตื่นตาตื่นใจกับภาพวาดที่สวยงามซึ่งวาดโดยปัญญาประดิษฐ์

ตื่นตาตื่นใจกับภาพวาดที่สวยงามซึ่งวาดโดยปัญญาประดิษฐ์

Midjourney คือระบบปัญญาประดิษฐ์ที่เพิ่งทำให้เกิด "กระแส" ขึ้นในชุมชนออนไลน์และโลกของศิลปิน เนื่องจากมีภาพวาดที่สวยงามอย่างยิ่งที่ไม่ด้อยไปกว่าภาพวาดของศิลปินตัวจริง

แบบจำลอง AI นี้เป็นหนึ่งใน ผู้เชี่ยวชาญ คนแรก ๆ ที่ค้นพบข่าวเกี่ยวกับการระบาดของโรคปอดบวมในหวู่ฮั่น

แบบจำลอง AI นี้เป็นหนึ่งใน ผู้เชี่ยวชาญ คนแรก ๆ ที่ค้นพบข่าวเกี่ยวกับการระบาดของโรคปอดบวมในหวู่ฮั่น

ไม่กี่วันหลังจากที่จีนประกาศการระบาด ด้วยการเข้าถึงข้อมูลการขายตั๋วเครื่องบินทั่วโลก ระบบ AI ของ BlueDot ยังคงคาดการณ์การแพร่กระจายของไวรัสโคโรน่าหวู่ฮั่นไปยังกรุงเทพฯ โซล ไทเป และโตเกียวได้อย่างแม่นยำ