ระบบ AI ของ Amazon ช่วยลดข้อผิดพลาดในการจดจำเสียงบน Alexa ได้ถึง 15%

เมื่อไม่กี่เดือนที่ผ่านมา Amazon ให้รายละเอียดปัญหาหลายประการที่ทำให้ Alexa ไม่สามารถให้การตอบสนองที่แม่นยำเมื่อผู้ใช้ปลุกผู้ช่วยเสมือนในทีวีบางรุ่น ในโฆษณาทางอินเทอร์เน็ตหรือวิทยุ ท้ายที่สุดแล้ว ปัญหาหลักที่นี่คือวิธีที่ผู้ช่วยเสียงของ Amazon สามารถกรองเสียงรบกวนรอบข้างออกจากสภาพแวดล้อมได้อย่างมีประสิทธิภาพเพื่อให้ข้อเสนอแนะที่แม่นยำยิ่งขึ้นแก่ผู้ใช้ เมื่อเร็ว ๆ นี้ ในบล็อกโพสต์และรายงานการวิจัยที่แนบมากับ End-to-End Anchored Speech Recognition วิศวกรของ Amazon ได้นำเสนอเทคนิคการแยกเสียงรบกวนแบบใหม่โดยอาศัยปัญญาประดิษฐ์ที่สร้างขึ้นโดยเฉพาะ สามารถช่วยปรับปรุงการจดจำเสียงและคำสั่งของ Alexa ได้ 15% ข้อมูลรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการทำงานของระบบคาดว่าจะนำเสนอในการประชุมนานาชาติด้านเสียง คำพูด และการประมวลผลสัญญาณที่จะจัดขึ้นที่เมืองไบรตันในปลายปีนี้

โมเดล AI ของ Disney สร้างลำดับภาพเคลื่อนไหวจากสคริปต์

“ในความเป็นจริง เราพยายามปรับปรุงประสิทธิภาพของ Alexa อยู่เสมอโดยสอนให้เธอ "เพิกเฉย" คำสั่งที่ไม่ได้มีไว้สำหรับเธอ กล่าวคือ รู้วิธีเลือกคำสั่งท่ามกลางเสียงนับไม่ถ้วนที่เล็ดลอดออกมาจากสภาพแวดล้อมโดยรอบ เราถือว่าผู้พูดเปิดใช้งานอุปกรณ์ที่เปิดใช้งาน Alexa โดยพูดคำปลุกเฉพาะบางคำ - โดยปกติคือ "Alexa" - และนี่คือวลีสำคัญที่ผู้ช่วยเสมือนจะต้องแยกและระบุด้วยความสับสนวุ่นวายของเสียงจากภายนอก สิ่งแวดล้อม. โดยพื้นฐานแล้ว เทคนิคของเราจะช่วย "จับ" เสียงที่อาจเป็นคำปลุกได้อย่างรวดเร็ว (โดยปกติจะขึ้นอยู่กับความคล้ายคลึงกันของน้ำเสียงหรือหน่วยเสียง) และเปรียบเทียบกับคำปลุก ซึ่งเป็นมาตรฐานในการระบุประโยคได้อย่างแม่นยำ จากนั้น Alexa จะเข้าใจประโยคที่มีองค์ประกอบใกล้เคียงกับคำปลุกมาตรฐานมากที่สุด ในขณะที่ประโยคอื่นๆ จะถือเป็นเสียงรบกวนเบื้องหลัง” Xin Fan หัวหน้าทีมนักวิทยาศาสตร์ที่รับผิดชอบโครงการกล่าว เอไออธิบาย

ปัญญาประดิษฐ์ OpenAI เอาชนะทีม Dota 2 แชมป์โลกที่ครองราชย์

แทนที่จะฝึกระบบ AI ที่แยกจากกันเพื่อแยกความแตกต่างระหว่างเสียงพื้นหลังและคำพูดที่ตื่น Xin Fan และเพื่อนร่วมงานได้รวมกลไกการจับคู่คำของพวกเขาเข้ากับโมเดลการรู้จำเสียงพูดแบบอัจฉริยะซึ่งเป็นมาตรฐานประดิษฐ์ นักวิทยาศาสตร์ได้ทดสอบสถาปัตยกรรม AI ของตัวถอดรหัสสองรูปแบบตามลำดับ นั่นคือ การใช้สถาปัตยกรรมที่ประมวลผลข้อมูลอินพุต (ภาพสแนปชอตของสัญญาณเสียงความยาวมิลลิวินาที) เพื่อสร้างลำดับเอาต์พุตที่สอดคล้องกัน (การเรนเดอร์สัทศาสตร์ของเสียง) และ เช่นเดียวกับเทคนิคการเข้ารหัส-ถอดรหัสทั่วไป องค์ประกอบการเข้ารหัสจะสรุปข้อมูลอินพุตเป็นเวกเตอร์ความยาวคงที่ (ชุดตัวเลข) แล้วแปลงเป็นข้อมูลเอาท์พุต ในขณะเดียวกัน กลไกความสนใจพิเศษ "ที่ได้รับการฝึกอบรม" เพื่อตรวจจับลักษณะพื้นฐานบางประการของคำปลุกในสตริงคำพูดตั้งแต่หนึ่งสตริงขึ้นไปจากสภาพแวดล้อมโดยรอบจะรับผิดชอบในการ "นำทาง" ชุด การถอดรหัสจะให้ความสำคัญกับคุณสมบัติเหล่านั้นในเวกเตอร์มากขึ้น

ระบบ AI ของ Amazon ช่วยลดข้อผิดพลาดในการจดจำเสียงบน Alexa ได้ถึง 15%

สหภาพยุโรป: ระบบ AI ควรได้รับการสร้างและใช้งานในลักษณะที่โปร่งใสและมีความรับผิดชอบ

ในการทดลอง นักวิจัยได้ฝึกหนึ่งในโมเดล AI ของตนเพื่อให้ความสำคัญกับการรู้จำการออกเสียงคำมากขึ้น ขั้นแรกโดยการเพิ่มองค์ประกอบที่เปรียบเทียบเสียงของคำโดยตรง ปลุกคำ ด้วยการออกเสียงที่หลากหลาย จากนั้นใช้ข้อมูลผลลัพธ์นี้เป็นอินพุตไปยังอีกคำหนึ่งที่แยกจากกัน ส่วนประกอบที่ได้รับการฝึกอบรมให้บีบอัดบิตของเวกเตอร์การเข้ารหัส ผลลัพธ์มีความน่าสนใจ โมเดลนี้ลดอัตราข้อผิดพลาดลงเหลือ 13% เทียบกับ 15%

ฝากความเห็น

6 วิธีในการเปิด Device Manager บน Windows 10

วิธีเปิดตัวจัดการอุปกรณ์ใน Windows 10 โดยง่าย

GPT4All คืออะไร? GPT4All ทำงานอย่างไร

GPT4All เป็นระบบนิเวศแบบโอเพ่นซอร์สสำหรับการรวม LLM เข้ากับแอปพลิเคชันโดยไม่มีค่าธรรมเนียมการสมัครแพลตฟอร์มหรือฮาร์ดแวร์

คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

หน่วยงานที่รวบรวมหน่วยงานเฝ้าระวังความเป็นส่วนตัวระดับชาติของยุโรป ระบุเมื่อวันพฤหัสบดีว่า ได้จัดตั้งคณะทำงานเฉพาะกิจเพื่อ ChatGPT

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

นักวิทยาศาสตร์ชาวเดนมาร์กและชาวอเมริกันได้ร่วมมือกันพัฒนาระบบ AI ที่เรียกว่า life2vec ซึ่งสามารถทำนายเวลาการตายของมนุษย์ได้อย่างแม่นยำสูง

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

อัลกอริธึม AI ที่เรียกว่า Audioflow สามารถฟังเสียงปัสสาวะเพื่อระบุการไหลที่ผิดปกติและปัญหาสุขภาพที่เกี่ยวข้องของผู้ป่วยได้อย่างมีประสิทธิภาพและประสบความสำเร็จ

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

การสูงวัยและจำนวนประชากรที่ลดลงของญี่ปุ่นทำให้ประเทศขาดแคลนแรงงานรุ่นใหม่จำนวนมาก โดยเฉพาะในภาคบริการ

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้ใช้ Reddit ชื่อ u/LegalBeagle1966 เป็นหนึ่งในผู้ใช้จำนวนมากที่หลงรัก Claudia เด็กสาวที่เหมือนดาราภาพยนตร์ที่มักจะแชร์ภาพเซลฟี่ที่เย้ายวนใจ แม้กระทั่งภาพเปลือย บนแพลตฟอร์มนี้

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

Microsoft เพิ่งประกาศว่าบริษัทเทคโนโลยีอีก 12 แห่งจะเข้าร่วมในโครงการ AI for Good

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

ผู้ใช้ @mortecouille92 ได้นำพลังของเครื่องมือออกแบบกราฟิก Midjourney มาใช้งาน และสร้างตัวละคร Dragon Ball อันโด่งดังในเวอร์ชันสมจริงที่ไม่เหมือนใคร เช่น Goku, Vegeta, Bulma และพี่ Kame

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

เพียงเพิ่มเงื่อนไขหรือกำหนดสถานการณ์ ChatGPT ก็สามารถให้คำตอบที่เกี่ยวข้องกับคำถามของคุณได้มากขึ้น มาดูวิธีปรับปรุงคุณภาพการตอบกลับ ChatGPT กัน