Meta เปิดตัว Voicebox ซึ่งเป็นโมเดล AI ที่รองรับการประมวลผลเสียงสำหรับผู้สร้าง

Meta เปิดตัว Voicebox ซึ่งเป็นโมเดล AI ที่รองรับการประมวลผลเสียงสำหรับผู้สร้าง

หลังจากข่าวลือนับไม่ถ้วน ในที่สุด Meta ก็ได้ประกาศอย่างเป็นทางการถึงโมเดล AI รุ่นล่าสุดที่เรียกว่า Voicebox โมเดลนี้ได้รับการออกแบบมาเพื่อช่วยให้ผู้สร้างเนื้อหาจัดการงานที่เกี่ยวข้องกับการสร้างเสียงได้อย่างมีประสิทธิภาพ เช่น การตัดต่อเสียง การสุ่มตัวอย่าง และการจัดสไตล์ แม้ว่าจะไม่ได้รับการฝึกอบรมเฉพาะก็ตาม เป็นไปได้ผ่านข้อมูลในบริบท

Meta ยืนยันอย่างมั่นใจว่าโมเดล AI ใหม่นี้จะ "เป็นประโยชน์ต่อผู้คนจำนวนมากทั่วโลก" ไม่ใช่แค่ในด้านการสร้างเนื้อหาเท่านั้น เช่น การช่วยให้คนตาบอดได้ยินข้อความด้วยเสียง ตลอดจนให้คนตาบอดพูดภาษาต่างประเทศด้วยเสียงของตนเองได้

กล่องเสียงได้รับการโฆษณาว่าสามารถสร้างคลิปเสียงคุณภาพสูงและแก้ไขคลิปเสียงที่บันทึกไว้ล่วงหน้าเพื่อลบการรบกวนที่ไม่ต้องการ เช่น แตรรถ ในขณะที่ยังคงเนื้อหาและสไตล์หลายภาษาไว้เหมือนเดิม (สร้างเสียงพูดในหกภาษาที่แตกต่างกัน) การพัฒนาในอนาคตที่วางแผนไว้ของ Meta สำหรับโมเดลนี้รวมถึงการให้เสียงที่เป็นธรรมชาติสำหรับผู้ช่วยภาพหรือตัวละครในเกมใน metaverse

Meta ยังเปรียบเทียบ Voicebox กับโมเดล AI ที่ขับเคลื่อนด้วยการประมวลผลเสียงอื่นๆ ที่มีอยู่ในตลาดปัจจุบัน โดยเฉพาะคู่แข่งสำคัญ เช่น Vall-E และ YourTTS โดยรวมแล้ว แบบจำลองของ Meta นั้นล้ำหน้าและมีประสิทธิภาพเหนือกว่าคู่แข่งเมื่อเปรียบเทียบอัตราข้อผิดพลาดของ Word และความคล้ายคลึงกันของสไตล์

Meta เปิดตัว Voicebox ซึ่งเป็นโมเดล AI ที่รองรับการประมวลผลเสียงสำหรับผู้สร้าง

Meta เปิดตัว Voicebox ซึ่งเป็นโมเดล AI ที่รองรับการประมวลผลเสียงสำหรับผู้สร้าง

กล่องเสียงสร้างขึ้นจาก Flow Matching นี่คือโมเดลการสร้างแบบไม่ถดถอยอัตโนมัติล่าสุดของ Meta ซึ่งสามารถจัดการการแมปที่ไม่สามารถกำหนดได้สูงระหว่างข้อความและคำพูด ซึ่งช่วยให้ Voicebox เรียนรู้จากข้อมูลคำพูดหลายประเภทโดยไม่ต้องติดป้ายกำกับอย่างระมัดระวัง ทำให้มีโอกาสเข้าถึงข้อมูลการฝึกอบรมที่หลากหลายและมีขนาดใหญ่มากขึ้น จนถึงปัจจุบัน Voicebox ได้รับการฝึกอบรมเกี่ยวกับการบันทึกเสียงพูดและการถอดเสียงหนังสือเสียงมากกว่า 50,000 ชั่วโมงในภาษาอังกฤษ ฝรั่งเศส สเปน เยอรมัน โปแลนด์ และโปรตุเกส

แม้ว่าเทคโนโลยีนี้สามารถนำไปสู่ยุคใหม่ของ AI ในการประมวลผลเสียงได้ แต่ Meta ยอมรับว่าอาจก่อให้เกิดการละเมิดและอันตรายที่ไม่ได้ตั้งใจได้ บทความวิจัยที่ Meta แบ่งปันเกี่ยวกับ Voicebox มีรายละเอียดเกี่ยวกับวิธีที่บริษัทสร้างตัวแยกประเภทที่มีประสิทธิภาพสูง ซึ่งสามารถแยกแยะระหว่างเสียงจริงและเสียงที่สร้างโดย Voicebox

Meta จะไม่ทำให้โปรแกรม AI Voicebox พร้อมใช้งานสาธารณะ และจะไม่ปล่อยซอร์สโค้ด อย่างน้อยก็ในตอนนี้


คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

หน่วยงานที่รวบรวมหน่วยงานเฝ้าระวังความเป็นส่วนตัวระดับชาติของยุโรป ระบุเมื่อวันพฤหัสบดีว่า ได้จัดตั้งคณะทำงานเฉพาะกิจเพื่อ ChatGPT

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

นักวิทยาศาสตร์ชาวเดนมาร์กและชาวอเมริกันได้ร่วมมือกันพัฒนาระบบ AI ที่เรียกว่า life2vec ซึ่งสามารถทำนายเวลาการตายของมนุษย์ได้อย่างแม่นยำสูง

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

อัลกอริธึม AI ที่เรียกว่า Audioflow สามารถฟังเสียงปัสสาวะเพื่อระบุการไหลที่ผิดปกติและปัญหาสุขภาพที่เกี่ยวข้องของผู้ป่วยได้อย่างมีประสิทธิภาพและประสบความสำเร็จ

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

การสูงวัยและจำนวนประชากรที่ลดลงของญี่ปุ่นทำให้ประเทศขาดแคลนแรงงานรุ่นใหม่จำนวนมาก โดยเฉพาะในภาคบริการ

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้ใช้ Reddit ชื่อ u/LegalBeagle1966 เป็นหนึ่งในผู้ใช้จำนวนมากที่หลงรัก Claudia เด็กสาวที่เหมือนดาราภาพยนตร์ที่มักจะแชร์ภาพเซลฟี่ที่เย้ายวนใจ แม้กระทั่งภาพเปลือย บนแพลตฟอร์มนี้

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

Microsoft เพิ่งประกาศว่าบริษัทเทคโนโลยีอีก 12 แห่งจะเข้าร่วมในโครงการ AI for Good

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

ผู้ใช้ @mortecouille92 ได้นำพลังของเครื่องมือออกแบบกราฟิก Midjourney มาใช้งาน และสร้างตัวละคร Dragon Ball อันโด่งดังในเวอร์ชันสมจริงที่ไม่เหมือนใคร เช่น Goku, Vegeta, Bulma และพี่ Kame

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

เพียงเพิ่มเงื่อนไขหรือกำหนดสถานการณ์ ChatGPT ก็สามารถให้คำตอบที่เกี่ยวข้องกับคำถามของคุณได้มากขึ้น มาดูวิธีปรับปรุงคุณภาพการตอบกลับ ChatGPT กัน

ตื่นตาตื่นใจกับภาพวาดที่สวยงามซึ่งวาดโดยปัญญาประดิษฐ์

ตื่นตาตื่นใจกับภาพวาดที่สวยงามซึ่งวาดโดยปัญญาประดิษฐ์

Midjourney คือระบบปัญญาประดิษฐ์ที่เพิ่งทำให้เกิด "กระแส" ขึ้นในชุมชนออนไลน์และโลกของศิลปิน เนื่องจากมีภาพวาดที่สวยงามอย่างยิ่งที่ไม่ด้อยไปกว่าภาพวาดของศิลปินตัวจริง

แบบจำลอง AI นี้เป็นหนึ่งใน ผู้เชี่ยวชาญ คนแรก ๆ ที่ค้นพบข่าวเกี่ยวกับการระบาดของโรคปอดบวมในหวู่ฮั่น

แบบจำลอง AI นี้เป็นหนึ่งใน ผู้เชี่ยวชาญ คนแรก ๆ ที่ค้นพบข่าวเกี่ยวกับการระบาดของโรคปอดบวมในหวู่ฮั่น

ไม่กี่วันหลังจากที่จีนประกาศการระบาด ด้วยการเข้าถึงข้อมูลการขายตั๋วเครื่องบินทั่วโลก ระบบ AI ของ BlueDot ยังคงคาดการณ์การแพร่กระจายของไวรัสโคโรน่าหวู่ฮั่นไปยังกรุงเทพฯ โซล ไทเป และโตเกียวได้อย่างแม่นยำ