Facebook สร้าง AI ที่สามารถแปลภาษาต่างๆ ได้ 100 ภาษา โดยไม่ต้องแปลภาษาอังกฤษก่อน

Facebook สร้าง AI ที่สามารถแปลภาษาต่างๆ ได้ 100 ภาษา โดยไม่ต้องแปลภาษาอังกฤษก่อน

Facebook เพิ่งสร้างโมเดล AI แบบโอเพ่นซอร์สที่มีความสามารถในการแปลที่น่าประทับใจถึง 100 ภาษา โดยไม่จำเป็นต้องแปลเป็นภาษาอังกฤษก่อนเป็นขั้นตอนกลาง ซึ่งมักพบในเครื่องมือแปลที่ใช้ปัญญาประดิษฐ์ในปัจจุบัน

โมเดล AI นี้ เรียกว่า M2M-100 และปัจจุบันอยู่ในระดับโครงการวิจัยเท่านั้น อย่างไรก็ตาม เมื่อขั้นตอนการพัฒนาเสร็จสมบูรณ์ (ในอนาคตอันใกล้) ก็สามารถใช้เพื่อแก้ปัญหาการแปลโพสต์และความคิดเห็นของผู้ใช้ Facebook ได้อย่างสมบูรณ์ - จากหลากหลายภาษา ภาษาต่างๆ ทั่วโลก จากสถิติล่าสุด ปัจจุบันผู้ใช้ Facebook มากกว่า 2/3 ไม่ได้ใช้ภาษาอังกฤษในการสื่อสารบนแพลตฟอร์มโซเชียลเน็ตเวิร์กนี้

“นักวิจัย AI ของเราทำงานอย่างหนักมาหลายปีเพื่อสร้างและพัฒนาแบบจำลองทั่วไปเพียงตัวเดียวที่สามารถเข้าใจภาษาที่หลากหลายในสถานการณ์และงานที่หลากหลาย . โมเดลเดียวที่รองรับทุกภาษา ภาษาถิ่น และการอัปเดตและปรับปรุงการแปลอย่างต่อเนื่องจะช่วยให้เรามอบประสบการณ์ที่ดีขึ้นสำหรับผู้ใช้ Facebook นับพันล้านคน ” นักวิจัย AI Facebook Angela Fan กล่าวในโพสต์ที่วางไว้บน blogpost.al

Facebook สร้าง AI ที่สามารถแปลภาษาต่างๆ ได้ 100 ภาษา โดยไม่ต้องแปลภาษาอังกฤษก่อน

โมเดล AI ใหม่สามารถรองรับการแปลได้หลายประเภทบน Facebook

M2M-100 ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลคู่ประโยคทั่วไป 7.5 พันล้านคู่จาก 100 ภาษา ทั้งหมดนี้รวบรวมจากอินเทอร์เน็ต Facebook กล่าวว่าทรัพยากรทั้งหมดเป็นโอเพ่นซอร์สและใช้ข้อมูลสาธารณะ

ในการจัดการฐานข้อมูลการฝึกอบรมขนาดใหญ่ดังกล่าว นักวิจัย AI ของ Facebook มุ่งเน้นไปที่การแปลภาษาที่มีการร้องขอมากที่สุดเป็นหลัก ขณะเดียวกันก็จำกัดประโยคและภาษาที่หายาก จากนั้นพวกเขาจะจัดกลุ่มภาษาเหล่านี้ออกเป็น 14 กลุ่มที่แตกต่างกัน โดยพิจารณาจากความคล้ายคลึงกันทางภาษา ภูมิศาสตร์ และวัฒนธรรม แนวทางนี้ถือว่าเหมาะสมกว่า เนื่องจากผู้คนในประเทศที่มีลักษณะเหมือนกันข้างต้นจะได้รับประโยชน์มากขึ้นจากการแปลที่ได้รับการปรับปรุงในกลุ่มภาษาที่กำหนด

ภาษาที่เป็นของกลุ่มต่าง ๆ จะเชื่อมต่อกันผ่านภาษาบริดจ์จำนวนเล็กน้อย ในตัวอย่างของกลุ่มภาษาอินเดีย ฮินดี เบงกาลี และทมิฬทำหน้าที่เป็นสะพานเชื่อมสำหรับภาษาอินโด-อารยัน ตลอดกระบวนการรวบรวมและคัดเลือกทั้งหมด นักวิจัยได้รับชุดข้อมูลที่ประกอบด้วยประโยคคู่ขนาน 7.5 พันล้านประโยค ซึ่งสอดคล้องกับทิศทางการแปล 2,200 ทิศทาง

สำหรับภาษาที่ขาดข้อมูลการแปลที่มีคุณภาพ นักวิจัยได้ใช้วิธีการที่เรียกว่า back-translation เพื่อสร้างการแปลสังเคราะห์ที่สามารถเสริมข้อมูลที่ขุดได้

โดยรวมแล้วการผสมผสานเทคนิคเหล่านี้ทำให้เกิดโมเดลการแปลด้วยเครื่องหลายภาษา (MMT) ตัวแรกของโลกที่สามารถแปลระหว่างภาษาใดก็ได้จาก 100 ภาษาโดยไม่ต้องอาศัยข้อมูล ตามคำแถลงของ Facebook ระบุว่าภาษาอังกฤษเป็นมาตรฐาน

"ตัวอย่างเช่น โดยปกติแล้ว เมื่อแปลจากภาษาจีนเป็นภาษาฝรั่งเศส โมเดลการแปลหลายภาษาในปัจจุบันส่วนใหญ่จะเน้นภาษาอังกฤษเป็นหลัก พวกเขาจะแปลภาษาจีนเป็นภาษาอังกฤษ และจากภาษาอังกฤษเป็นภาษาฝรั่งเศส เนื่องจากข้อมูลการฝึกอบรมภาษาอังกฤษมีมากที่สุดและได้รับความนิยมด้วย แทน แบบจำลองของเราจะแปลข้อมูลภาษาจีนเป็นภาษาฝรั่งเศสโดยตรงเพื่อให้มั่นใจว่าการแปลมีความหมายสูงสุด"

ปัจจุบัน M2M-100 ยังไม่ได้รวมเข้ากับผลิตภัณฑ์ใดๆ แต่การทดสอบแสดงให้เห็นว่าสามารถรองรับการแปลหลายประเภทบน Facebook ซึ่งผู้คนยังคงโพสต์เนื้อหาทุกชั่วโมงในกว่า 160 ภาษา


คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

หน่วยงานที่รวบรวมหน่วยงานเฝ้าระวังความเป็นส่วนตัวระดับชาติของยุโรป ระบุเมื่อวันพฤหัสบดีว่า ได้จัดตั้งคณะทำงานเฉพาะกิจเพื่อ ChatGPT

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

นักวิทยาศาสตร์ชาวเดนมาร์กและชาวอเมริกันได้ร่วมมือกันพัฒนาระบบ AI ที่เรียกว่า life2vec ซึ่งสามารถทำนายเวลาการตายของมนุษย์ได้อย่างแม่นยำสูง

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

อัลกอริธึม AI ที่เรียกว่า Audioflow สามารถฟังเสียงปัสสาวะเพื่อระบุการไหลที่ผิดปกติและปัญหาสุขภาพที่เกี่ยวข้องของผู้ป่วยได้อย่างมีประสิทธิภาพและประสบความสำเร็จ

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

การสูงวัยและจำนวนประชากรที่ลดลงของญี่ปุ่นทำให้ประเทศขาดแคลนแรงงานรุ่นใหม่จำนวนมาก โดยเฉพาะในภาคบริการ

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้ใช้ Reddit ชื่อ u/LegalBeagle1966 เป็นหนึ่งในผู้ใช้จำนวนมากที่หลงรัก Claudia เด็กสาวที่เหมือนดาราภาพยนตร์ที่มักจะแชร์ภาพเซลฟี่ที่เย้ายวนใจ แม้กระทั่งภาพเปลือย บนแพลตฟอร์มนี้

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

Microsoft เพิ่งประกาศว่าบริษัทเทคโนโลยีอีก 12 แห่งจะเข้าร่วมในโครงการ AI for Good

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

ผู้ใช้ @mortecouille92 ได้นำพลังของเครื่องมือออกแบบกราฟิก Midjourney มาใช้งาน และสร้างตัวละคร Dragon Ball อันโด่งดังในเวอร์ชันสมจริงที่ไม่เหมือนใคร เช่น Goku, Vegeta, Bulma และพี่ Kame

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

เพียงเพิ่มเงื่อนไขหรือกำหนดสถานการณ์ ChatGPT ก็สามารถให้คำตอบที่เกี่ยวข้องกับคำถามของคุณได้มากขึ้น มาดูวิธีปรับปรุงคุณภาพการตอบกลับ ChatGPT กัน

ตื่นตาตื่นใจกับภาพวาดที่สวยงามซึ่งวาดโดยปัญญาประดิษฐ์

ตื่นตาตื่นใจกับภาพวาดที่สวยงามซึ่งวาดโดยปัญญาประดิษฐ์

Midjourney คือระบบปัญญาประดิษฐ์ที่เพิ่งทำให้เกิด "กระแส" ขึ้นในชุมชนออนไลน์และโลกของศิลปิน เนื่องจากมีภาพวาดที่สวยงามอย่างยิ่งที่ไม่ด้อยไปกว่าภาพวาดของศิลปินตัวจริง

แบบจำลอง AI นี้เป็นหนึ่งใน ผู้เชี่ยวชาญ คนแรก ๆ ที่ค้นพบข่าวเกี่ยวกับการระบาดของโรคปอดบวมในหวู่ฮั่น

แบบจำลอง AI นี้เป็นหนึ่งใน ผู้เชี่ยวชาญ คนแรก ๆ ที่ค้นพบข่าวเกี่ยวกับการระบาดของโรคปอดบวมในหวู่ฮั่น

ไม่กี่วันหลังจากที่จีนประกาศการระบาด ด้วยการเข้าถึงข้อมูลการขายตั๋วเครื่องบินทั่วโลก ระบบ AI ของ BlueDot ยังคงคาดการณ์การแพร่กระจายของไวรัสโคโรน่าหวู่ฮั่นไปยังกรุงเทพฯ โซล ไทเป และโตเกียวได้อย่างแม่นยำ