กูเกิลรายงานโครงการ Unison ตั้งเป้าสร้างระบบออกเสียงจากข้อความในภาษาที่มีข้อมูลน้อย

หัวข้อกระทู้ ใน 'เทคโนโลยี' เริ่มโพสต์โดย iPokz, 9 กันยายน 2015.

  1. iPokz

    iPokz ~" iPokz "~ Staff Member

    กูเกิลรายงานถึงโครงการวิจัย Unison เป็นโครงการเพื่อการเก็บข้อมูลพัฒนาระบบออกเสียงจากข้อความ (text-to-speech - TTS) จากภาษาที่มีข้อมูลน้อย (low resource languages) โดยเลือกภาษาบังคลาเทศ และใช้อาสาสมัครที่เป็นพนักงานของกูเกิลเองมาช่วยพูดให้เสียง

    ทางโครงการพัฒนาเครื่องมือที่ชื่อว่า ChitChat เป็นเว็บแอพที่บันทึกเสียงตามข้อความที่กำหนด สำรวจเสียง, รบกวนในห้อง, และเล่นไฟล์ที่บันทึกไปแล้ว อุปกรณ์ทั้งชุดมีราคาไม่ถึง 2,000 ดอลลาร์ ส่วนประโยคที่ต้องอ่าน ใช้เวลาบันทึกเสียงทั้งหมด 3 วัน บันทึกครั้งละ 250 ประโยค แต่ละครั้งใช้เวลา 30-60 นาที รวมทั้งหมด 2000 ข้อความ โดยเลือกข้อความจากการวิเคราะห์ฐานข้อมูล Wikipedia

    ตอนนี้ทีมงานใช้โมเดลเสียงจากสถาบันเทคโนโลยีอินเดีย แต่โมเดลเสียงยังต่างจากเสียงที่ทีมงานใช้อยู่บ้าง อย่างไรก็ดี เสียงที่ออกมาจาก TTS ต้นแบบดีกว่าที่คาดไว้

    ที่มา - Google Research

    [​IMG]

    Google, Text-to-Speech, Research
     

แบ่งปันหน้านี้