ร่วมบริจาคเสียงพูดภาษาไทยด้วย Mozilla Common Voice

หัวข้อกระทู้ ใน 'เทคโนโลยี' เริ่มโพสต์โดย iPokz, 12 เมษายน 2021.

  1. iPokz

    iPokz ~" iPokz "~ Staff Member

    เทคโนโลยีการรู้จำเสียง (Speech Recognition) เป็นเทคโนโลยีที่ช่วยให้เราสื่อสารหรือสั่งงานกับคอมพิวเตอร์ได้ง่ายขึ้น ซึ่งระบบดังกล่าวเป็นที่นิยมกันอย่างเผยแพร่ ตัวอย่างเช่น ใช้งานในระบบผู้ช่วยอัจฉริยะ, ใช้สร้างคำบรรยายในวิดีโอ และใช้พิมพ์ข้อความตามเสียง เป็นต้น อย่างไรก็ตามเทคโนโลยีการรู้จำเสียงทุกภาษาต้องการชุดข้อมูลเสียงขนาดใหญ่สำหรับมาทำเทคโนโลยีดังกล่าว ยิ่งมีข้อมูลมากเท่าไร ความแม่นยำยิ่งสูงขึ้น แต่ชุดข้อมูลเสียงขนาดใหญ่จำนวนมากที่ถูกสร้างโดยบริษัทใหญ่ ๆ เราไม่สามารถใช้งานได้ เนื่องจากราคาที่แพงหรือติดลิขสิทธิ์ จึงทำให้บริษัทเล็ก ๆ หรือนักพัฒนาไม่สามารถเข้าถึงชุดข้อมูลดังกล่าวได้

    Mozilla ในฐานะองค์กรที่ไม่หวังผลกำไรจึงได้ทำโครงการ Common Voice ขึ้นมา เพื่อสร้างชุดข้อมูลเสียงสำหรับสร้างเทคโนโลยีการรู้จำเสียง ให้ทุกคนสามารถร่วมบริจาคเสียง ตรวจสอบเสียง และเพิ่มประโยคเข้าไปในระบบได้ โดยชุดข้อมูลเป็นสาธารณะประโยชน์ที่ทุกคนบนโลกสามารถใช้งานได้ นอกจากนั้น Mozilla ยังสร้างเครื่องมือสำหรับเทคโนโลยีการรู้จำเสียง ชื่อว่า Deep Speech

    สำหรับภาษาไทย ทาง Mozilla ได้เปิดรับบริจาคเสียงตั้งแต่ปีที่ผ่านมา ปัจจุบันมีจำนวน 17 ชั่วโมง และชั่วโมงที่ตรวจสอบแล้ว 12 ชั่วโมง โดยเป้าหมายคือ 10,000 ชั่วโมง เพื่อให้ได้ชุดข้อมูลเสียงที่นำไปใช้งานกับเทคโนโลยีการรู้จำเสียงได้จริง

    [​IMG]

    ร่วมบริจาค/ตรวจสอบเสียงภาษาไทยอย่างไร?


    เข้าไปที่ commonvoice.mozilla.org/th โดยไม่จำเป็นต้อง Login (แต่ Login ได้เพื่อให้ข้อมูลพวกอายุหรือเพศและจัดอันดับผู้บริจาค) จากนั้นคลิกที่รูปไมค์ เพื่อบริจาคเสียง โดยกดปุ่มไมค์เพื่อบริจาคเสียง แล้วกดหยุด จากนั้นคลิกส่ง ทำจนครบแล้วส่งเสียงได้ โดยพยายามพูดให้ครบตามที่ประโยคกำหนด ไม่ขาดหรือเกิน

    หากพบประโยคที่มี "ๆ", ภาษาอังกฤษ หรือ ตัวเลข ปนมา อย่าลืมกดปุ่ม รายงาน

    [​IMG]

    หรือ คลิกปุ่ม > เพื่อตรวจสอบเสียงโดยการฟัง จากนั้นกดปุ่ม > เพื่อฟัง ฟังจบแล้วกด ใช่ หรือ ไม่ ทำจนครบแล้วส่งได้เลย

    [​IMG]

    สำหรับเกณฑ์ในการฟัง ง่าย ๆ คือ เสียงพูดครบตามที่ประโยคกำหนด ฟังรู้เรื่อง

    เพิ่ม/ตรวจสอบประโยคก่อนนำไปรับบริจาค


    ต่อมาเป็นส่วนในการเพิ่ม/ตรวจสอบประโยคก่อนนำประโยคไปรับบริจาคเสียง โดยเข้าไปที่ commonvoice.mozilla.org/sentence-collector ให้ Login จากนั้นไป Profile เลือก Thai แล้วไปที่ REVIEW กด
     

แบ่งปันหน้านี้