กูเกิลเปิดซอร์ส Live Transcribe โปรแกรมแปลงเสียงเป็นข้อความ ใช้ Cloud Speech API

หัวข้อกระทู้ ใน 'เทคโนโลยี' เริ่มโพสต์โดย iPokz, 19 สิงหาคม 2019.

  1. iPokz

    iPokz ~" iPokz "~ Staff Member

    กูเกิลเปิดตัวโปรแกรม Live Transcribe มาตั้งแต่ต้นปีที่ผ่านมา ตอนนี้โปรแกรมก็เปิดเป็นโอเพนซอร์สให้นำไปคอมไพล์ (และจ่ายเงินค่า API) กันเองได้แล้ว

    แม้โปรแกรมจะใช้ฟีเจอร์แปลงเสียงเป็นข้อความของ Cloud Speech API เป็นหลัก แต่ตัวโปรแกรมเองก็มีความสามารถเพิ่มเติมหลายอย่าง ได้แก่

    • ทนทานต่อเน็ตเวิร์คดับ สามารถรอการเชื่อมต่ออินเทอร์เน็ตได้หนึ่งชั่วโมง
    • เก็บข้อมูลความมั่นใจ, หมายเลขประจำผู้พูด (ทำจากตัวแอปโดยตรง)
    • ตรวจจับช่วงเวลาเริ่มพูดและหยุดพูด ทำให้ไม่ต้องส่งข้อมูลเสียงตลอดเวลา
    • เปลี่ยนไปใช้เอนจินแบบออฟไลน์ได้

    ตัวไลบรารีเป็นสัญญาอนุญาตแบบ Apache 2.0 แต่โมเดลการตรวจจับผู้พูดหรือช่วงเวลาเริ่มพูดไมได้โอเพนซอร์สมาด้วย รวมถึงชุดทดสอบต่างๆ ก็ไม่ได้โอเพนซอร์สเช่นกัน

    ที่มา - Google Live Transcribe Speech Engine

    Topics: GoogleOpen Source
     

แบ่งปันหน้านี้