Data Scientist จาก True สร้างระบบตัดคำแบบ Deep Learning ด้วย Keras เปิดซอร์สแบบ MIT

Discussion in 'เทคโนโลยี' started by iPokz, Jun 26, 2017.

  1. iPokz

    iPokz ~" iPokz "~ Staff Member

    คุณรักพงษ์ กิตตินราดร และคุณกรกฎ เชาวะวณิช Data Scientist จาก True Corporation เปิดซอร์สโครงการ deepcut ระบบตัดคำแบบ deep learning โดยพัฒนาด้วย Keras

    ข้อมูลที่ใช้เทรนเป็นชุดข้อมูล BEST ของ NECTEC โดยแบ่งข้อมูลสำหรับฝึก 90% และข้อมูลสำหรับทดสอบอีก 10% โมเดลพยายามระบุว่าแต่ละตัวอักษรเป็นจุดเริ่มต้นของคำหรือไม่ (ตามโค้ดคือค่ามากกว่า 0.5) โดยเมื่อทดสอบกับข้อมูลทดสอบได้ความแม่นยำ f1 score 98.8%, precision score 98.6%, และ recall score 99.1%

    ผมทดสอบดูเทียบกับ libthai ที่ใช้งานกันในลินุกซ์ในภาพท้ายข่าว โดยใช้ประโยคตัวอย่าง "คุณบ็อตบอกว่าวันนี้พิมพ์ไม่ผิดแต่ตัดแบบนี้จะดีเหรอ คณะกรรมการการเลือกตั้งกรมวิทยาศาสตร์การแพทย์ เขานอนตากลมตากลมไปมา"

    ที่มา - GitHub:rkcosmos/deepcut, Thailand Deep Learning

    ผลจาก deepcut

    [​IMG]

    ผลจาก libthai

    [​IMG]

    Topics: Deep LearningTrueThailand
     

Share This Page