กูเกิลโอเพนซอร์สโมเดลปัญญาประดิษฐ์ค้นหาภาพความแม่นยำสูง

หัวข้อกระทู้ ใน 'เทคโนโลยี' เริ่มโพสต์โดย iPokz, 27 กันยายน 2020.

  1. iPokz

    iPokz ~" iPokz "~ Staff Member

    กูเกิลนำเสนอโมเดลปัญญาประดิษฐ์ใหม่ DELG (DEep Local and Global Features) สำหรับแก้ปัญหาค้นหาภาพด้วยภาพ (Instance-Level Recognition - ILR) เช่นการค้นหาแบบ Google Images ที่ผู้ใช้สามารถใส่ภาพสถานที่ท่องเที่ยวเข้าไปแล้วบริการค้นหาจะคืนภาพสถานที่เดียวกันออกมาให้

    จุดเด่นของ DELG คือการใช้โมเดลเดียวตลอดการทำงาน โดยตัวโมเดลใช้ ResNet เป็นฐาน จากนั้นแยกส่วน global feature สำหรับค้นหาภาพที่ใกล้เคียงจากฐานข้อมูล และ local feature เพื่อเทียบความคล้ายแล้วเรียงลำดับผลการค้นหา

    ทีมงานทดสอบ DELG กับชุดข้อมูล Google Landmarks Dataset v2 (GLDv2) ที่เป็นภาพสถานที่ 5 ล้านภาพจากสถานที่ 200,000 แห่ง ได้ความแม่นยำถึง 61.2% แม้จะไม่ดีที่สุดเมื่อเทียบกับการแข่งขันจดจำสถานที่เมื่อปี 2019 แต่โมเดลจากการแข่งขันนั้นซับซ้อนหลายขั้นตอน ส่วนโมเดลของกูเกิลนั้นฝึกได้รวดเดียวจากภาพอินพุตไปจนถึงผลลัพธ์ (end-to-end)

    กูเกิลใส่ซอร์สโค้ดของ DELG ไว้ในโครงการ Tensorflow แล้ว และค่าพามิเตอร์ที่เทรนโมเดลมาได้ก็แจกไว้พร้อมกัน

    ที่มา - Google AI Blog

    [​IMG]

    โมเดล DELG ที่ใช้ส่วนเริ่มต้นของโมเดลร่วมกันระหว่าง global feature และ local feature ลดระยะเวลาเทรนโมเดลโดยรวม

    Topics: GoogleArtificial Intelligence
     

แบ่งปันหน้านี้