กูเกิลเสนอ SimCLR เฟรมเวิร์คสำหรับจัดหมวดหมู่ภาพโดยใช้ภาพน้อยลง

Discussion in 'เทคโนโลยี' started by iPokz, Apr 14, 2020.

  1. iPokz

    iPokz ~" iPokz "~ Staff Member

    กูเกิลเสนอเฟรมเวิร์ค SimCLR สำหรับการฝึกโมเดล deep learning เพื่อการจัดหมวดหมู่ภาพ (image classification) โดยใช้ภาพที่จัดหมวดหมู่ไว้ล่วงหน้าให้น้อยลง จากความสามารถในการฝึกโมเดลด้วยข้อมูลที่ไม่ได้จัดหมวดหมู่ไว้ล่วงหน้า

    SimCLR อาศัยการดัดแปลงโมเดลจัดหมวดหมู่ภาพ ResNet รับภาพที่ถูกดัดแปลง (augmented) มาสร้างข้อมูลแทนภาพ (image repesentation) แล้วแปลงข้อมูลซ้ำด้วยโมเดลแบบ fully-connected เพื่อแปลงข้อมูลให้เห็นลักษณะของภาพที่ถูกดัดแปลงมาให้ชัดเจนขึ้น จากนั้นนำข้อมูลแทนภาพนี้มาฝึกกันเอง โดยหากภาพต้นทางเป็นภาพเดียวกันที่ถูกแปลงมาคนละแบบให้พยายามดึงข้อมูลให้ใกล้กัน (attract) ถ้าเป็นคนละภาพให้ดันให้ข้อมูลแทนภาพต่างกัน (repel) กระบวนการฝึกเช่นนี้ทำให้ไม่ต้องใช้ข้อมูลภาพที่มีหมวดหมู่กำกับอยู่ก่อนแล้ว

    กูเกิลทดสอบ SimCLR โดยฝึกกับชุดข้อมูล ImageNet และแสดงให้เห็นประสิทธิภาพในสองแง่ ด้านแรกคือความแม่นยำสูงเมื่อใช้ข้อมูลน้อย โดยใช้ข้อมูลเพียง 1% ยังสามารถทำความแม่นยำได้ 63% ดีกว่าโมเดลแบบเดียวกันก่อนหน้านี้อย่าง CPCv2 ที่ทำได้ 52.7% อีกด้านคือความเร็วในการฝึกเมื่อใช้ข้อมูลเต็ม โดยเมื่อใช้ SimCLR ที่ฝึกกับข้อมูลที่ไม่ได้หมวดหมู่มาก่อนมาฝึกกับภาพ ImageNet เต็มรูปแบบ สามารถทำความแม่นยำได้ 80.1% ภายใน 30 epoch ขณะที่การฝึก ResNet-50 จากศูนย์ทำความแม่นยำได้เพียง 78.4% แม้ฝึกไปแล้วถึง 90 epoch

    ซอร์สโค้ด SimCLR อยู่บน GitHub ของ Google Research

    ที่มา - Google AI Blog

    [​IMG]

    Topics: Artificial IntelligenceGoogle
     

Share This Page