MIT ถอนชุดข้อมูลฝึก AI หลังพบภาพถูกบรรยายด้วยคำหยาบและดูถูก, ขอให้นักวิจัยอื่นเลิกใช้งาน

หัวข้อกระทู้ ใน 'เทคโนโลยี' เริ่มโพสต์โดย iPokz, 2 กรกฎาคม 2020.

  1. iPokz

    iPokz ~" iPokz "~ Staff Member

    MIT ถอนชุดข้อมูล Tiny Images ออกจากเว็บหลังจากมีรายงานว่าภาพหลายพันภาพถูกบรรยายด้วยคำหยาบและดูถูก เช่น โสเภณี, พวกล่อลวงเด็ก (child molester), ไอ้มืด (nigger) รวมถึงมีภาพไม่เหมาะสม จนทำให้ให้วิจัย Computer Science and Artificial Intelligence Lab (CSAIL) ตัดสินใจถอดชุดข้อมูลออกจากเว็บ และขอให้นักวิจัยกลุ่มอื่นเลิกใช้ชุดข้อมูลนี้และลบออกจากเว็บเช่นกัน

    Tiny Images เป็นชุดข้อมูลภาพ 80 ล้านภาพที่มีขนาดเพียง 32x32 พิกเซล โดยเป็นภาพที่ดาวน์โหลดจากอินเทอร์เน็ตแล้วย่อลงมา โดยชุดข้อมูลสร้างจากการใช้คำค้นใน WordNet นำคำในรายการไปค้นจาก search engine หาภาพแล้วนำมาจับคู่กับคำค้น

    ศาสตราจารย์ Antonio Torralba จาก CSAIL ระบุว่าทีมวิจัยควรตรวจสอบภาพด้วยมือก่อนใส่ในชุดข้อมูล แต่ภาพที่ย่อไปแล้วนี้มีขนาดเล็กจนตรวจสอบได้ยาก (ทีมวิจัยไม่ได้เก็บภาพขนาดเต็มไว้) จึงตัดสินใจถอดชุดข้อมูลออกไปทั้งชุด

    ที่มา - The Register

    [​IMG]

    Topics: MITArtificial Intelligence
     

แบ่งปันหน้านี้