DeepMind ประกาศโอเพนซอร์สไลบรารี TRFL (อ่านว่า "ทรัฟเฟิล") เป็นไลบรารีรวมอัลกอริทึมสำหรับสร้างปัญญาประดิษฐแบบ reinforcement learning (RL) หรือปัญญาประดิษฐ์ที่ผ่านการเรียนรู้ว่าทำตามกฎหรือเกมได้สมบูรณ์หรือไม่ ตัวอย่างสำคัญของปัญญาประดิษฐ์แบบ RL คือ AlphaGo ในตัวปัญญาประดิษฐ์ผ่านการเรียนรู้ว่าจะเอาชนะเกมได้อแย่างไร ทาง DeepMind ระบุว่าปัญหาสำคัญของ RL คือมีชิ้นส่วนประกอบกันจำนวนมาก และการดีบักระบบก็ทำได้ยาก โดยมีการสำรวจว่าโค้ด agent ปัญญาประดิษฐ์แบบ RL ที่โอเพนซอร์สกันนั้นมีบั๊กที่ซ่อนอยู่และพบในภายหลัง กระทบต่อความก้าวหน้าววงการปัญญาประดิษฐ์ บั๊กบางตัวก็ทำให้การฝึกปัญญารประดิษฐ์ยากขึ้น เช่น ไม่สนใจค่าจากตัวอย่างบางตัว หรือบั๊กบางตัวก็ร้ายแรงถึงกับรายงานระดับความสำเร็จสูงกว่าความเป็นจริง DeepMind หวังว่าการเปิดไลบรารีที่ทดสอบมาอย่างดีเช่นนี้จะทำให้การวิจัยปัญญาประดิษฐ์ก้าวหน้ามากขึ้น ที่มา - DeepMind Topics: DeepMindOpen Source