รู้จัก Accurately.ai เพราะ AI เริ่มต้นที่ข้อมูลคุณภาพ

หัวข้อกระทู้ ใน 'เทคโนโลยี' เริ่มโพสต์โดย iPokz, 9 พฤศจิกายน 2020.

  1. iPokz

    iPokz ~" iPokz "~ Staff Member

    AI หรือ Artificial Intelligence เทคโนโลยีที่คนทั่วโลกต่างรู้จัก และกำลังมาแรงในโลกธุรกิจ ทำให้องค์กรจำนวนมากมีความพยายามนำ AI มาประยุกต์ใช้เพื่อเพิ่มขีดความสามารถในการแข่ง จะเห็นได้จาก Gartner’s Hype Cycle for Emerging Technology ประจำปี 2020 นั้น มี AI เป็นส่วนประกอบ 1 ใน 3 ของเทรนเทคโนโลยีที่กำลังมาแรงที่สุด

    [​IMG][​IMG]
    2020 Gartner’s Hype Cycle for Emerging Technology

    หนึ่งในสาขาของ AI ที่มีการนำมาประยุกต์ใช้ในธุรกิจมากในระยะหลังคือ machine learning หรือการเรียนรู้ของเครื่องจักร เป็นการพัฒนา AI ด้วยการสร้างแบบจำลองสมองหรือ neural network เพื่อเรียนรู้การทำงานจากตัวอย่างข้อมูลที่ถูกป้อนเข้าไป ซึ่งสามารถแก้ปัญหาที่มีความซับซ้อนมากกว่าการพัฒนา AI ในรูปแบบดั้งเดิม

    ตัวอย่างกรณีศึกษา ที่เป็นที่รู้จักกันอย่างกว้างขวาง ได้แก่ ระบบรถไร้คนขับของ Tesla, การตรวจจับ defect บนสินค้าในโรงงาน, การตรวจหาความผิดปกติของฟิล์มเอกซเรย์, การตรวจจับความผิดปกติของพืชในอุตสาหกรรมการเกษตร

    [​IMG]
    (1) การตรวจจับวัตถุในระบบรถไร้คนขับ
    [​IMG]
    (2) การตรวจจับความผิดปกติของพืชในฟาร์มการเกษตร
    [​IMG]
    (3) การตรวจจับ defect บนสินค้าจากโรงงานอุตสาหกรรม

    จะเห็นได้ว่าจากตัวอย่างกรณีศึกษาข้างต้น AI สามารถเป็นเครื่องมือที่ช่วยลดความผิดพลาด ลดต้นทุนการใช้แรงงาน ทั้งยังสร้างโอกาสทางธุรกิจใหม่ๆ มากขึ้นอีกด้วย ดังนั้น AI จึงกลายเป็นปัจจัยที่จะช่วยขับเคลื่อนองค์กรให้มีประสิทธิภาพ และมีศักยภาพในการแข่งขันมากยิ่งขึ้น

    มีขั้นตอนอะไรบ้างในการสร้าง Machine Learning AI?


    [​IMG]
    ที่มา: medium.com/@devendra

    ในการพัฒนา AI ข้อมูล เป็นสิ่งที่สำคัญที่สุดที่ช่วยทำให้ AI เรียนรู้และทำงานได้อย่างมีประสิทธิภาพ สิ่งแรกที่ควรคำนึงถึงคือปริมาณข้อมูลที่ใช้ว่ามีจำนวนมากเพียงพอ แม้งานหลายอย่างมีความต้องการปริมาณข้อมูลที่ไม่เท่ากัน แต่สิ่งที่เหมือนกันคือ ยิ่งมีปริมาณข้อมูลมากเท่าไรก็ยิ่งดีกับการพัฒนาและคุณภาพของ AI มากเท่านั้น

    นอกจากปริมาณข้อมูลแล้ว อีกสิ่งหนึ่งที่มีความสำคัญไม่แพ้กันคือ คุณภาพข้อมูล โดยขั้นตอนนี้ถือว่ามีความสำคัญที่สุดในการสร้าง AI เนื่องจากคุณภาพของข้อมูลจะส่งผลต่อความแม่นยำของ AI อย่างมาก เพราะข้อมูลที่ผิดจะส่งผลให้ AI เรียนรู้แบบผิดๆ และทำให้ AI นั้นมีความผิดพลาดสูงเมื่อนำไปใช้งาน อย่างที่กล่าวกันว่า “garbage in, garbage out” ดังนั้น ขั้นตอนการตรวจสอบและปรับปรุงคุณภาพของข้อมูลจึงมีความสำคัญอย่างยิ่ง

    ขั้นตอนการเตรียมข้อมูลควรเป็นอย่างไร


    การเตรียมข้อมูลจัดเป็นสิ่งสำคัญลำดับต้นๆ สำหรับการสร้าง AI ในการเตรียมข้อมูลสำหรับการพัฒนา AI ในองค์กรนั้น จำเป็นต้องมีกระบวนการจัดทำข้อมูลหรือ Data Labelling Workflow

    โดยเริ่มจากการกำหนดรูปแบบและประเภทของข้อมูลที่ต้องการ จากนั้นทำการหาข้อมูลเหล่านั้นโดยอาจจะเป็นได้ทั้งข้อมูลที่มีในองค์กรอยู่แล้ว ข้อมูลดิบ หรือข้อมูลที่สามารถหาได้ทั่วไปบนโลกอินเตอร์เน็ตก็เป็นได้

    เมื่อเราได้ข้อมูลที่ต้องการมาแล้วขั้นตอนต่อไปคือการจำแนกข้อมูลหรือ Data Labelling ซึ่งสามารถทำได้หลากหลายวิธีขึ้นอยู่กับรูปแบบของข้อมูลที่ต้องการใช้ ทั้งการ Label แบบพื้นฐานอย่างข้อมูลทั่วไปที่สามารถจัดการได้ด้วยวิธีการที่ไม่ซับซ้อน หรือ การ Label ข้อมูลที่มีความซับซ้อน เช่น การจำแนกรูปภาพที่ต้องมีกระบวนการจัดการซับซ้อนมากกว่าการ Label ข้อมูลปกติ

    แต่สิ่งสำคัญที่ต้องคำนึงถึงคือการวางแผนการเก็บรักษาข้อมูลและการจัดการข้อมูลต้องปลอดภัย สอดคล้องกับข้อกำหนดต่างๆ เช่น กฎหมายคุ้มครองข้อมูลส่วนบุคคลหรือมาตรฐานต่างๆ ที่เกี่ยวข้อง (ISO27001)

    อุปสรรค ในการจำแนกข้อมูลเพื่อเทรน AI


    การจำแนกข้อมูลจำเป็นต้องใช้ผู้ที่มีความรู้และความเชี่ยวชาญ ในการกำหนดทิศทาง และการบริหารงาน เพื่อความมีประสิทธิภาพ เพราะหากขาดความรู้ความเชี่ยวชาญก็อาจจะก่อให้เกิดอุปสรรคต่างๆ ได้ดังนี้


    ด้านต้นทุน

    • ต้นทุนด้านเครื่องมือการทำงานสูง เช่น กรณีที่ต้องสร้างระบบเพื่อจำแนกข้อมูลเอง
    • ต้นทุนการบริหารบุคลากร ไม่ว่าจะเป็นทั้งการจัดการทีมงานภายในองค์กร หรือการจัดจ้างทีมงานภายนอก

    ด้านระบบ

    • หาเครื่องมือที่ใช้คัดแยกให้เหมาะสมกับข้อมูลขององค์กรได้ยาก
    • การสร้างเครื่องมือใช้งานเองโดยทีม development อาจตอบโจทย์ความต้องการขององค์กรได้ แต่ต้องใช้ระยะเวลานาน เป็นผลทำให้ต้นทุนในการพัฒนาและดูแลรักษาสูงตามไปด้วย
    • การวัดผลการทำงานเพื่อนำมาปรับปรุงและพัฒนาคุณภาพ สามารถทำได้ยากหากไม่มีเครื่องมือที่ใช้วัดผลที่ดีพอ

    ด้านทรัพยากรมนุษย์

    • หาผู้มีความรู้และมีความเข้าใจที่จะทำระบบจำแนกข้อมูลให้ตอบโจทย์และเหมาะสมกับการนำข้อมูลไปใช้พัฒนา AI ได้ยาก
    • การวางแผนการทำงาน ลำดับขั้นตอน และการรวบรวมข้อมูล มีความซับซ้อนยากต่อการบริหารจัดการ
    • อาจต้องใช้พนักงานเป็นจำนวนมากเพื่อจำแนกข้อมูล
    • ต้องใช้ระยะเวลาในการหาพนักงานและการฝึกฝน พัฒนาศักยภาพพนักงาน เพื่อให้เข้าใจวิธีการทำงาน จนสามารถคัดแยกข้อมูลให้ถูกต้องและมีประสิทธิภาพสูงสุด
    ให้ Accurately.ai ช่วยคุณ


    [​IMG]

    หากคุณกำลังมองหาตัวช่วยที่จะทำให้ Data Labelling Workflow ของคุณทำได้ง่ายและมีประสิทธิภาพมากขึ้น Accurately.ai สามารถช่วยให้คุณทำงานได้อย่างสะดวกสบายบน Feature ที่หลากหลาย พร้อมการจัดเก็บข้อมูลบนเซิร์ฟเวอร์ที่มีความปลอดภัยสูงอย่าง Amazon AWS ทำให้ผู้ใช้งานเกิดความมั่นใจเรื่องความปลอดภัยของข้อมูล ทั้งยังสามารถจัดการระบบ ติดตามผล รวมถึงดาวน์โหลดข้อมูลของคุณได้ทุกที่ที่ต้องการ

    Labelling Tools

    ในปัจจุบัน Accurately.ai มีเครื่องมือรองรับการทำ Data labelling หลากหลายรูปแบบ ได้แก่ image classification, object detection, และ image segmentation

    • Image Classification หรือ การจำแนกประเภทรูปภาพให้อยู่ในหมวดหมู่ที่กำหนดไว้
    • Object Detection หรือ การจำแนกองค์ประกอบในรูปภาพพร้อมกรอบแสดงผล
    • Image Segmentation หรือ การระบายสีทับเพื่อจำแนกองค์ประกอบต่างๆในรูปภาพ

    นอกจากเครื่องมือที่กล่าวไปแล้ว Accurately.ai ยังมีเครื่องมือพิเศษที่ช่วยอำนวยความสะดวกและประหยัดเวลาทำงานให้แก่ผู้ใช้บริการด้วย คือ การ pre-label objects หรือการให้ AI ของ Accurately ช่วย label รูปภาพ ซึ่งมีให้เลือกมากกว่า 90 ประเภท

    Project Management

    [​IMG]
    หน้า Dashboard แสดงภาพรวมของโปรเจกต์ต่างๆ

    Accurately.ai ยังช่วยอำนวยความสะดวกในการจัดการข้อมูลหลังบ้าน ตั้งแต่การอัพโหลดข้อมูลรูปภาพสูงสุด 1 TB เข้าระบบที่รองรับข้อมูลปริมาณมาก สร้างและจัดการโปรเจกต์ได้หลากหลาย รองรับการควบคุมสิทธิ์ในการเข้าถึงข้อมูล พร้อมหน้า dashboard ที่จะช่วยแสดงภาพรวมและความคืบหน้าในการทำงานของแต่ละโปรเจกต์ ช่วยให้ผู้ใช้งานสามารถจัดการปัญหาต่างๆได้อย่างทันท่วงที

    Accuracy

    เพราะความถูกต้องของข้อมูลคือสิ่งสำคัญ Accurately.ai จึงมีเครื่องมือที่ใช้เพื่อตรวจสอบความถูกต้องของข้อมูลหลังจากการ label ให้ QA/QC ทำการตรวจสอบ เพื่อให้ผู้ใช้บริการมั่นใจว่าจะได้ชุดข้อมูลที่มีคุณภาพในการนำไปใช้งาน ซึ่งสามารถแสดงผลได้ทั้งในรูปแบบความถูกต้องของชุดข้องมูล (Data Set) และความถูกต้องของ Labeller เป็นรายบุคคล เพื่อให้ผู้จัดการทีมสามารถประเมินประสิทธิ์ภาพและปรับปรุงการทำงานของ Labeller ได้

    [​IMG]
    หน้าแสดงผลภาพรวม
    [​IMG][​IMG]
    ตัวอย่าง : หน้าตรวจสอบความถูกต้องของข้อมูล

    Performance Tracking

    นอกจากเรื่องความถูกต้องแล้วระบบของ Accurately.ai ยังสามารถเก็บข้อมูลระยะเวลาที่พนักงานแต่ละคนใช้ทำงาน โดยสามารถแสดงผลได้ทั้งจำนวนข้อมูลที่พนักงานทำได้ ระยะเวลาที่ใช้ เพื่อใช้ในการวางแผนบริหารจัดการงบประมาณในการจ้างพนักงาน

    Security

    สำหรับองค์กรที่เป็นห่วงในเรื่องความปลอดภัยของข้อมูลหรือ Privacy สามารถหายห่วงได้ เพราะผู้ให้บริการใส่ใจเกี่ยวกับความปลอดภัยในข้อมูลของผู้ใช้บริการเป็นลำดับแรก บริษัท เดต้า ว้าว จำกัด ได้รับการรับรองมาตรฐานความปลอดภัย ISO 27001 สามารถช่วยให้ผู้ใช้บริการมั่นใจในกระบวนการและมาตรการควบคุมต่อภัยคุกคามทางไซเบอร์ได้อย่างแน่นอน

    อีกหนึ่งบริการดีๆจาก Accurately.ai หากผู้ใช้บริการไม่สะดวกในการจัดหาพนักงานเพื่อจำแนกข้อมูล ทางบริษัทมีบริการจำแนกข้อมูลโดยพนักงานที่มีความเชี่ยวชาญในการจำแนกข้อมูลรูปภาพ และยังมี Data Science Team คอยให้คำปรึกษาสำหรับการพัฒนา Model สามารถทำให้ผู้ใช้บริการมั่นใจในคุณภาพและความถูกต้องของข้อมูลได้

    นอกจากความสามารถที่กล่าวไปแล้วบริษัทยังไม่หยุดพัฒนา features อื่นๆเพิ่มเติม เช่น automatic trainning ซึ่งจะช่วยให้ผู้ใช้บริการสามารถพัฒนา machine learning model จากชุดข้อมูลของตนเองให้ตอบโจทย์ความต้องการในอนาคตได้อีกด้วย

    สามารถทดลองใช้งานได้แล้วที่ accurately.ai

    Topics: Artificial IntelligenceBig DataAdvertorial
     

แบ่งปันหน้านี้