ปัญหาความลำเอียงของปัญญาประดิษฐ์ที่มักทำงานได้ดีกับคนบางเชื้อชาติหรือสีผิว เริ่มมาตั้งแต่ชุดข้อมูลที่อาจจะเน้นหนักไปยังกลุ่มคนบางเชื้อชาติเท่านั้น ตอนนี้ไอบีเอ็มก็ประกาศว่าจะเปิดชุดข้อมูลสองชุดออกสู่สาธารณะเพื่อแก้ปัญหาเรื่องนี้
ชุดข้อมูลสองชุดได้แก่
- ข้อมูลกำกับภาพ 1 ล้านภาพที่กระจายตัวทั่วโลกโดยอาศัยข้อมูล geo-tag จาก Flickr และเครื่องมือเรียนรู้ มาสร้างสมดุลของภาพในชุดข้อมูล
- ข้อมูลกำกับภาพ 36,000 ภาพเท่าเทียมกันตามเพศ, สีผิว, และอายุสำหรับการฝึกซอฟต์แวร์แบบ machine learning ทั้งหลาย หรือใช้ทดสอบระบบจดจำใบหน้า ว่าลำเอียงต่อคนกลุ่มใดเป็นพิเศษหรือไม่
ความพยายามของไอบีเอ็มคือการผลักดันให้การลดความลำเอียงเป็นมาตรวัดหนึ่งของสำเร็จของระบบปัญญาประดิษฐ์ต่างๆ หลังจากนี้จะมีการแข่งขันในงาน European Conference on Computer Vision โดยใช้ชุดข้อมูลนี้
ชุดข้อมูลทั้งสองชุดกำลังอยู่ระหว่างการพัฒนา ถ้าใครทำงานสายนี้ก็อาจจะรอทดสอบประเด็นความลำเอียงของข้อมูลกันได้
ที่มา - IBM
ภาพโดย geralt
Comments
ดีงาม