การแข่งขัน และ การวัดความถูกต้อง

การแข่งขัน

ในการแข่งขันรอบสอง และ รอบสุดท้าย ผู้จัดจะเตรียมภาพ และ รายการชื่อของภาพ ให้กับผู้เข้าแข่งขันแต่ละท่าน โดยผู้เข้าแข่งขันต้องรันผลการหาตำแหน่งข้อความ และให้คำตอบอยู่ในรูปแบบดังต่อไปนี้

  1. ภาพผลเฉลย โดยมี สีขาวเป็นพื้นหลัง และสีดำเป็นบริเวณที่เป็นตัวอักษร
  2. ไฟล์ข้อมูลกลุ่มของตัวอักษร โดยมีบรรทัดแรกเป็นจำนวนกลุ่มของตัวอักษร และบรรทัดถัดมาเป็นกรอบบริเวณของแต่ละกลุ่มของตัวอักษร 

รูปแบบไฟล์ข้อมูลกลุ่มของตัวอักษร

[#text_area]

[left of blob 1, top of blob 1, right of blob 1, bottom of blob 1]

[left of blob 2, top of blob 2, right of blob 2, bottom of blob 2]

....

 

การวัดความถูกต้อง

 

การวัดความถูกต้องของการหาตำแหน่งของข้อความ จะทำการวัดค่า precision และ recall ในระดับ blob และ ระดับ pixel  โดยการวัดความถูกต้องจะใช้แนวทางตาม บทความ [1]

[1] Christian Wolf and Jean-Michel Jolion, Object count/area graphs for the evaluation of object detection and segmentation algorithms, International Journal on Document Analysis and Recognition Volume 8 Issue 4, August 2006, Pages 280 - 296

 

โปรแกรมเทียบผลการหาตำแหน่งข้อความ

โปรแกรม evamask เป็นโปรแกรมที่พัฒนาขึ้นเพื่อใช้ในการเทียบผลการหาตำแหน่งข้อความกับผลเฉลย โดยใช้ในการแข่งขันหาตัวอักษรในภาพ BEST 2015 โดยจะทำการเพื่อเปรียบเทียบผลลัพธ์ที่ได้ กับผลเฉลย ในระดับ blob และในระดับจุดภาพ (pixel)

สามารถเรียกโปรแกรมได้โดยคำสั่ง

 

evamask.exe [image result] [text result] [image label] [text label]

 

โดย 

[image result]  เป็นชื่อของไฟล์ภาพผลลัพธ์ ของการตรวจจับบริเวณที่เป็นข้อความ โดยให้ส่วนที่ไม่ใช่ข้อความเป็นสีขาว และส่วนที่เป็นข้อความเป็นสีดำ โดยไฟล์ภาพสามารถเป็นรูปแบบ bmp, png

[text result] เป็นชื่อของไฟล์ผลลัพธ์ ของการตรวจจับบริเวณที่เป็นข้อความ โดยให้รูปแบบตามหัวข้อ xxx 

[image label] เป็นชื่อของไฟล์ภาพผลเฉลย สามารถ download ได้ที่ "ข้อมูลทดสอบ"

[text label] เป็นชื่อของไฟล์กรอบข้อมูล ของภาพผลเฉลย สามารถ download ได้ที่ "ข้อมูลทดสอบ"

โปรแกรมถูกพัฒนา ด้วยภาษา C++ โดยใช้ gcc และ opencv

download   binary(win) / source