ดาวน์โหลด

 

            ในการแข่งขัน BEST 2014 ผู้จัดได้เตรียมชุดข้อมูลภาพสำหรับให้ผู้เข้าแข่งขันไปใช้ฝึกฝน และทดสอบระบบ ซึ่งเป็นข้อมูลที่ใช้ทดสอบใน BEST2013 การแข่งขันครั้งนี้ไม่ได้จำกัดให้ผู้เข้าแข่งขันต้องใช้เฉพาะข้อมูลที่แจกเท่านั้น แต่ผู้เข้าแข่งขันสามารถใช้ชุดข้อมูลอื่น เพื่อฝึกฝนและทดสอบระบบของตนเองได้ด้วย ทรัพยากรภาษาที่ทางผู้จัด เปิดให้ใช้สำหรับการแข่งขัน BEST 2014 ดังนี้


     
ชุดข้อมูล จำนวนตัวอักษร แหล่งที่มา หมายเหตุ
BEST-OCR-01
 
เอกสารเตรียม
 
BEST-OCR-02
33,989
เอกสารเตรียม
ใช้แข่ง BEST2013 รอบ 2
BEST-OCR-03
31,631
หนังสือ, วารสาร, หนังสือพิมพ์
ใช้แข่ง BEST2013 รอบ 2
BEST-OCR-04
29,999
หนังสือ, วารสาร, หนังสือพิมพ์
ใช้แข่ง BEST2013 รอบสุดท้าย
BEST-OCR-05
29,999
หนังสือ, วารสาร, หนังสือพิมพ์
ใช้แข่ง BEST2013 รอบสุดท้าย
BEST-OCR-06
36,578
หนังสือ, วารสาร, หนังสือพิมพ์
ใช้แข่ง BEST2013 รอบสุดท้าย

 

รายละเอียดชุดข้อมูล

 

ชุดข้อมูล   BEST-OCR-01

รายละเอียด   ข้อมูลภาพตัวอักษรชุดนี้ เป็นชุดข้อมูลภาพตัวพิมพ์อักษร ซึ่งประกอบด้วย ภาพตัวอักษรภาษาไทย ภาษาอังกฤษ ตัวเลข สัญลักษณ์พิเศษ ของฟอนต์ที่หลากหลาย  โดยได้มาจากการสแกนด้วยความละเอียด 200, 300 และ 400 dpi ของตัวอักษรแบบ normal, bold, italic และ bold italic ของรูปแบบอักษรชนิดต่าง  ๆ ข้อมูลภาพชุดนี้ยังแบ่งเป็นชุดฝึกหัด (train) และชุดทดลอง (validate) เพื่อให้ผู้เข้าแข่งสามารถนำไปใช้ได้อย่างเหมาะสม ทั้งนี้ ไม่ได้เป็นการจำกัดให้ผู้เข้าแข่งใช้เฉพาะชุดข้อมูลที่เตรียมให้เท่านั้น ผู้เข้าแข่งสามารถจัดหาชุดข้อมูลอื่น มาใช้ร่วมเพื่อให้เกิดประสิทธิภาพสูงสุดได้

ดาวน์โหลด    ข้อมูลภาพที่เตรียมให้ได้ บีบอัดแยกตามชนิด ดังนี้ ตัวอักษรภาษาอังกฤษตัวอักษรภาษาไทยตัวเลข และ สัญลักษณ์  
               ข้อมูลรายการ และชนิดของภาพ (class label) ทางผู้จัดได้ทำรายการชื่อไฟล์ เพื่อให้ผู้เข้าแข่งนำข้อมูลไปใช้ได้ง่าย  ชุดฝึกฝน และ ชุดทดลอง  

         ไฟล์รายการมีรูปแบบดังนี้  

               [label]                     [file path]

                 035                         \Special\035\200\bold\BWES211_200_31_08_035.bmp

         คำอธิบาย ไฟล์ชื่อ BWES211_200_31_08_035.bmp มี label อยู่ในกลุ่มที่ 035 

        ** label ที่กำหนดให้นี้ ปรับมาจากตารางชุดตัวอักษรมาตรฐานซึ่งครอบคลุมทั้งภาษาไทย และภาษาอังกฤษ

 

สำหรับชุดข้อมูล  BEST-OCR-02 ถึง BEST-OCR-06 จะไม่มีการแบ่งเป็นชุดฝึกฝน และชุดทดลองให้ จะมีเพียงรายชื่อภาพ แฟ้มภาพ และผลเฉลยของแต่ละภาพให้เท่านั้น ผู้เข้าแข่งขันสามารถเลือกใช้ข้อมูลตามความเหมาะสมได้เอง

 

ชุดข้อมูล   BEST-OCR-02

ดาวน์โหลด    แฟ้มภาพ     รายชื่อแฟ้มภาพ    ผลเฉลยแฟ้มภาพ

 

ชุดข้อมูล   BEST-OCR-03

ดาวน์โหลด    แฟ้มภาพ     รายชื่อแฟ้มภาพ    ผลเฉลยแฟ้มภาพ

 

ชุดข้อมูล   BEST-OCR-04

ดาวน์โหลด    แฟ้มภาพ     รายชื่อแฟ้มภาพ    ผลเฉลยแฟ้มภาพ

 

ชุดข้อมูล   BEST-OCR-05

 

ดาวน์โหลด    แฟ้มภาพ     รายชื่อแฟ้มภาพ    ผลเฉลยแฟ้มภาพ

 

ชุดข้อมูล   BEST-OCR-06

ดาวน์โหลด    แฟ้มภาพ     รายชื่อแฟ้มภาพ    ผลเฉลยแฟ้มภาพ

 

หากผู้เข้าแข่งขัน มีความสงสัยในการใช้ฐานข้อมูล กรุณาติดต่อทีมงาน  (ithipan.methasate at nectec dot or dot th)