ในรอบชิงชนะเลิศ มีทีมที่เข้ารอบจำนวน 5 ทีม ได้แก่
โดยทุกทีมจะต้องทำการทดสอบโปรแกรมที่พัฒนากับฐานข้อมูลที่เตรียมไว้ จำนวน 3 ชุด โดยมีรายละเอียดดังนี้
ชุดข้อมูล | จำนวนตัวอักษร | แหล่งที่มาของข้อมูล |
ชุด 1 | 29,999 | เอกสารสะอาด |
ชุด 2 | 29,999 | หนังสือพิมพ์ วรสาร บทความ นิตยสาร |
ชุด 3 | 35,678 | หนังสือพิมพ์ วรสาร บทความ นิตยสาร |
การแข่งขันให้ผลการแข่งดังต่อไปนี้
ชุดข้อมูล | ชนิดข้อมูล | KNN | 15P33C017 | 15P33C0680 | 15P33N0022 | 15P33N0254 | 15P33W0061 |
ชุด 1 | TH(con) | 97.32 | 97.11 | 87.91 | 95.76 | 98.25 | 83.58 |
TH(Other) | 95.49 | 96.35 | 87.89 | 92.59 | 96.48 | 78.67 | |
ENG | 98.97 | 96.83 | 89.59 | 90.24 | 98.62 | 86.99 | |
NUM | 98.49 | 96.47 | 81.61 | 91.69 | 95.47 | 72.04 | |
Total | 97.88 | 96.97 | 87.21 | 94.69 | 97.76 | 83.19 | |
ชุด 2 | TH(con) | 97.43 | 97.31 | - | 95.77 | 98.26 | 83.41 |
TH(Other) | 95.89 | 96.27 | - | 93.11 | 96.69 | 79.11 | |
ENG | 98.06 | 97.13 | - | 91.02 | 98.79 | 86.77 | |
NUM | 98.70 | 97.40 | - | 89.84 | 96.10 | 69.80 | |
Total | 97.10 | 97.16 | - | 94.89 | 97.83 | 83.21 | |
ชุด3 | TH(con) | 97.21 | 97.02 | 87.92 | 95.51 | 98.09 | 83.30 |
TH(Other) | 95.47 | 96.66 | 86.15 | 88.50 | 97.35 | 81.66 | |
ENG | 97.48 | 96.78 | 90.06 | 91.13 | 97.32 | 86.06 | |
NUM | 99.73 | 98.66 | 88.20 | 92.76 | 97.32 | 78.82 | |
NUM(TH) | 99.43 | 100.00 | 97.99 | 97.99 | 99.71 | 83.33 | |
Total | 96.58 | 96.96 | 87.06 | 92.97 | 97.75 | 83.22 |
คำอธิบาย
KNN : เป็นการทำ recognition โดยการใช้ KNN มีการใช้ KDTree เพื่อเพิ่มความเร็วในการตัดสินใจ
TH(con) : ตัวพยัญชนะไทย
TH(Other) : ตัวอักษรไทยอื่น ๆ เช่น สระ วรรณยุกต์ (ยกเว้นตัวเลข)
ENG : ตัวอักษรภาษาอังกฤษ
NUM : ตัวเลขอารบิค
NUM(TH) : ตัวเลขไทย
อ่านรายละเอียดการทดสอบได้จาก
Methasate. I. and Marukatat. S., BEST 2013 : Thai Printed Character Recognition Competition, The Tenth Symposium on Natural Language Processing (SNLP-2013), Phuket,28-30 Oct 2013.