InterBEST 2009

Who's Online

เรามี 1 บุคคลทั่วไป ออนไลน์

Login



คลังข้อความ (Corpus)

คลังข้อความสำหรับใช้ในการฝึกฝนหรือทดสอบโปรแกรมแบ่งคำภาษาไทย ในการแข่งขัน BEST2009

DocumentsDate added

Order by : Name | Date | Hits [ Ascendant ]

ข้อมูลชุดทดสอบ 500,000 คำ ใช้สำหรับทดสอบโปรแกรมแบ่งคำภาษาไทย เพื่อคำนวนหาค่าประสิทธิภาพโปรแกรมแบ่งคำของท่าน

ข้อมูลชุดทดสอบ 100,000 คำ ใช้สำหรับทดสอบโปรแกรมแบ่งคำภาษาไทย เพื่อคำนวนหาค่าประสิทธิภาพโปรแกรมแบ่งคำของท่าน

BEST Corpus training set 6 (Release 1) 662,323 words from 126 files : 126 article files.

BEST Corpus training set 5 (Release 2) 1,167,288 words from 79 files : 26 news files, 27 encyclopedia files, 26 novel files.

BEST Corpus training set 4 (Release 2) 1,084,766 words from 113 files : 21 news files, 31 encyclopedia files, 28 novel files and 33 article files.

BEST Corpus training set 3 (Release 2) 1,125,761 words from 116 files : 17 news files, 28 encyclopedia files, 32 novel files and 39 article files.

BEST Corpus training set 2 (Release 2) 493,954 words from 37 files : 8 news files, 17 encyclopedia files and 12 novel files.

BEST Corpus training set 1 (Release 3) 500,792 words from 38 files : 24 news files, 5 encyclopedia files and 9 novel files.