การวัดเปรียบเทียบสมรรถนะเพื่อพัฒนามาตรฐานการประมวลผลภาษาไทย (Benchmark for Enhancing the Standard of Thai language processing) หรือ BEST นี้ เป็นชุดของการแข่งขันซอฟต์แวร์ที่สำคัญและเกี่ยวข้องกับการประมวลผลภาษาไทย โดยแต่ละปีจะมีการกำหนดหัวข้อการแข่งขันตามความเหมาะสม ทั้งนี้ เพื่อให้ครอบคลุมเนื้อหาในการประมวลผลภาษาไทยระดับต่างๆ
หัวข้อการแข่งขันประจำปี 2011
แนวคิดของ BEST ในปีที่สามนี้คือ Open Resource, Open Idea, Open Source โดยหน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา (HLT) ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) จะเปิดทรัพยากรภาษาและเครื่องมือของหน่วยฯ ให้ผู้เข้าแข่งขันสามารถนำไปพัฒนาต่อยอด เพื่อสร้างสรรค์ซอฟต์แวร์โอเพนซอร์สทางด้านการประมวลผลภาษาธรรมชาติ (Natural Language Processing) สำหรับภาษาไทย ที่มีผลกระทบต่อเศรษฐกิจ สังคม หรือวิชาการ ตัวอย่างเช่น โปรแกรมแปลภาษา, โปรแกรมสืบค้นข้อมูล, โปรแกรมรู้จำและสังเคราะห์เสียงพูด, โปรแกรมรู้จำลายมือเขียน, โปรแกรมแบ่งคำภาษาไทย, โปรแกรมแก้ไขคำผิด, โปรแกรมช่วยพัฒนาพจนานุกรมหรือคลังข้อความ เป็นต้น ยิ่งไปกว่านั้น เรายังสนับสนุนให้ผู้เข้าแข่งขันได้ใช้ความคิดสร้างสรรค์ในการประยุกต์งานต่างๆ เข้าด้วยกันและต่อยอดผลงานให้เป็นนวัตกรรมที่ก้าวหน้าและน่าสนใจเพิ่มขึ้น ตัวอย่างเช่น โปรแกรมแปลเสียงบรรยายภาพยนตร์ภาษาอังกฤษเป็นเสียงบรรยายภาษาไทย, ระบบสอบถามข้อมูลจราจรอัตโนมัติ, โปรแกรมสืบค้นข้อมูลด้วยความหมายข้ามภาษา เป็นต้น
ทั้งนี้ ผู้เข้าแข่งขันสามารถใช้ทรัพยากรภาษาและเครื่องมือที่เตรียมไว้ให้ หรือจะจัดหามาเอง หรือจะพัฒนาขึ้นใหม่ทั้งหมดก็ได้ภายใต้เงื่อนไขที่ว่า จะต้องไม่ละเมิดทรัพย์สินทางปัญญาของผู้อื่น อย่างไรก็ดี สัญญาอนุญาตของโปรแกรมที่เข้าแข่งขันจะต้องเป็นแบบโอเพนซอร์ส (Open Source) เท่านั้น
คำสำคัญ (KEYWORDS) ซอฟต์แวร์โอเพนซอร์ส (Open Source Software), การประมวลผลภาษาธรรมชาติ (Natural Language Processing), ภาษาไทย (Thai Language), ความคิดสร้างสรรค์ (Creativity)