รศ.ดร.วิโรจน์ อรุณมานะกุล ภาควิชาภาษาศาสตร์คณะอักษรศาสตร์ และผู้อำนวยการสถาบันภาษาไทยสิรินธร จุฬาลงกรณ์มหาวิทยาลัย คว้ารางวัลนักวิจัยดีเด่นแห่งชาติ ประจำปี 2566 สาขาปรัชญา จากสำนักงานการวิจัยแห่งชาติ (วช.) ในฐานะผู้เชี่ยวชาญงานวิจัยด้านคลังข้อมูลภาษาและงานประมวลผลภาษาไทย โดยเริ่มต้นจากการเก็บข้อมูลภาษาไทยให้ได้ปริมาณมากพอสำหรับค้นหาตัวอย่างการใช้ภาษาไทยและได้เปิดให้บริการค้นผ่านทางเว็บไซต์ Thai Concordance รวมทั้งได้เข้าร่วมในโครงการพัฒนาครั้งข้อมูลภาษาไทยแห่งชาติ โดยออกแบบคลังข้อมูลและพัฒนาเครื่องมือเพื่อใช้ในการตัดคำกำกับข้อมูลตัวบทและจัดเก็บคลังข้อมูล
นอกจากนี้ รศ.ดร.วิโรจน์ ยังได้ร่วมกับอาจารย์สาขาภาษาอังกฤษในการพัฒนาและสร้างคลังข้อมูลเทียบบทภาษาอังกฤษ-ไทย เพื่อให้ผู้สนใจศึกษาการแปลสามารถเข้าถึงและค้นหาตัวอย่างการแปลได้ คลังข้อมูลภาษาเหล่านี้ได้เปิดให้บริการสาธารณะ เพื่อเป็นแหล่งข้อมูลกลางสำหรับนักวิจัยและนักศึกษาได้ใช้ในการศึกษาวิจัย นอกจากจะเผยแพร่ในรูปของการตีพิมพ์บทความและหนังสือแล้ว ยังเผยแพร่เป็นเครื่องมือสาธารณะ เช่นโปรแกรมถอดอักษรไทยเป็นโรมันโปรแกรมตัดคำภาษาไทย โปรแกรมถ่ายเสียงภาษาไทยเป็นสัทอักษร (Thai to IPA)โปรแกรมกำกับหมวดคำโปรแกรมแบ่งหน่วยปริจเฉทพื้นฐานและโปรแกรมเว็กเตอร์คำไทย (Thai word2vec) ปัจจุบันโปรแกรมต่างๆ ได้พัฒนาเป็นส่วนหนึ่งของ Python Package TLTK (Thai Language Toolkit) ที่คนทั่วไปสามารถติดตั้งและเลือกใช้งานโมดูลที่ต้องการได้ และยังมีการพัฒนาเพิ่มเติมโมดูลการประมวลผลภาษาไทยต่างๆ อย่างต่อเนื่อง ทั้งนี้ เครื่องมือหรือโปรแกรมที่เผยแพร่มีบริษัทเอกชนและหน่วยงานต่างๆ ตลอดจนนักพัฒนาระบบได้ใช้ประโยชน์จากทรัพยากรและเครื่องมือเหล่านี้มานานกว่า 10 ปี
โปรดอ่านก่อนแสดงความคิดเห็น
1.กรุณาใช้ถ้อยคำที่ สุภาพ เหมาะสม ไม่ใช้ ถ้อยคำหยาบคาย ดูหมิ่น ส่อเสียด ให้ร้ายผู้อื่น สร้างความแตกแยกในสังคม งดการใช้ถ้อยคำที่ดูหมิ่นหรือยุยงให้เกลียดชังสถาบันชาติ ศาสนา พระมหากษัตริย์
2.หากพบข้อความที่ไม่เหมาะสม สามารถแจ้งได้ที่อีเมล์ online@naewna.com โดยทีมงานและผู้จัดทำเว็บไซด์ www.naewna.com ขอสงวนสิทธิ์ในการลบความคิดเห็นที่พิจารณาแล้วว่าไม่เหมาะสม โดยไม่ต้องชี้แจงเหตุผลใดๆ ทุกกรณี
3.ขอบเขตความรับผิดชอบของทีมงานและผู้ดำเนินการจัดทำเว็บไซด์ อยู่ที่เนื้อหาข่าวสารที่นำเสนอเท่านั้น หากมีข้อความหรือความคิดเห็นใดที่ขัดต่อข้อ 1 ถือว่าเป็นกระทำนอกเหนือเจตนาของทีมงานและผู้ดำเนินการจัดทำเว็บไซด์ และไม่เป็นเหตุอันต้องรับผิดทางกฎหมายในทุกกรณี