วันนี้ไปฟังบรรยายที่มหาวิทยาลัยเกษตรศาสตร์มา ในหัวข้อ "A Bag of Words Approach to Multimedia Semantics" โดย Prof. Dr. William I. Grosky จาก University of Michigan Dearborn
bag-of-words model นี่เป็นหลักการทางการประมวลผลภาษาธรรมชาติ (NLP) คร่าว ๆ คือถือว่าเอกสารหนึ่ง ๆ เป็นเหมือนถุงใส่คำ คือไม่สนใจลำดับหรือไวยากรณ์ แล้วข้อมูลทางสถิติว่ามีคำไหนอยู่มากน้อยก็จะสามารถบอกอะไรได้บางอย่าง ตัวอย่างการประยุกต์ใช้ก็คือระบบป้องกัน spam
ทีนี้ก็มีการเอา model นี้มาใช้ในสาขาอื่นบ้าง เช่นการรู้จำวัตถุจากภาพ โดยถือว่าภาพเป็นเอกสาร หรือถุงบรรจุคำ ส่วนคำที่ว่านี่ก็มาจากการแบ่งภาพออกเป็นส่วนย่อย ๆ เช่น แบ่งเป็นตาราง แล้วก็ดึงเอาคุณสมบัติบางอย่างในส่วนย่อยนั้นมา (ถือเป็นคำ) รวมในถุงใส่คำ แล้วก็ใช้วิธีทางสถิติวิเคราะห์
จริง ๆ แล้วในการบรรยายนี้มีอีกหลายเรื่องมาก แต่เขาพูดเร็วมาก ไม่ก็ผมช้าเอง จดทันบ้างไม่ทันบ้าง เอาอีกเรื่องที่ผมว่าน่าสนใจก็แล้วกัน คือ Emergent Semantics
ปกติแล้วเราสามารถดึง "ความหมาย" หรือ semantics ของข้อมูลใด ๆ ออกมาได้หลายวิธี ซึ่งข้อมูลสามารถมีได้หลายความหมายในเวลาเดียวกัน ขึ้นอยู่กับบริบทอื่น ๆ และผู้รับรู้ โดย ดร. คนนี้เสนอวิธีการดึงความหมายนั้นออกมาจากการ "ตามรอย" ของการรับรู้ข้อมูลกลุ่มหนึ่งที่เชื่อมโยงกัน (interlinked) เช่น หน้าเว็บ
ตัวอย่างเช่น รูป X เป็นรูปป่าในหมอก ถ้าเอามาถามคนหลายคนว่ามันเป็นรูปอะไร คนนึงก็บอกว่ารูปป่า อีกคนก็อาจจะบอกว่ารูปหมอก แต่ถ้าเราเห็นว่า ก่อนจะมาถึงรูป X เนี่ย ไอ้หมอนี่ดูรูปป่ามาก่อนหลายรูป เราก็จะสามารถตีความได้ว่า รูป X ในตอนนี้ หมายความถึงป่า แสดงให้เห็นว่า "ความหมาย" ของข้อมูลมันผุดขึ้นมาในระหว่างการรับรู้ข้อมูลมาเรื่อย ๆ นั่นเอง
ใครเข้าไปอ่านได้ก็ลองโหลดมาอ่านดูนะ
http://portal.acm.org/citation.cfm?id=637420
http://www.springerlink.com/content/plbac36pxnvx31cy/