|
Search Engine ช่วยค้น คำบรรยาย (lecture)
โพสต์เมื่อ:
08:13 วันที่ 21 พ.ย. 2550 ชมแล้ว:
227,279
ตอบแล้ว:
2
นักวิจัยจากสถาบัน MIT คิดค้น Search Engine แบบใหม่ ที่สามารถช่วยให้การทบทวนตำราและการฟังการบรรยายของอาจารย์น่าอภิรมย์มากขึ้น
.ข่าวดี
แม้ว่าทางมหาวิทยาลัยจะได้บันทึกเสียง (และภาพ) ของการบรรยายของอาจารย์ ไว้ให้นักศึกษาได้ดาวน์โหลด (คิดว่ามหาวิทยาลัยส่วนใหญ่มีบริการ pod cast นี้ให้ ถ้าไม่มีก็คงต้องเอาแถบบันทึกเสียงไปขออนุญาตผู้บรรยายบันทึกเสียงเอาเองค่ะ) มาฟังให้ชุ่มฉ่ำหัวใจก่อนวันสอบ แต่เมื่อสิ่งที่เราไม่เข้าใจมีเพียงเรื่องหรือหัวข้อหนึ่ง (ซึ่งคำอธิบายที่เราอยากฟังซ้ำเพียงประมาณ 10 15 นาที) ซึ่งอยู่ในคาบที่มีความยาว 90 -120 นาที เราคงมีเวลาไม่พอที่จะมานั่งเปิดฟัง pod cast (หรือดู VDO การบรรยาย) ทั้งหมด เพราะจะถึงนาทีเข้าห้องสอบเราก็คงยังดาวน์โหลดมาดูหรือฟังได้ไม่หมด Search Engine แบบใหม่ที่ว่านี้เรียกว่า lecture search engine ค่ะ พัฒนาโดยสถาบันเทคโนโลยีแมสซาชูเสส (Massachusetts Institute of Technology หรือ (MIT)) นำโดยโปรเฟสเซอร์ Regina Barzilay และผู้อำนวยการสำนักวิจัย โปรเฟสเซอร์ James Glass แนวคิดการพัฒนานี้อาศัย web-based technology เป็นตัวช่วยค่ะ ให้ผู้ใช้สามารถค้นหาหัวเรื่องสำคัญ จากเทปบันทึกการบรรยาย อาศัยเทคโนโลยีการจับคำพูดและภาษา (speech and language technology) ซึ่งจะช่วยให้ผู้บรรยายได้จัดวางโครงสร้างเนื้อหาลงไปในการบันทึกวีดิทัศน์ที่ถ่ายทำขณะที่ทำการบรรยาย เทปบันทึกการบรรยายของสถาบัน MIT ที่เปิดให้นักศึกษาได้ดาวน์โหลดนั้นมีมากกว่า 200 ชุด (ที่ http://web.sls.csail.mit.edu/lectures/.) เรียก OpenCourseWare (OCW) ที่เปิดให้นักศึกษา โดยเฉพาะนักศึกษานานาชาติได้เข้าไปทบทวนเนื้อหาการเรียนการสอน คณาจารย์จากสถาบัน MIT ส่วนใหญ่จะบันทึกคำบรรยาย และโพสเทปเหล่านั้นออนไลน์เพื่อให้นักศึกษาได้ดาวน์โหลดเพื่อกลับมาทบทวน แต่ปัญหาก็มีอยู่ที่ว่าหากต้องการจะฟังหรือดูในหัวข้อเฉพาะ (specific topics) หรือเรื่องที่เจาะจงเป็นพิเศษ ก็แทบจะเป็นไป ไม่ได้ เพราะในไฟล์เสียงหรือไฟล์วิดิทัศน์เราจะกวาดสายตา (scan)หาหัวข้อเหมือนที่เราทำในกระดาษก็ไม่ได้ ก็เลยต้องมานั่งดูหรือฟังทั้งหมด บทบรรยายของผู้สอนจะถูกสร้างขึ้นโดยโปรแกรมเข้ารหัสคำพูด (speech recognition software) สิ่งที่ท้าทายมากประการหนึ่งก็คือ จะมีคำศัพท์เฉพาะ (technical term) มากมายซึ่งอาจจะยังไม่ได้บัญญัติในโปรแกรม ดังนั้น นักพัฒนาจึงได้นำเอาตำรา (textbooks) โน๊ตการสอน (lecture notes) และบทคัดย่อ (abstracts) เพื่อนำมาสร้างคำสำคัญ แล้วป้อนเข้าไปในโปรแกรม เมื่อทำการทดลอง พบว่าโปรแกรมจับคำพูดนั้น สามารถจับคำพูดของผู้บรรยายได้มีความถูกต้อง 4 ใน 5 คำ แต่คำผิดที่พบก็เป็นคำไม่สำคัญ หรือไม่ใช่ keyword ที่ผู้ใช้จะนำมาสืบค้น (ในทางบรรณารักษ์ คำที่ไม่ใช่คำสำคัญเหล่านี้อาจเรียกว่า error word เช่น คำ for, a, or, the, and, an, with, etc.) เมื่อผู้บรรยายจบการบรรยาย โปรแกรมจับคำพูดก็สร้างเร็คคอร์ดเสร็จ แล้วก็แบ่งคำบรรยายเหล่านั้นออกเป็นส่วนๆ ตามหัวข้อ ส่วนละ 100 คำโดยประมาณจากสูตรคำนวณเปรียบเทียบคำที่เสียงซ้อนทับกันภายในโปรแกรม คำที่ถูกเข้ารหัสจะมีการให้น้ำหนัก คือ คำที่ผู้บรรยายพูดซ้ำบ่อยๆก็จะมีน้ำหนักมาก และมีความสำคัญมาก และกลุ่มที่มีคำใกล้เคียงกันก็จะถูกจัดเป็นส่วนๆ (section) อีกด้วย จากเว็บไซต์ทดลอง (Prototype web site) ที่ทั้งคู่ได้พัฒนาขึ้น ผู้ใช้สามารถค้นหาโดยป้อนคำค้นที่ต้องการลงไป แล้วค้นหา ก็จะได้ไฟล์ส่วนที่เกี่ยวข้องขึ้นมาเพื่อทดลองเปิดฟังดู โดยโปรแกรมก็จะนำผลการสืบค้นขึ้นมาแสดงตามน้ำหนัก (หรือความเกี่ยวข้อง) ของคำค้น (keyword) ในอนาคต นักพัฒนาทั้งคู่หวังว่า จะสามารถพัฒนาให้โปรแกรมสามารถทำการสรุปย่อการบรรยายได้ หรือแม้กระทั่งอาจจะให้ผู้ใช้เป็นผู้ที่สามารถมีส่วนร่วมในการแก้ไขข้อผิดพลาดของสคริพท์หรือใส่บันทึกท้ายบทเพิ่มได้ด้วยตนเอง อ้างอิง Anne Trafton. MIT develops lecture search engine to aid students. Accessed from: http://web.mit.edu/newsoffice/2007/lectures-tt1107.html Dated Nov 20, 2007. NSF. Researchers Develop Lecture Search Engine to Aid Students. Accessed from: http://www.nsf.gov/news/news_summ.jsp?cntn_id=110699&org=NSF&from=newsField Dated Nov 20, 2007. ![]() จำนวน 2 ความเห็น, หน้า่ | -1- ความเห็นเพิ่มเติมที่ 1 20 มี.ค. 2551 (03:46) Nice site! Nikolet (IP:69.217.73.52) ความเห็นเพิ่มเติมที่ 2 30 เม.ย. 2551 (09:17) ขอบคุณสำหรับบทความดีๆน่ะครับพี่นิ มีประโยชน์มากเลยครับ แล้วจะติดตามอ่านทุกบทความเลยนะครับ ( พี่เมเจอร์เรานี้เก่งจริงๆ ) .....น้อง im ม.วลัยลักษณ์ 49 คับ.... |