คุณยังไม่ได้ Log in | สมัครสมาชิก ฟรี
กลับหน้าแรก วิชาการ.คอม
นักวิจัยจากสถาบัน MIT คิดค้น Search Engine แบบใหม่ ที่สามารถช่วยให้การทบทวนตำราและการฟังการบรรยายของอาจารย์น่าอภิรมย์มากขึ้น….ข่าวดี

แม้ว่าทางมหาวิทยาลัยจะได้บันทึกเสียง (และภาพ) ของการบรรยายของอาจารย์ ไว้ให้นักศึกษาได้ดาวน์โหลด (คิดว่ามหาวิทยาลัยส่วนใหญ่มีบริการ pod cast นี้ให้ ถ้าไม่มีก็คงต้องเอาแถบบันทึกเสียงไปขออนุญาตผู้บรรยายบันทึกเสียงเอาเองค่ะ) มาฟังให้ชุ่มฉ่ำหัวใจก่อนวันสอบ แต่เมื่อสิ่งที่เราไม่เข้าใจมีเพียงเรื่องหรือหัวข้อหนึ่ง (ซึ่งคำอธิบายที่เราอยากฟังซ้ำเพียงประมาณ 10 – 15 นาที) ซึ่งอยู่ในคาบที่มีความยาว 90 -120 นาที เราคงมีเวลาไม่พอที่จะมานั่งเปิดฟัง pod cast (หรือดู VDO การบรรยาย) ทั้งหมด เพราะจะถึงนาทีเข้าห้องสอบเราก็คงยังดาวน์โหลดมาดูหรือฟังได้ไม่หมด

Search Engine แบบใหม่ที่ว่านี้เรียกว่า lecture search engine ค่ะ พัฒนาโดยสถาบันเทคโนโลยีแมสซาชูเสส (Massachusetts Institute of Technology หรือ (MIT)) นำโดยโปรเฟสเซอร์ Regina Barzilay และผู้อำนวยการสำนักวิจัย โปรเฟสเซอร์ James Glass

แนวคิดการพัฒนานี้อาศัย web-based technology เป็นตัวช่วยค่ะ ให้ผู้ใช้สามารถค้นหาหัวเรื่องสำคัญ จากเทปบันทึกการบรรยาย อาศัยเทคโนโลยีการจับคำพูดและภาษา (speech and language technology) ซึ่งจะช่วยให้ผู้บรรยายได้จัดวางโครงสร้างเนื้อหาลงไปในการบันทึกวีดิทัศน์ที่ถ่ายทำขณะที่ทำการบรรยาย

เทปบันทึกการบรรยายของสถาบัน MIT ที่เปิดให้นักศึกษาได้ดาวน์โหลดนั้นมีมากกว่า 200 ชุด (ที่ http://web.sls.csail.mit.edu/lectures/.) เรียก OpenCourseWare (OCW) ที่เปิดให้นักศึกษา โดยเฉพาะนักศึกษานานาชาติได้เข้าไปทบทวนเนื้อหาการเรียนการสอน

คณาจารย์จากสถาบัน MIT ส่วนใหญ่จะบันทึกคำบรรยาย และโพสเทปเหล่านั้นออนไลน์เพื่อให้นักศึกษาได้ดาวน์โหลดเพื่อกลับมาทบทวน แต่ปัญหาก็มีอยู่ที่ว่าหากต้องการจะฟังหรือดูในหัวข้อเฉพาะ (specific topics) หรือเรื่องที่เจาะจงเป็นพิเศษ ก็แทบจะเป็นไป ไม่ได้ เพราะในไฟล์เสียงหรือไฟล์วิดิทัศน์เราจะกวาดสายตา (scan)หาหัวข้อเหมือนที่เราทำในกระดาษก็ไม่ได้ ก็เลยต้องมานั่งดูหรือฟังทั้งหมด


บทบรรยายของผู้สอนจะถูกสร้างขึ้นโดยโปรแกรมเข้ารหัสคำพูด (speech recognition software) สิ่งที่ท้าทายมากประการหนึ่งก็คือ จะมีคำศัพท์เฉพาะ (technical term) มากมายซึ่งอาจจะยังไม่ได้บัญญัติในโปรแกรม ดังนั้น นักพัฒนาจึงได้นำเอาตำรา (textbooks) โน๊ตการสอน (lecture notes) และบทคัดย่อ (abstracts) เพื่อนำมาสร้างคำสำคัญ แล้วป้อนเข้าไปในโปรแกรม

เมื่อทำการทดลอง พบว่าโปรแกรมจับคำพูดนั้น สามารถจับคำพูดของผู้บรรยายได้มีความถูกต้อง 4 ใน 5 คำ แต่คำผิดที่พบก็เป็นคำไม่สำคัญ หรือไม่ใช่ keyword ที่ผู้ใช้จะนำมาสืบค้น (ในทางบรรณารักษ์ คำที่ไม่ใช่คำสำคัญเหล่านี้อาจเรียกว่า error word เช่น คำ for, a, or, the, and, an, with, etc.)

เมื่อผู้บรรยายจบการบรรยาย โปรแกรมจับคำพูดก็สร้างเร็คคอร์ดเสร็จ แล้วก็แบ่งคำบรรยายเหล่านั้นออกเป็นส่วนๆ ตามหัวข้อ ส่วนละ 100 คำโดยประมาณจากสูตรคำนวณเปรียบเทียบคำที่เสียงซ้อนทับกันภายในโปรแกรม คำที่ถูกเข้ารหัสจะมีการให้น้ำหนัก คือ คำที่ผู้บรรยายพูดซ้ำบ่อยๆก็จะมีน้ำหนักมาก และมีความสำคัญมาก และกลุ่มที่มีคำใกล้เคียงกันก็จะถูกจัดเป็นส่วนๆ (section) อีกด้วย

จากเว็บไซต์ทดลอง (Prototype web site) ที่ทั้งคู่ได้พัฒนาขึ้น ผู้ใช้สามารถค้นหาโดยป้อนคำค้นที่ต้องการลงไป แล้วค้นหา ก็จะได้ไฟล์ส่วนที่เกี่ยวข้องขึ้นมาเพื่อทดลองเปิดฟังดู โดยโปรแกรมก็จะนำผลการสืบค้นขึ้นมาแสดงตามน้ำหนัก (หรือความเกี่ยวข้อง) ของคำค้น (keyword)

ในอนาคต นักพัฒนาทั้งคู่หวังว่า จะสามารถพัฒนาให้โปรแกรมสามารถทำการสรุปย่อการบรรยายได้ หรือแม้กระทั่งอาจจะให้ผู้ใช้เป็นผู้ที่สามารถมีส่วนร่วมในการแก้ไขข้อผิดพลาดของสคริพท์หรือใส่บันทึกท้ายบทเพิ่มได้ด้วยตนเอง

อ้างอิง
Anne Trafton. “MIT develops lecture search engine to aid students”.
Accessed from: http://web.mit.edu/newsoffice/2007/lectures-tt1107.html

Dated Nov 20, 2007.

NSF.” Researchers Develop Lecture Search Engine to Aid Students”.
Accessed from: http://www.nsf.gov/news/news_summ.jsp?cntn_id=110699&org=NSF&from=newsField Dated Nov 20, 2007.
63350


นิภาภรณ์ สีถาการ เก็บเข้า Contact List ส่ง vSMS
ร่วมแบ่งปันความรู้และความเห็นแล้ว 51 ครั้ง - ได้รับดาวแล้ว 167 ดวง - โหวตเพิ่มดาว

จำนวน 2 ความเห็น, หน้า่ | -1-
ความเห็นเพิ่มเติมที่ 1 20 มี.ค. 2551 (03:46)
Nice site!
Nikolet (IP:69.217.73.52)

ความเห็นเพิ่มเติมที่ 2 30 เม.ย. 2551 (09:17)

ขอบคุณสำหรับบทความดีๆน่ะครับพี่นิ มีประโยชน์มากเลยครับ แล้วจะติดตามอ่านทุกบทความเลยนะครับ ( พี่เมเจอร์เรานี้เก่งจริงๆ )


.....น้อง im ม.วลัยลักษณ์ 49 คับ....


ice-6969 เก็บเข้า Contact List ส่ง vSMS
ร่วมแบ่งปันความรู้และความเห็นแล้ว 2 ครั้ง - ได้รับดาวแล้ว 49 ดวง - โหวตเพิ่มดาว

ความเห็นเพิ่มเติม วิชาการ.คอม

ชื่อ / email:
ข้อความ

รูปภาพ หรือ ไฟล์
กรุณาล๊อกอินก่อน เพื่อโพสต์รูปภาพ และ ใช้ LaTex ค่ะ สมัครสมาชิกฟรีตลอดชีพที่นี่
ตัวช่วย 1: CafeCode วิธีการใช้
ตัวช่วย 2: VSmilies วิธีการใช้
ตัวช่วย 3: พจนานุกรมไทย ออนไลน์ ฉบับราชบัณฑิต
ตัวช่วย 4 : dictionary ไทย<=>อังกฤษ ออนไลน์ จาก NECTEC
ตัวช่วย 5 : ดาวน์โหลด โปรแกรมช่วยพิมพ์ Latex เพื่อแสดงสมการบนวิชาการ.คอม
วิชาการ.คอม

บทความแนะนำ

Blog แนะนำ

Hot Links

ขอบคุณผู้สนับสนุน

Google
 
ติดต่อลงโฆษณา :   คุณอันนา 081 4965363
สำนักงาน :   02 2015735
อีเมล์ :   
Copyright© 2000-2007, Vcharkarn.Com. All rights reserved.
คลิ๊กเพื่อดูสถิติ
รับรองและสนับสนุนโดย

สสวท.

มูลนิธิ พสวท.

พสวท.