การค้นหาข้อมูลทางอินเทอร์เน็ต
และการนำข้อมูล
มาอ้างอิงทางวิชาการ
บรรยายพิเศษ โดย อ.ดร.ธันภัทร โคตรสิงห์
วิชา แนะนำวิศวกรรมศาสตร์ รหัสวิชา 03-407-000-100 ผู้สอน อ.ดร.ณัฐพงษ์ เพชรละออ
AGENDA TOPIC 1 การสืบค้นข้อมูลด้วย TOPIC 2 หลักการทำงาน
SEARCH ENGINE ของ SEARCH ENGINE
หัวข้อที่จะบรรยาย
TOPIC 3 ประเภทของ TOPIC 4 วิธีการค้นหาข้อมูล
SEARCH ENGINE บน SEARCH ENGINE
TOPIC 5 การนำข้อมูลจาก
อินเทอร์เน็ตมาใช้
และการอ้างอิง
Google คือ เสิร์ชเอนจิน ที่มีส่วนแบ่งการตลาดมากที่สุดอันดับ 1 ของโลก
Topic 1
การสืบค้นข้อมูลด้วย ยานเดกซ์ (Yandex) เสิร์ชเอนจิน อันดับ 1 ของรัสเซีย
SEARCH ENGINE
เสิร์ชเอนจิน (search engine) หรือ โปรแกรมค้นหา
คือ โปรแกรมที่ช่วยในการสืบค้นหาข้อมูล โดยเฉพาะข้อมูลบน
อินเทอร์เน็ต โดยครอบคลุมทั้งข้อความ รูปภาพ ภาพเคลื่อนไหว
เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่น ๆ ซึ่งแตก
ต่างกันไปแล้วแต่โปรแกรมหรือผู้ให้บริการแต่ละราย
ไป่ตู้ (Baidu) เสิร์ชเอนจิน อันดับ 1 ของประเทศจีน
นักศึกษารู้จัก หรือเคยใช้ search engine อะไรกันมาบ้าง?
ตัวอย่างรายชื่อ Search Engine Site ที่ได้รับความนิยม
Google (www.google.com) – อันดับหนึ่งของโลก ในเกือบทุกๆ ประเทศ รวมถึงประเทศไทย
Bing (www.bing.com) – เป็นเว็บค้นหา ของบริษัท Microsoft คู่แข่งกับ Google โดยตรง
Yahoo (www.yahoo.com) – ตั้งแต่ ตุลาคม 2554 ที่ผ่านมา Yahoo ถูกซื้อกิจการโดย Bing (จาก Microsoft)
Ask.com (www.ask.com) – เว็บแสดงผลการค้นหา โดยเจาะจงที่คำถาม-คำตอบ มากกว่า How-to
AOL.com (www.aol.com) – เอโอแอล network ค้นหาข้อมูล ภายใต้เว็บไซต์ที่มีส่วนร่วม
Baidu (www.baidu.com) – ไป่ตู้ เป็นเว็บ Search Engine ประจำประเทศจีน มีบริการต่างๆ คล้ายกับ Google
Wolframalpha (www.wolframalpha.com) – เว็บไซต์สำหรับค้นหา ข้อเท็จจริง เอกสารวิชาการต่างๆ
DuckDuckGo (duckduckgo.com) – ผลการค้นหาคล้าย Google ข้อดีคือ หน้าตาสะอาด ไม่ค่อยมีโฆษณา
Internet Archive (archive.org) – เป็นเว็บรวมผลการค้นหา เว็บไซต์เก่า – เว็บไซต์ที่ผิดตัวไปแล้ว
สรุป ความหมายของ SEARCH ENGINES
เครื่องมือที่ใช้สำหรับค้นหาข้อมูลบนอินเทอร์เน็ต
โปรแกรมค้นหาที่ถูกออกแบบมาเป็นเครื่องมือใช้งาน
ในการสืบค้นข้อมมูลต่างๆบนเว็บไซต์
Topic 2
หลักการทำงานของ
SEARCH ENGINE
ระบบ Search Engine จะสร้างระบบเก็บข้อมูล หรือที่เรียกว่า Google Bot สำหรับ
ไต่ (crawl) ไปตาม Links ต่างๆ เพื่อเก็บข้อมูลเว็บต่างๆ ไปไว้ใน Server และจะถูกจัด
อันดับด้วยระบบ Algorithm ที่จะประมวลผลว่าเว็บไหนมีคุณภาพ และเกี่ยวกับเรื่อง
อะไร โดยจะจัดเก็บข้อมูลไว้ตามหมวดหมู่ต่างๆ เมื่อผู้ค้นหาข้อมูลผ่านทาง Search
Bot ด้วย Keyword ต่างๆ ระบบ Search Engine จะไปค้นหาข้อมูลเหล่านั้นมาแสดง
ผลให้ผู้ค้นหาข้อมูล
1. ใช้โปรแกรมรวบรวมเอกสารเว็บ (spider หรือ crawler) 2. จัดทำรายการดรรชนี
การตรวจค้นหาข้อมูลในเว็บเพจต่างๆ ขั้นแรกที่ Search engines ทำหน้าที่ในการรวบรวมข้อมูลที่ได้ทำการตรวจค้นไว้ในฐานข้อมูล เมื่อโปรแกรม Spider
ทำการสำรวจและตรวจสอบหน้าเว็บไซต์ต่างๆ จากโดเมน แล้วติดตาม ทำการค้นพบข้อมูลต่างๆ แล้ว จะมีการนำข้อมูลเหล่านั้นไปทำสำเนา และส่งไปจัดเก็บยัง
Links ที่พบภายในเว็บไซต์ทั้งหมด โดยการทำงานของโปรแกรมมีรูปแบบ รายการดรรชนี ที่เรียกว่า index หรือ catalog ซึ่งเมื่อข้อมูลในเว็บไซต์หลักมีการ
ลักษณะโยงใย จึงเรียกโปรแกรมดังกล่าวว่า Spider หรือ Crawler เปลี่ยนแปลง จะส่งผลให้ข้อมูลภายในสมุดดรรชนีเปลี่ยนแปลงตามไปด้วยตามบัญชีดรรชนี
ซึ่งหลังจากที่ Spider ทำการติดตาม Links และนำข้อมูลของเว็บไซต์ ที่ถูกกำหนดไว้
เหล่านั้นไปเก็บไว้ในฐานข้อมูลของ Search Engine เรียบร้อยแล้ว
Spider จะกลับไปทำการสำรวจและตรวจสอบการเปลี่ยนแปลงของ 3. โปรแกรมสืบค้น
ข้อมูลในเว็บไซต์เหล่านั้น ทุกๆ เดือนหรือสองเดือน
โปรแกรมที่ใช้สำหรับทำการค้นหาข้อมูลต่างๆ จากฐานข้อมูลของ
Search Engine โดยมีการทำงานเริ่มต้นจากการรับคำค้นหาที่ถูกป้อนเข้ามาใน
โปรแกรม โดยผู้ใช้งานบนเครือข่ายอินเทอร์เน็ต แล้วนำคำค้นหาไปจับคู่กับดรรชนีใน
ฐานข้อมูล หลังจากนั้นจึงจะทำการดึงเอกสารจากเว็บไซต์นั้นๆ หรือดึงข้อมูลจาก
ฐานออกมาประมวลผลลัพธ์ให้แก่ผู้สืบค้น ซึ่งจะมีการจัดลำดับผลการค้นหาตาม
ระดับความเกี่ยวข้องของข้อมูล
TOPIC 3
ประเภทของ
SEARCH ENGINE
Search Engine สามารถแบ่งออกได้เป็น 3 ประเภทหลักๆ
โดยมีความแตกต่างกันที่หลักการทำงาน และการจัดอันดับ
ข้อมูลในการค้นหา
1. CRAWLER BASED SEARCH ENGINES
คือ เครื่องมือที่ใช้สำหรับการสืบค้นข้อมูลบนเครือข่าย
อินเทอร์เน็ต ซึ่ง Search Engines ชนิดนี้เป็นประเภท
ที่ได้รับความนิยมในการใช้งานสูงสุด มีหลักการทำงาน
โดยการบันทึกและจัดเก็บข้อมูลต่างๆ สามารถให้ผลลัพธ์
การค้นหาที่มีความแม่นยำสูง และมีการประมวลผล
ที่รวดเร็ว จึงเป็นเหตุผลที่ทำให้ในปัจจุบัน
Crawler Based Search Engines มีบทบาทในการ
สืบค้นข้อมูลมากที่สุด
ตัวอย่าง 2. WEB DIRECTORY
http://webindex.sanook.com/ คือ สารบัญเว็บไซต์สำหรับการสืบค้นข้อมูลข่าวสาร
http://webindex.kapook.com/ ที่มีการจัดระเบียบและแบ่งข้อมูลต่างๆ ไว้เป็นหมวดหมู่
http://www.pantip.com/cafe/event/contact/indexL.html ผู้สืบค้นจึงสามารถใช้งานได้ง่ายและมีความสะดวกในการค้นหา
http://directory.narak.com/ โดยในการค้นหาจะมีการสร้างดรรชนี
http://webdir.hunsa.com/index.php และระบุหมวดหมู่ไว้อย่างชัดเจน ทำให้ในขณะที่กำลัง
http://baanjomyut.com/webindex/newweb/addlink.html ทำการค้นหาข้อมูลต่างๆ ในหมวดหมู่หนึ่ง ที่อาจมีเนื้อหาคล้าย
http://com-th.net/cgi-bin/webindex/add.cgi กันมากมายหลายเว็บไซต์ ผู้สืบค้นสามารถนำข้อมูล
http://dmoz.org/World/Thai/ ที่ได้จากการประมวลผลมาเปรียบเทียบ และอ้างอิง
http://esarntoday.com/webindex/ เพื่อค้นหาข้อเท็จจริงที่มีคุณภาพ และตรงประเด็นมากที่สุด
http://haarai.com/toregis.php?mode=new
http://itmelody.com/free_al/AL_AddNewItem.php
http://webindex.thaiorc.com/
ตัวอย่าง 3. META SEARCH ENGINE
Unabot.com ใช้หลักการในการค้นหาอาศัย Meta Tag ในภาษา HTML มีชุด
คำสั่งต่างๆ เป็นรูปแบบ tex editorด้วยภาษา HTML นั่นเอง
search.com ผลการค้นหาของ meta search engine ไม่แม่นยำอย่างที่
ควร เนื่องจากผู้บริการจะสามารถใส่อะไรลงไปก็ได้ อีกประการ
Vroosh.com หนึ่งก็คือ มีการอาศัย search engine index server หลายๆ
ที่มาประมวลรวมเข้าหากัน จึงทำให้การค้นหาข้อมูลไม่แม่นยำนัก
SEARCH ENGINE ประเภทอื่ นๆ
Hybrid Search Engines Speciality Search Engines
เป็นเว็บ Search Engine ที่มี คือ Search Engine ที่ใช้เสิร์ชข้อมูลเฉพาะด้าน เฉพาะบางประเภท
การทำงานแบบผสมเป็นเว็บที่ ไม่ใช่เสิร์ชข้อมูลทั้งหมดที่เจอในเว็บไซต์ทั่วโลกเหมือนกับเสิร์ชเอนจิ้น
ทำงานโดยมีการผสม Crawler 2 ประเภทแรก เช่น เสิร์ชเฉพาะข้อมูลบล็อก, เสิร์ชเฉพาะไฟล์ภาพ,
Based และในขณะเดียวกันก็
สามารถให้บริการค้นหาแบบ เสิร์ชเฉพาะคลิปวิดีโอ, เสิร์ชเฉพาะแผนที่ เท่านั้น ตัวอย่างเช่น
Google Image (เสิร์ช ภาพ), Google Video (เสิร์ชวิดีโอ),
Web directory เป็นการ Google News (เสิร์ชข่าว), Google Maps (เสิร์ชแผ่นที่) เป็นต้น
ค้นหาที่สมบูรณ์และครอบคลุม
TOPIC 4
วิธีการค้นหาข้อมูลบน
SEARCH ENGINE
Search Engine จะมีวิธีการค้นหาโดยการกรอกข้อมูลหรือคำที่
ต้องการสืบค้นลงไปแล้วเว็บไซต์จะทำการประมวลผลลัพธ์ต่างๆ
ออกมาให้ผู้สืบค้นข้อมูลทราบ ซึ่งคำค้นหาที่จะใช้เรียกว่า เป็น
Keyword (คำสำคัญ) ของการสืบค้นข้อมูล
การยกเว้นผลลัพธ์การค้นหา ใช้ เครื่องหมายลบ -
การค้นหาไฟล์เอกสารนามสกุลต่างๆ
ใช้ +filetype:pdf /doc / ppt
การแปลงหน่วย
การใช้เครื่องคิดเลขออนไลน์
เทคนิคการสืบค้นด้วยคีย์เวิร์ด
ใช้คำมากกว่า 1 คำที่มีลักษณะเกี่ยวข้องกันช่วยค้นหา
ใช้บริการของผู้ให้บริการเฉพาะด้าน
ใส่เครื่องหมายคำพูด “ … ”
ใช้ * เป็นตัวร่วม
ไปดูของจริงกันดีกว่า..........
TOPIC 5
การนำข้อมูลจากอินเทอร์เน็ต
มาใช้และการอ้างอิง
ประเภทของแหล่งข้อมูลในเว็บไซต์ โปรแกรม
มีอะไรบ้าง คอมพิวเตอร์
ข้อควรระวัง!!!
ในระดับอุดมศึกษาไม่ยอมรับการ
อ้างอิงเนื้อหาจาก วิกิพีเดีย
บทความจาก เว็บเพจ
วารสาร
ข้อควรระวัง!!! Thesis โปรแกรม หนังสือ
ในระดับอุดมศึกษาไม่ยอมรับการ วิทยานิพนธ์ คอมพิวเตอร์
อ้างอิงเนื้อหาจาก วิกิพีเดีย รายงาน
หนังสือพิมพ์ เอกสารราชการ
ไปฝึกใช้เครื่องมือช่วยในการเก็บเอกสารอ้างอิงกัน...
ให้ นศ. สืบค้นข้อมูลจาก สรุปเนื้อหาที่สนใจ จากแหล่งข้อมูล
SEARCH ENGINE ที่สนใจ โดยเลือกจากหัวข้อที่ ที่สืบค้นได้ ลงใน เครื่องมือ
กำหนดไว้ดังต่อไปนี้ MENDELEY พร้อมกรอกข้อมูลการอ้างอิง
กลุ่มละ 1 หัวข้อ 3 แหล่งข้อมูล
นำเสนอ งาน 3 ส่วนตามใบงาน
สืบค้นข้อมูลจาก Search engine ประเภทใด
ใช้เทคนิคอะไรบ้าง ในการสืบค้น (+ - " ")
แล้วอธิบายความแตกต่างที่พบ
สรุปและอ้างอิง เนื้อหาที่ได้ ลงใน
MS Word ทั้ง ใน in text citation และ
อ้างอิงแบบบรรณานุกรม
หัวข้อแบบฝึกหัด สถิติการใช้ เทคนิคการ
Search สืบค้นข้อมูลด้วย
engine
Google
เสิร์ชเอนจิน
(Search Engines) ประโยชน์
ของ
คืออะไร
Search
Engines
หลักการทำงานของเสิร์ชเอนจิน ตัวอย่างการค้นหา ความสามารถ
ข้อมูลด้วย search พิเศษของ
engine google