Search Engine คืออะไร
Google.com เป็น Search Engine ตัวหนึ่ง (หรือจะเรียก ที่หนึ่ง ก็ได้) ซึ่งหากเราเราจะเรียกแบบบ้าน ๆ ตามประสาคนท่องเว็บแล้ว Search Engine ก็คือ เครื่องมือในการค้นหาข้อมูลบนอินเตอร์เน็ตนั่นเอง นอกจาก Google แล้วยังมี Search Engine อีกหลาย ๆ ที่ ซึ่งดัง ๆ ที่เราพอจะคุ้นตาคุ้นหูอยู่บ้างก็อาทิเช่น Yahoo MSN เป็นต้น (ขอแนะนำที่ดัง ๆ เป็นพอ ไม่ดังไม่สน)
ซึ่งในปัจจุบันหากให้เดาเพื่อน ๆ คงจะพอเดาถูกว่า Search Engine ที่ดังที่สุด (มีคนใช้เยอะสุด ๆ) ก็คือ Search Engine พระเอกที่ชื่อว่า Google.com นั่นเอง ซึ่งเป็น Search Engine ที่มีคนใช้เยอะมาก ๆ ทั้ง ๆ ที่มีให้บริการมาไม่กี่ปีนี่เอง เปิดบริการมาไม่นานก็แซงหน้าขาใหญ่เดิมอย่าง Yahoo ไปชนิดที่เรียกว่ามองแทบไม่เห็นฝุ่น ก็เพราะว่าด้วยรูปแบบที่ใช้งานง่าย และรวดเร็วนั่นเอง แถมเป็นภาษาไทยด้วย ยิ่งถูกใจคนไทยเป็นอย่างยิ่ง
ซึ่งปรากฏการ google ฟรีเว่อร์นี้เอง ที่ทำให้คนส่วนหนึ่ง ซึ่งส่วนใหญ่เป็น Webmaster หันมาทำ SEO เจาะที่ Search Engine ที่มีชื่อว่า Google กันอย่างถล่มทะลาย
พูดไปเรื่องของ SEO แต่ล่ะที่ ที่ดัง ๆ ไปแล้ว เราก็มารู้เรื่องเกี่ยวกับประเภทของ Search Engine กันซักหน่อย ซึ่ง Search Engine ก็มีอยู่หลาย ๆ ประเภท ดังนี้
1. อินเด็กเซอร์ (Indexers) Indexers Search Engine
เป็นโปรแกรมคอมพิวเตอร์ที่นิยมเรียกกันว่า "Spiders" หรือ"ROBOT" หรือ "Crawler" โดยโปรแกรมเหล่านี้จะถูกส่งออกไปท่องในระบบเครือข่ายอินเทอร์เน็ตเป็นระยะ ๆ เพื่อค้นหาเว็บเพจใหม่ ๆ หรือเว็บเพจที่ได้มีการปรับปรุงใหม่ แล้วนาข้อมูลของเว็บเพจนั้น ๆ มา จัดเก็บเป็นดัชนีในฐานข้อมูลซึ่งนิยมเรียกกันว่า
"Index" หลักการนี้เป็นการใช้เครื่องมือที่เรียกว่า Crawler-Based Search Engine เป็นเครื่องมือที่ทำการบันทึกและเก็บข้อมูลเป็นหลัก ซึ่งเป็นประเภท Search Engine ที่ได้รับความนิยมมากที่สุดในปัจจุบัน
ซึ่งการทำงานประเภทนี้ จะใช้โปรแกรมตัวเล็ก ๆ ที่เรียกว่า Web Crawler หรือ Spider หรือที่เรียกอีกอย่างว่า Search Engine Robots หรือที่เรียกสั้น ๆ ว่า บอท ในภาษาไทย www คือเครือข่ายใยแมงมุม ตัวโปรแกรมเล็ก ๆ ตัวนี้ก็คือแมงมุมนั่นเอง โดยเจ้าแมงมุมตัวนี้จะทำการไต่ไปยังเว็บไซต์ต่าง ๆ ทั่วโลกอินเตอร์เน็ต โดยอาศัยไต่ไปตาม URL ต่าง ๆ ที่มีการเชื่อมโยงอยู่ในแต่ละเพจ แล้วทำการ Spider กวาดข้อมูลที่จำเป็นต่าง ๆ (ขึ้นอยู่กะ Search Engine แต่ละที่ว่าต้องการเก็บรวบรวมข้อมูลอะไรบ้าง) แล้วเก็บลงฐานข้อมูล การใช้โปรแกรมกวาดข้อมูลแบบนี้ จึงทำให้ข้อมูลที่ได้มีความแม่นยำ และสามารถเก็บรวบรวมข้อมูลได้เร็วมาก Search Engine ที่เป็นประเภทนี้ เช่น Google Yahoo MSN
ลักษณะการทางานของอินเด็กเซอร์1. ระบบจะทาการส่งโปรแกรมท่องไปในระบบเครือข่ายอินเทอร์เน็ต เพื่อเก็บรวบรวมข้อมูลจากเว็บเพจ ซึ่งจะทาให้ได้ฐานข้อมูลดัชนีเว็บที่มีขนาดใหญ่ และสารสนเทศจานวนมาก
2. ข้อมูลที่ได้จะถูกรวบรวมมาทาดัชนีทั้งหมด และจัดอันดับ (Ranked) ด้วยคอมพิวเตอร์ตามหลักวิธีการ (Computer Algorithm) ที่กาหนดไว้ในแต่ละเสิร์ชเอ็นจิ้น
3. การจัดทาดัชนีมักจะทาโดยใช้คาทั้งหมดทุกคาที่ปรากฏอยู่ในเว็บเพจที่ได้เชื่อมโยงไปถึง ซึ่งเราสามารถเชื่อมโยงไปยังเว็บเพจที่ต้องการได้โดยอาศัยการเทียบเคียงคาที่ต้องการกับคาที่พบในเว็บเพจนั้น ๆ
4. ข้อมูลดัชนีเว็บที่ได้จะถูกจัดเก็บโดยอัตโนมัติด้วยโปรแกรมจึงไม่มีการประเมินและกลั่นกรองสาระในเว็บเพจที่เก็บรวบรวมมา ดังนั้นเนื้อหาสาระที่ได้จึงมีทั้งที่ดีและไม่ดี ผู้ใช้จะต้องใช้วิจารณญาณในการพิจารณาคัดสรรด้วยตนเอง
5. เสิร์ชเอ็นจิ้นแต่ละระบบจะใช้วิธีเก็บข้อมูลดัชนี ตลอดจนวิธีการวิเคราะห์อันดับรายการที่แตกต่างกันไป ดังนั้นในการค้นหาด้วยคาค้นในแต่ละเสิร์ชเอ็นจินจะให้ผลการค้นหาที่แตกต่างกัน และไม่มีเสิร์ชเอ็นจินใดที่เก็บรวบรวมและจัดทาดัชนีเว็บเพจที่มีอยู่บนเว็บได้ทั้งหมด
ยุทธวิธีในการค้นหาข้อมูล
ในปัจจุบันมีเครื่องมือที่ช่วยในค้นหาข้อมูลให้เลือกใช้มากมาย และมีความหลากหลายในลักษณะและรูปแบบวิธีการใช้งาน แต่ถ้าเราเข้าใจถึงเทคนิคพื้นฐานของการสืบค้นสารสนเทศจะช่วยทาให้เราสามารถใช้เครื่องมือเหล่านั้นได้อย่างเต็มความสามารถ และดาเนินการค้นหาสารสนเทศที่ต้องการได้อย่างมีประสิทธิภาพโดยใช้หลักการดังนี้
1. การใช้คาหลักหรือวลี (Keyword and Phrase) การค้นหาด้วยคาหลักหรือวลี (Keyword and Phrase) เป็นเทคนิคพื้นฐานที่พบเห็นกันมากที่สุดในเครื่องมือช่วยค้นเพราะเป็นวิธีที่ง่ายและสะดวกต่อผู้ใช้ โดยที่ผู้ใช้เพียงพิมพ์คาที่ต้องการ (Keyword) เพื่อใช้เป็นคาค้น ลงในกล่องค้นหา (search box) ซึ่งการค้นหาในลักษณะนี้มักเรียกว่าการค้นหาแบบง่าย (Simple Search)
2. วิธีการใช้ Search Engine แต่ละเว็บไซต์
Search Engine แต่ละตัวจะมีส่วนช่วยในการอธิบายวิธีใช้ในส่วนที่เรียกว่า Help หรือ About เช่น Yahoo มีวิธีกำหนดคำค้นเพื่อให้ได้ผลค้นที่เฉพาะเจาะจงหรือตรงต่อความต้องการ โดย
1.1 ใช้เครื่องหมายดอกจันทร์ (*) เพื่อค้นหาคำที่มีการสกดคล้ายกัน เช่น smok* หมายความว่า ให้ค้นหาคำทั้งหมดที่ขึ้นด้วย 5 ตัวอักษรแรก เช่น smoke smoker เป็นต้น
1.2 ใช้เครื่องหมาย + สำหรับกำหนดให้แสดงผลการค้นเฉพาะเว็บไซต์ ที่ปรากฏคำทั้งสองคำ เช่น Secondary + education
1.3 ใช้เครื่องหมาย “ ” สำหรับการค้นหาคำที่เป็นวลี เช่น “great barrier reaf” ฯลฯ
3. การค้นหาด้วยตรรกบูลีน การค้นหาด้วยตรรกบูลีน (Boolean Logic) เป็นวิธีหนึ่งที่นิยมใช้กันมาก ซึ่งในการค้นหาด้วยคาหรือวลี ตรรกบูลีนมีบทบาทอย่างสาคัญในการประมวลผลข้อความด้วยระบบคอมพิวเตอร์ การค้นหาด้วยวิธีนี้จะเป็นการใช้ตัวเชื่อม (Operator) เพื่อเชื่อมความสัมพันธ์ระหว่างคาค้นในลักษณะที่ผู้ใช้ต้องการ ตัวเชื่อมตามตรรกบูลีน ได้แก่ AND หรือ OR หรือ NOT ซึ่งเป็นคาที่ใช้ตัวอักษรใหญ่ทั้งหมด ซึ่งทาให้สามารถค้นหาข้อมูลในเชิงลึกและใกล้เคียงกับความต้องการของผู้ใช้มากที่สุด วิธีการค้นหาข้อมูลอย่างมีประสิทธิภาพ เพื่อให้การค้นหาข้อมูลตรงตามความต้องการ หรือใกล้เคียงมากที่สุด ควรเลือกค้นหาด้วย
1. บีบประเด็นให้สั้นลง
2. การใช้คาที่ใกล้เคียง
3. การใช้คาหลัก (Keyword)
4. หลีกเลี่ยงการใช้ตัวเลข
5. ใช้เครื่องหมายบวกและลบช่วย
6. หลีกเลี่ยงภาษาพูด
7. Advanced Search อย่าลืมที่จะใช้ Advanced Search
8. อย่าละเลย Help ไว้คอยช่วยเหลือ
เทคนิคการค้นหาให้ได้ผลลัพธ์ตามต้องการ
การค้นหาข้อมูลด้วยเว็บไซต์ค้นหานั้น
เพื่อให้ขอบข่ายของการค้นหาแคบเข้า สามารถ
ค้นหาได้ง่ายและรวดเร็วขึ้น จะต้องใช้เทคนิคในการค้นหาดังนี้
ตารางที่ 12.1 เทคนิคการค้นหา
บีบประเด็นให้แคบลง
|
หัวข้อเรื่องที่ต้องการค้นหาต้องพยายามบีบประเด็นให้แคบลง เช่น
หากต้องการค้นหาข้อมูลเกี่ยวกับคอมพิวเตอร์ ซึ่งอาจจะหาโดยใช้คำว่า คอมพิวเตอร์
หรือ Computer นี้ค้นหา เพื่อลองดูเนื้อหากว้างๆ
เกี่ยวกับคอมพิวเตอร์ ว่ามีเรื่องใดบ้าง จากนั้นก็บีบหัวข้อเรื่องลง
โดยอาจจะเลือกจากหัวข้อที่เว็บไซต์นั้นจัดทำ
หรืออาจจะพิมพ์ข้อความเพื่อค้นหาอีกครั้ง
|
การใช้คำที่ใกล้เคียง
|
ควรค้นหาคำที่มีความหมายใกล้เคียงกับคำที่กำลังค้นหาด้วย เช่น
หากต้องการค้นเรื่องเกี่ยวกับคอมพิวเตอร์ Computer คำที่เกี่ยวข้องที่สามารถใช้ค้นหาได้ คือ technology, IT
เป็นต้น
|
การใช้คำหลัก
(Keyword)
|
คำหลัก (Keyword) หมายถึง คำหรือข้อความที่เราจะนึกถึงเว็บไซต์นั้นเมื่อเอ่ยถึง เช่น
สสวท. เรามักจะนึกถึงเว็บไซต์ของสถาบันส่งเสริมการสอนวิทยาศาสตร์และเทคโนโลยี
http://www.ipst.ac.th หรือ
schoolnet เราจะนึกถึงเว็บไซต์เครือข่ายโรงเรียนไทย http://www.school.net.th |
หลีกเลี่ยงการใช้ตัวเลข
|
พยายามเลี่ยงการใช้คำค้นหาที่เป็นคำเดี่ยวๆ หรือเป็นคำที่มีตัวเลขปน
แต่ถ้าเลี่ยงไม่ได้ ก็อย่าลืมใส่เครื่องหมายคำพูด (" ") ลงไปด้วย เช่น "windows 98"
|
ใช้เครื่องหมายบวกและลบช่วย
|
ใช้เครื่องหมาย + และ - เพื่อช่วยในการค้นหา โดย + เพื่อใช้กับคำที่คุณต้องการใช้ในการค้นหา และ - เพื่อใช้กับคำที่ไม่ต้องการใช้ในการค้นหา
เครื่องหมาย "+" หมายถึง การระบุให้ผลลัพธ์ของการค้นหาต้องมีคำนั้นปรากฎอยู่ในหน้าเว็บเพจ ข้อควรระวังคือ เราจะต้องใช้เครื่องหมายบวกติดกับคำหลักนั้นเสมอ ห้ามมีช่องว่างระหว่างเครื่องหมายบวกกับคำหลัก เช่น +เศรษฐกิจ +การเมือง หมายถึง หน้าเว็บเพจที่พบจะต้องปรากฎคำว่า "เศรษฐกิจ" และ "การเมือง" อยู่ในหน้าเดียวกันทั้งสองคำ หรือ +เศรษฐกิจ การเมือง สังเกตเห็นว่าที่คำว่า "การเมือง" ไม่ปรากฏเครื่องหมายบวก "+" อยู่ข้างหน้า เหมือนตัวอย่างบน หมายถึง การค้นหาหน้าเอกสารเว็บเพจที่จะต้องปรากฏ คำว่า "เศรษฐกิจ" โดยในหน้าเอกสารนั้นอาจจะปรากฏหรือไม่ปรากฏคำว่า
"การเมือง"
ก็ได้
เครื่องหมายลบ
"-" หมายถึง เป็นการระบุให้ผลลัพธ์ของการค้นหาต้องไม่ปรากฎคำนั้น
อยู่ในหน้าเว็บเพจ เช่น
โรงแรม -รีสอร์ท หมายถึง หน้าเว็บเพจนั้นต้องมีคำว่า โรงแรม
แต่ต้องไม่ปรากฎคำว่า
รีสอร์ท อยู่
โดยการใช้งานต้องอยู่ในรูปของ A -B หรือ +A -B โดย A และ B
เป็นคำหลักที่ต้องการค้นหา
ตัวอย่าง +มะม่วง -มะม่วงอกร่อง -มะม่วงน้ำดอกไม้ หมายถึง หน้าเว็บเพจที่พบจะต้องปรากฎคำว่า "มะม่วง" แต่ต้องไม่ปรากฎคำว่า "มะม่วงอกร่อง" และ "มะม่วงน้ำดอกไม้" อยู่ในหน้าเดียว |
หลีกเลี่ยงภาษาพูด
|
หลีกเลี่ยงคำประเภท
Natural Language หรือเรียกง่ายๆ ว่าคำหรือข้อความที่เป็นภาษาพูด
หรือเป็นประโยค ควรสรุปเป็นเพียงกลุ่มคำหรือวลี ที่มีความหมายรวมทั้งหมดไว้
|
Advanced Search
|
อย่าลืมที่จะใช้
Advanced Search เพราะจะมีส่วนช่วยได้มาก ในการบีบประเด็นหัวข้อ
ให้แคบลง ซึ่งจะทำให้ได้รายชื่อเว็บไซต์ ที่ตรงกับความต้องการของมากขึ้น
อย่าละเลย Help ซึ่งในแต่ละเว็บ จะมี ปุ่ม help หรือ Site map ไว้คอยช่วยเหลือคุณ แต่คนส่วนใหญ่มักจะมองข้าม ซึ่ง help/site map จะมีประโยชน์มากในการอธิบาย option หรือการใช้งาน/แผนผังปลีกย่อยของแต่ละเว็บไซต์ |
ปัจจุบันมีเว็บไซต์ที่ให้บริการในการค้นหาข้อมูลเป็นจานวนมาก และมีแนวโน้มเพิ่มขึ้นอย่างต่อเนื่อง โดยเว็บไซต์ที่ได้รับความนิยมจากผู้ใช้อินเทอร์เน็ต และเป็นที่รู้จักกันคือ googlewww.yahoo.com เป็นเว็บไซต์ค้นหาเก่าแก่รู้จักกันมานาน ปัจจุบันก็ยังเป็นที่นิยมอยู่เหมือนเคย ด้วยการที่มีฐานข้อมูลหลากหลายครอบคลุมนทุกเรื่อง ค้นหาได้ฉับไว www.google.co.th เป็นเว็บไซต์ฐานข้อมูลที่ใหญ่มากแห่งหนึ่งของโลก ในอดีตเป็นบริษัทที่ดาเนินการด้านฐานข้มูลเพื่อให้บริการแก่เว็บไซต์ค้นหาอื่นๆ ปัจจุบันได้เปิดเว็บไซต์ค้นหาเอง ด้วยฐานข้มูลมากกว่าสามพันล้านเว็บไซต์และเพิ่มขึ้นเรื่อยๆ ทุกวัน ที่เหนือกว่าผู้ให้บริการรายอื่นๆ คือ เป็นเว็บไซต์ค้นหาที่สนับสนุนภาษาต่างๆ มากกว่า 80 ภาษาทั่วโลก (รวมทั้งภาษาไทย) และมีเครื่องเซิร์ฟเวอร์ให้บริการในส่วนต่างๆ ของโลกมากถึง 36 ประเทศ
www.Altavista.com เป็น Search engines ของบริษัท Digital Equipment Crop. หรือ Dec ซึ่งมีฐานข้อมูลที่มีขนาดใหญ่มาก มีโปรแกรมช่วยในการค้นหาข้อมูลที่มีความสามารถที่สูงมาก โดยมีเว็บเพจมากกว่า 150 ล้านเว็บที่ใช้ในการค้นหาข้อมูล
การค้นหาข้อมูลโดยใช้ www.google.co.th
การให้บริการค้นหาของ Google แบ่งข้อมูลออกเป็น 4 หมวด คือ
1. เว็บ : เป็นการค้นหาข้อมูลจากเว็บไซต์ต่างๆ ทั่วโลก
2. รูปภาพ : เป็นการค้นหารูปภาพหลากหลายฟอร์แมตจากเว็บไซต์ต่างๆ ทั่วโลก
3. กลุ่มข่าว : เป็นการค้นหาเรื่องราวที่น่าสนใจจากกลุ่มข่าวต่างๆ
4. สารบบเว็บ : การค้นหาข้อมูลจากเว็บไซต์ที่แยกออกเป็นหมวดหมู่ การค้นหาขั้นสูง ในเว็บไซต์ของ Google มีความสามารถในการตั้งค่าหรือเงื่อนไขในการค้นหาได้ ด้วยการเข้าไปกาหนดที่หน้าตัวเลือกภาษา เหมาะกับท่านที่ต้องใช้เว็บไซต์ในการค้นหาเฉพาะภาษาหนึ่ง ภาษาใดโดยเฉพาะ หรือที่เกี่ยวกับภูมิภาคต่างๆ ของโลกเป็นประจา จะช่วยในการค้นหาทาได้สะดวกมากยิ่งขึ้น
การค้นหาขั้นสูงสามารถระบุรายละเอียดต่างๆ ได้ เพื่อให้วงในการค้นหาให้แคบเข้าและใกล้เคียงกับความต้องการมากที่สุด เช่น การกาหนดคาหลักที่ต้องการ คาที่คล้ายคลึงและคาที่ไม่ต้องการให้ปรากฏอยู่ด้วย กาหนดเฉพาะภาษา ชนิดของไฟล์ ช่วงระยะเวลาที่เอกสารนั้นสร้างขึ้น จากโดเมนเว็บไซต์ชื่ออะไร เป็นต้น
การค้นหากลุ่มข่าว
กลุ่มข่าวต่าง ๆ นั้นโดยปกติจะมีการแบ่งแยกเป็นหมวดหมู่ที่น่าสนใจอยู่แล้ว เราสามารถคลิกที่ชื่อกลุ่มข่าวที่เราสนใจได้ทันที แต่บางทีเราสามารถเลือกเงื่อนไขพิเศษเพื่อช่วยในการค้นหาข่าวให้เร็วยิ่งขึ้นก็ได้ สามารถระบุข้อความที่ต้องการค้นหาจากกลุ่มข่าวด้วยคา หรือบางส่วนของข้อความ เช่นเดียวกับการค้นหาเว็บเพจ แต่สามารถคัดเลือกเอาเฉพาะคาที่ปรากฏในกลุ่มข่าว ผู้เขียน หมายเลขข้อความ ภาษาที่ใช้ รวมทั้งช่วงระยะเวลาตามที่ต้องการได้ด้วย
2. แบบสารบัญเว็บไซต์ (Web Directory)
Search Engine ที่เป็นแบบนี้มีอยู่หลายเว็บไซต์มาก ๆ ที่ดังที่สุดในเมืองไทย ที่เอ่ยออกไปใครใครคงต้องรู้จัก นั้นก็คือที่สารบัญเว็บของ Sanook.com ซึ่งหลาย ๆ คนคงเคยเข้าไปใช้บริการ หรืออย่างที่ Truehits.com เป็นต้น
ส่งที่เราจะสังเกตเห็นจาก Search Engine ประเภทนี้ก็คือ ลักษณะของการจัดเก็บข้อมูลที่แสดงให้เราเห็นทั้งหมด ว่ามีเว็บอะไรบ้างอยู่ในฐานข้อมูล ซึ่งแตกต่างจากประเภทแรก ที่หากคุณไม่ค้นหาโดยใช้คำค้น หรือ Keyword แล้ว คุณจะมีทางทราบเลยว่ามีเว็บไซต์อะไรอยู่บ้าง และมีเว็บอยู่เท่าไหร่
แบบสารบัญเว็บไซต์ จะแสดงข้อมูลที่รวบรวมเว็บไซต์ที่มีทั้งหมดในฐานข้อมูล และจะแบ่งเป็นหมวดหมู่ และอาจจะมีหมวดหมู่ย่อย ซึ่งผู้ค้นหาข้อมูลสามารถคลิกเข้าไปดูได้
หลักการทำงานแบบนี้ จะอาศัยการเพิ่มข้อมูลจากเจ้าของเว็บไซต์ต่าง ๆ ที่ต้องการประชาสัมพันธ์เว็บ หรืออาจใช้เจ้าหน้าที่ที่ดูแลส่วน Search Engine เป็นผู้หาข้อมูลเว็บไซต์มาเพิ่มในฐานข้อมูล ซึ่งข้อมูลในส่วนของสารบัญเว็บไซต์จะเน้นในด้านความถูกต้องของฐานข้อมูล ซึ่งข้อมูลเว็บไซต์ที่ถูกเพิ่มเข้ามาจะถูกตรวจสอบและแก้ไขจากผู้ดูแล
3. แบบอ้างอิงในคำสั่ง Meta Tag (Meta Search Engine )
Search Engine ประเภทนี้จะอาศัยข้อมูลใน Meta tag (อยากรู้ดูในบทความหน้า) ซึ่งเป็นส่วนของข้อมูลที่อยู่ในแท็ก HEAD ของภาษา HTML ซึ่งข้อมูลในส่วนนี้ จะเป็นส่วนที่ให้ข้อมูลกับ Search Engine Robots
Search Engine ประเภทนี้ไม่มีฐานข้อมูลของตนเอง แต่จะอาศัยข้อมูลจาก Search Engine Index Server ของที่อื่น ๆ ซึ่งข้อมูลจะมาจาก Server หลาย ๆ ที่ ดังนั้น จึงมักได้ผลลัพธ์จากการค้นหาที่ไม่แม่น
การทำงานของ Search Engine ประกอบไปด้วย ๓ ส่วนหลัก ๆ คือ
๑. Spider หรือ Web Robot จะเป็นตัวที่ทำหน้าที่เข้าสำรวจเว็บไซต์ต่างๆ แล้วดึงข้อมูลเหล่านั้นมาอัพเดทใส่ในรายการฐานข้อมูล ส่วนมาก Spider มักจะเข้าไปอัพเดทข้อมูลเป็นรายเดือน
๒. ฐานข้อมูล (Database) เป็นส่วนที่เก็บรายการเว็บไซต์ ฐานข้อมูลที่ดีควรจะมีขนาดใหญ่เพียงพอที่จะรองรับกับการเติบโตของเว็บไซต์ในปัจจุบัน การออกแบบฐานข้อมูลที่ดีก็เป็นส่วนสำคัญเพราะถ้าฐานข้อมูลออกแบบมาทำงานช้าก็ทำให้การรอผลนานและจะไม่ได้รับความนิยมไปในที่สุด
๓.โปรแกรม Search Engine มีหน้าที่รับคำหรือข้อความที่ผู้ใช้งานป้อนเข้ามา แล้วเข้าค้นหาตามเว็บไซต์ต่างๆ ที่จัดเก็บไว้ในฐานข้อมูล จากนั้นก็จะรายงานผลเว็บไซต์ที่ค้นพบให้กับผู้ใช้ การสืบค้นด้วยวิธีนี้นอกจากจะต้องมีระบบการสืบค้นข้อมูลที่รวดเร็วและมีประสิทธิภาพแล้ว การกลั่นกรองผลที่ได้ เพื่อให้ตรงกับความต้องการของผู้ใช้ก็เป็นอีกส่วนหนึ่งที่สำคัญของการสืบค้นข้อมูล
ดังนั้น การเลือกใช้เครื่องมือในการค้นหาจะต้องเข้าใจว่า ข้อมูลที่ต้องการค้นหานั้นมีลักษณะอย่างไร มีขอบข่ายกว้างขวางหรือแคบขนาดไหน แล้วจึงเลือกใช้เว็บไซต์ค้นหาที่ให้บริการตรงกับความต้องการ
Top Hit Search Engine
1.Google (46.5%)
2.Yahoo (20.6%)
3.MSN Search (7.8%)
4.Altavista (6.4%)
5.Terra Lycos (4.6%)
6.Ixquick (2.4%)
7.AOL Search (1.6%)
ข้อมูลจาก สันติ ศรีลาศักดิ์ และเกศมณี เที่ยงธรรม,เปิดประตูสู่โลกของ Search Engine (นนทบุรี;บริษัทออฟเซ็ต เพรส จำกัด,2545),หน้า 290-291
ประโยชน์ของการค้นข้อมูลโดยใช้ search engine
1. ค้นหาเว็บที่ต้องการได้สะดวก รวดเร็ว
2. สามารถค้นหาแบบเจาะลึกได้ ไม่ว่าจะเป็น รูปภาพ, ข่าว, MP3 และอื่นๆ อีกมากมาย
3. สามารถค้นหาจากเว็บไซต์เฉพาะทาง ที่มีการจัดทำไว้ เช่น download.com เว็บไซต์เกี่ยวกับข้อมูลและซอร์ฟแวร์ เป็นต้น
4. มีความหลากหลายในการค้นหาข้อมูล
5. รองรับการค้นหา ภาษาไทย