كيف تعمل محركات البحث؟

586

يعمل محرك البحث بالترتيب التالي:

  • 1- الزحف.
  • 2- البحث العميق لعمق الزحف الأول (DFS)
  • 3- بحث جديد عن اتساع الزحف (BFS)
  • 4- الفهرسة
  • 5- البحث.

تعمل محركات البحث على الويب من خلال تخزين معلومات حول عدد كبير من صفحات الويب ، والتي تسترجعها من WWW نفسها. يتم استرداد هذه الصفحات بواسطة متتبع ارتباطات الويب (يُعرف أيضًا باسم العنكبوت) – متصفح ويب آلي يتبع كل رابط يراه ، ويمكن إجراء الاستثناءات باستخدام ملف robots.txt. ثم يتم تحليل محتويات كل صفحة لتحديد كيفية فهرستها. يتم تخزين البيانات المتعلقة بصفحات الويب في قاعدة بيانات فهرسة لاستخدامها في الاستعلامات اللاحقة. تقوم بعض محركات البحث ، مثل Google ، بتخزين كل أو جزء من الصفحة المصدر (يشار إليها باسم ذاكرة التخزين المؤقت) بالإضافة إلى معلومات حول صفحات الويب ، بينما يقوم البعض بتخزين كل كلمة من كل صفحة يعثر عليها. تحتوي هذه الصفحة المخبأة دائمًا على نص البحث الفعلي نظرًا لأنه هو الذي تمت فهرسته بالفعل ، لذلك يمكن أن يكون مفيدًا للغاية عندما يتم تحديث محتوى الصفحة الحالية ولم تعد مصطلحات البحث موجودة فيه. يمكن اعتبار هذه المشكلة على أنها شكل معتدل من الروابط ، ويزيد تعامل Google معها قابلية الاستخدام من خلال تلبية توقعات المستخدم بأن مصطلحات البحث ستكون على صفحة الويب التي يتم إرجاعها. هذا يفي بمبدأ أقل دهشة لأن المستخدم يتوقع عادة أن تكون مصطلحات البحث على الصفحات التي يتم إرجاعها. زيادة صلة البحث تجعل هذه الصفحات المخبأة مفيدة للغاية ، حتى بعد حقيقة أنها قد تحتوي على بيانات قد لا تكون متاحة في أي مكان آخر.

عندما يأتي المستخدم إلى محرك البحث ويقوم بإجراء استعلام ، عادةً عن طريق إعطاء كلمات رئيسية ، يبحث المحرك عن الفهرس ويقدم قائمة بأفضل صفحات الويب المطابقة وفقًا لمعاييره ، عادةً مع ملخص قصير يحتوي على عنوان المستند وأحيانًا أجزاء من النص. تدعم معظم محركات البحث استخدام المصطلحات المنطقية AND و OR و NOT لزيادة تحديد استعلام البحث. ميزة متقدمة هي البحث عن قرب ، والتي تتيح لك تحديد المسافة بين الكلمات الرئيسية.

ماهي فائدة محركات البحث؟

تعتمد فائدة محرك البحث على مدى ملاءمة النتائج التي يقدمها. بينما قد يكون هناك ملايين من صفحات الويب التي تحتوي على كلمة أو عبارة معينة ، قد تكون بعض الصفحات أكثر صلة أو شعبية أو موثوقة من غيرها. تستخدم معظم محركات البحث طرقًا لترتيب النتائج لتقديم “أفضل” النتائج أولاً. تختلف الطريقة التي يقرر بها محرك البحث أفضل الصفحات المطابقة ، والترتيب الذي يجب أن تظهر به النتائج ، بشكل كبير من محرك إلى آخر. تتغير الأساليب أيضًا بمرور الوقت مع تغير استخدام الإنترنت وتطور التقنيات الجديدة.

معظم محركات البحث على شبكة الإنترنت عبارة عن مشاريع تجارية مدعومة بإيرادات الإعلانات ، ونتيجة لذلك ، يستخدم البعض الممارسة المثيرة للجدل المتمثلة في السماح للمعلنين بدفع الأموال للحصول على تصنيف أعلى في نتائج البحث.

يتم تشغيل الغالبية العظمى من محركات البحث بواسطة شركات خاصة باستخدام خوارزميات خاصة وقواعد بيانات مغلقة ، وأشهرها حاليًا Google و Bing و Yahoo! بحث. ومع ذلك ، فإن تقنية محرك البحث مفتوح المصدر موجودة بالفعل ، مثل ht: // Dig و Nutch و Senas و Egothor و OpenFTS و DataparkSearch وغيرها الكثير.

Comments are closed, but trackbacks and pingbacks are open.