كيف تعمل محركات البحث؟ [محركات بحث]

Posted in Uncategorized on Jun 20, 2009

search-engine

ضمن فعاليات أسبوع الكتابة عن محركات البحث ومايتعلق بها، رأيت أنه من الأفضل البدء بتسلسل معلومات من السهل إلى الصعب، بحيث تغطي جوانب الكتابة عن هذا الموضوع جميع مستخدمي الانترنت من المبتدئين إلى المحترفين.
لذا سأبدأ بالحديث عن أساسيات محركات البحث وكيف تعمل.

ما هي محركات البحث؟

هي عبارة عن مواقع مهمتها الأساسية هي البحث في شبكة الانترنت عن كلمة أو عبارة أو جملة يدخلها زائر محرك البحث، اليوم تملك محركات البحث مثل غوغل وياهو وغيرها الكثير من الميزات الأخرى مثل الطقس وتحويل العملات وخدمات الترجمة … الخ.

تسمى العبارة التي بحث عنها الزائر بالكلمات المفتاحية أو Keywords، وهي كلمات مهمة جداً للدلالة على وضوع معين.

يقوم محرك البحث بعد أن يبحث عن العبارة بعرض ما يسمى نتائج البحث، وهي عادة تكون على شكل عنوان رئيسي مع مقطع قصير من الصفحة مع وضع رابط للصفحة التي تحوي العبارة.
لكن هل تساءلت مرة كيف يمكن لمحرك البحث أن يبحث في مليارات الصفحات على الانترنت، ويعرض مئات الملايين من النتائج خلال أجزاء من الثانية؟
هل يعقل وجود هكذا تقنية في العالم؟
هل يقوم بها سوبر كمبيوتر؟ (كما في الأفلام الأجنبية)

لا بد أن في الأمر سراً!

كيف تعمل محركات البحث؟

لنفترض أن أحدنا يهوى جمع معلومات عن الكتب، فقرر بناء موقع يضع فيه تصنيفات لهذه الكتب، فأخذ يبحث على الانترنت عن كتب ومن ثم يحضر رابط صفحة الكتاب ويضعه ضمن تصنيفات خاصة. مثلاً وجد كتاب الأجنحة المتكسرة لجبران خليل جبران فقام بوضع الكتب ضمن تصنيف الكاتب جبران، وضمن تصنيف الكتب الأدبية، وضمن الروايات، و ضمن قصص الحب.

فيكون بذلك أسّس ما يسمى بالأرشيف، ومن ثم قام ببناء مربع يبحث في هذا الأرشيف، فيأتي الزائر ليبحث عن اسم جبران لتظهر له جميع الكتب التي تحوي التصنيف جبران، أو قصص الحب ليظهر له جميع قصص الحب، وبهذا يعثر الزائر على طلبه.

لكن هذا الشخص مهما كان أداؤه قوياً فإن له طاقة معينة، وبهذا سيقوم يومياً بأرشفة أربع أو خمس كتب على أكثر تقدير، إذاً ما العمل؟ هل يقوم هذا الشخص بتوظيف عدة موظفين يأرشفون معه؟ لكن هذا الموضوع مكلف جداً خاصة عند الأخذ بعين الاعتبار أن للموظفين طاقة أيضاً.

الحل هو ببساطة باستخدام روبوت يقوم بالعمل، وعندما نقول روبوت لا نعني بذلك رجلاً آلياً، وإنما نتحدث عن روبوتات محركات البحث التي هي عبارة عن برامج كمبيوتر سنأتي للتفصيل عنها لاحقاً.

وبهذا يتطور عدد الصفحات المؤرشفة يومياً بشكل هائل.

الفكرة السابقة هي فكرة عمل مجركات البحث ببساطة شديدة، تقوم الروبوتات أو السبايدرات (العناكب) بالتجول في صفحات شبكة الانترنت، ومن ثم تحضر ملخصات عنها (تحوي الكلمات المفتاحية) مع روابطها لتضعها في أرشيف محرك البحث. وعندما يقوم زائر محرك البحث بالبحث عن عبارة معينة فإن النتائج الظاهرة هي النتائج الموجودة في أرشيف محرك البحث.

في الصورة التالية يشرح موقع (كيف تعمل الأشياء) ببساطة طريقة العمل:

يقوم العنكبوت بالمرور بكافة صفحات الموقع، ومن ثم يبني قائمة بالكلمات المفتاحية الموجودة في كل صفحة، ومن ثم يضغط المعلومات لتحتل أقل قدر ممكن من الذاكرة، ويخزنها في مساحات التخزين الخاصة بالأرشيف.

لأخذ العلم: كانت العناكب في ما سبق تقرأ البرمجة التي تظهر الصفحة للزائر، لذا كان من السهل خداعها، أما الآن فقد قامت محركات البحث وخاصة غوغل بإضافة ذكاء خارق لعناكبها، فالعنكبوت يدخل لصفحة الموقع كما لو أنه زائر عادي، ويقوم بالإطلاع أولاً على عنوان الصفحة ومن ثم يلتفت إلى الكلمات المكتوبة بخطوط كبيرة وعريضة أو ملونة لوناً يختلف عن باقي الكلمات، ويفترض بذلك أن هذه الكلمات ذات أهمية عالية، فيقوم بتصنيفها على أنها كلمات مفتاحية للصفحة.

بهذا أنهي القسم الأول من هذا البحث وأتابع في ما بعد يإذن الله.

5 Comments

  1. Jun 20, 2009

    موضوع شيق حسام.. درست في الجامعة مادة كاملة عن (استرجاع المعلومات – Information Retrieval ) وكانت تحوي الكثير من المعلومات الجديدة بالنسبة لي.

    لم أفهم قصدك بعبارة ” كانت العناكب في ما سبق تقرأ البرمجة التي تظهر الصفحة للزائر،”

    متابعة للموضوع

    • Jun 20, 2009

      قصدت بذلك أن العناكب كانت تقرأ ما يسمى الشيفرة المصدرية، وهي برنامج الصفحة الذي لا يظهر لزائر الموقع إلا في حال توجه إلى القائمة “view” أو “عرض” وانتقى منها الأمر “Source” أو “الشيفرة المصدرية”.
      هذا البرنامج “برمجة الصفحة” يقوم بتكوين الصفحة أمام الزائر.
      كان أصحاب المواقع يعمدون إلى تمرير سطور برمجية خفية (لا تظهر للزائر) تقوم بخداع العناكب.

  2. Jun 20, 2009

    هناك الكثير من محركات البحث العربية وأشباهها ذكرت 21 موقع منها فقط هنا :
    http://ahmadmg.wordpress.com/2009/02/21/arabic-search-engine-on-the-internet/
    لكن لماذا نحن كعرب لا نستخدمها وهذا ما ذكرته هنا :
    http://www.tech-wd.com/wd/2009/03/05/why-not-using-arabic-search-engine/
    أسف على كثرة الروابط لكنني أعتقد سوف تغنيني عن الكثير من الكلام .

    • Jun 21, 2009

      شكراً لك لدعمك الموضوع

  3. Jan 1, 2010

    شكرا لك على تلك التوضيحات الرائعة وننتظر المزيد

Leave a Reply

لن يتم نشر البريد الإلكتروني . Required fields are marked *