Posted in عام

كيفية عمل محرك بحث


ازاي تعمل محرك بحث Search_Engine
#الجزء_الاول عبارة عن تشريح لمحرك بحث جوجل
#الجزء_الثاني انظمة الذكاء الصناعي المستخدمة ( يتبع )

تنوية : البوست دا مش هدفه ان حضرتك تروح تعمل محرك بحث وتقول انه افضل من جوجل
هدفه الاول والاخير اننا نفهم محركات البحث بتتعمل ازاي . يبقي عندك فكرة عن الحاجات المجهولة والمبهمة . يمكن يفتحلك فكرة جديده تقدر تعمل بيها حاجة

كالعادة هنقسم البوست لاكتر من جزء
1- ما يسمي بال Bot او ال spider او ال crawler
2- قاعدة بيانات محترمة
3- عملية ترتيب الظهور

لكن قبل تفصيل الكلام دا لازم نعرف حاجة مهمة بتوه عن ناس كتير .

انا مثالي النهارده جوجل هشرح عليه وهعمله عملية تشريح .
وانت بتبحث في Google  انت مش بتدور في ال ( web )
انت بتدور جوه Google الي عنده نسخة من اغلب المواقع جوه Database بتاعته
النسخة دي بياخدها عن طريق ال BoT
وعلشان كدا جوجل كل فترة بيعمل تحديث ل SERP او ما يسمي ب search engine result page
والنتائج بتتغير من فترة للتانيه .

الكلام دا ازي . بما ان كل نظام عمله الانسان هو عبارة عن محاكاة لشئ موجود .
1-  ال Bot هو عبارة عن برنامج بيدخل علي المواقع . ياخد كل ال content الموجود في الصفحة
بالاضافة ل Title و ال Keyword وال Description وكل ال Links . يضيف كل دا في الداتا بيز وبكدا يبقي عارف ان المحتوي الفلاني خاص بالموقع الفلاني
وبفرض انه لقي عدد 10 لينكات في الصفحة . يضيفهم برده في الداتا بيز بتاعته
بعد ما يخلص الصفحة دي . يبدأ يروح لل لينك الاول الي شافه . يدخل علي الصفحة يسحب المحتوي واللينكات الي فيه ويضف المحتوي للقاعدة بتاعته
وياخد كل اللينكات الي يلاقيها قدامه يحطها في الداتا بيز علشان يرجعلها بعد كدا
وبكدا هو عنده كل اللينكات بتاع الويب . وكل المحتوي بتاع الويب . وعارف المحتوي دا بتاع مين .
ال Bot دا لو انت مبرمج ممكن بسهوله جدا انك تعمل grabbing للمحتوي بتاع الموقع بشكل HTML وعن طريق ال regular expression تقدر تاخد الجزء الي انت محتاجه من الموق
تقدر تاخد مثلا الي جوه تاج

….

2- Database . في انواع كتير للداتا بيز . وعلي حسب كمية الداتا الي عندك بتبدأ تختار النوع الي هتتعامل معاه
لو مشروعك صغير او مشروعك كبير او مشروعك عملاق . في حالة جوجل . المشروع اكبر من العملاق . وعلشان كدا هم تقريبا عملو نظام قواعد بيانات خاص بيهم
هم بيجيبوا المحتوي ويعملوله archive and zip بطريقة معينة . وقت الحاجة بيعملوها فك للضغط دا
وتقريبا فيه اكتر من layer . اكتر من نوع قاعدة بيانات

3- عملية ال optimizing for result
ودي ممكن نعرف الحاجة ليها لو سالنا نفسنا سؤال مهم
ايه الي يخلي موقع يظهر قبل التاني في جوجل . لو تساووي في المحتوي
يعني موقع س . سرق من موقع ص المحتوي بتاعه . مين يظهر قبل مين
المشكلة دي حلوها بانهم عملوا شويه قواعد او factors بتساعد المواقع علي انها تظهر .
فاكرين في رقم 1 لما قلنا ان ال Bot بيجيب اللينكات ويضيفها في رقم 2 في قاعدة البيانات  . كل ما عدد المواقع الي بتتكلم عن لينك معين بتزيد . بتزيد اهمية الموقع دا
يعني كل ما عدد معين من اللينكات تضيف لينك . هو بيبقي حاسب كام موقع ضاف اللينك دا جواه
طبعا ال factors كتير ممكن تدور عليها براحتك وتفهم هم عملوها ليه

اخيرا الناس ياريت الناس المهتمة تدور علي ال SEO
وتشوف يعني ايه Black Hat SEO و White hat SEO وايه العوامل الي ادت لظهورها

 تنوية : كل المعلومات المذكورة اعلاه هي نتائج لتجارب عملية . الموضوع غير منقول . غير مترجم

#شير_في_الخير
#الطريق_الي_ايلات
#اعمل_الصح
#تشريحات_برمجية
#تشريحات_محركات_البحث

الكاتب:

مبرمج ومطور ويب مصري الجنسية - من مواليد محافظة المنيا

أضف تعليقاً

إملأ الحقول أدناه بالمعلومات المناسبة أو إضغط على إحدى الأيقونات لتسجيل الدخول:

WordPress.com Logo

أنت تعلق بإستخدام حساب WordPress.com. تسجيل خروج   / تغيير )

صورة تويتر

أنت تعلق بإستخدام حساب Twitter. تسجيل خروج   / تغيير )

Facebook photo

أنت تعلق بإستخدام حساب Facebook. تسجيل خروج   / تغيير )

Google+ photo

أنت تعلق بإستخدام حساب Google+. تسجيل خروج   / تغيير )

Connecting to %s