وقتی جستجویی در موتور جستجو انجام و نتایج جستجو ارائه می شود ، کاربران در واقع نتیجه کار قسمت های مختلف موتور جستجو را می بینند . موتور جستجو قبلا پایگاه داده اش را آماده کرده است و اینطور نیست که درست در همان لحظه جستجو، تمام وب را بگردد . بسیاری از خود می پرسند که چگونه امکان دارد گوگل در کمتر از یک ثانیه تمام وب را بگردد و میلیون ها صفحه را در نتایج خود ارائه دهد ؟
نه گوگل و نه هیچ موتور جستجوی دیگری توانایی انجام این کار را ندارند . همه آنها در زمان پاسخ گویی به کاربران تنها در پایگاه داده ای که در اختیار دارند به جستجو می پردازند و نه در وب !
موتور جستجوگر به کمک بخش های مختلف خود ، اطلاعات مورد نیاز را قبلا جمع آوری کرده و تجزیه و تحلیل می کند و آن را در پایگاه داده اش ذخیره می کند و به هنگام جستجوی کاربر تنها در همین پایگاه داده می گردد.
بخش های مختلف یک موتور جستجو عبارتند از :
عنکبوت
خزنده
بایگانی کننده
پایگاه داده
سیستم رتبه بندی
االف) عنکبوت
نرم افزاری است که کار جمع آوری اطلاعات مورد نیاز یک موتور جستجو را بر عهده دارد . به صفحات مختلف سر می زند ، محتوای آنها را می خواند ، اطلاعات مورد نیاز را جمع آوری می کند و آن را در اختیار سایر بخش های موتور جستجو قرار می دهد .
کار این نرم افزار بسیار شبیه کار کاربران در وب است . همانطور که کاربران صفحات مختلف را بازدید می کنند ، عنکبوت نیز همین کار را انجام می دهد با این تفاوت که این نرم افزار کدهای صفحات را می بیند اما کاربران نتیجه حاصل از کنار هم قرار گرفتن این کدها را.
ب) خزنده
نرم افزاری است که به عنوان یک فرمانده برای عنکبوت عمل می کند . مشخص می کند که عنکبوت کدام صفحات را مورد بازدید قرار دهد . در واقع خزنده تصمیم می گیرد که کدامیک از لینک های صفحه ای که عنکبوت در حال حاضر در آن قرار دارد دنبال شود . ممکن است همه آنها را دنبال کند ، بعضی را دنبال کند یا هیچ کدام را دنبال نکند .
این نرم افزار ممکن است قبلا برنامه ریزی شده باشد که آدرس های خاصی را طبق برنامه ، در اختیار عنکبوت قرار دهد تا از آنها دیدن کند . دنبال کردن لینک های یک صفحه به این بستگی دارد که موتور جستجوگر چه حجمی از اطلاعات یک سایت را می تواند در پایگاه داده اش ذخیره کند و همچنین ممکن است اجازه دسترسی به بعضی از صفحات به موتورهای جستجوگر داده نشده باشد .
ج) بایگانی کننده
تمام اطلاعات جمع آوری شده توسط عنکبوت در اختیار این نرم افزار قرار می گیرد . در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار می گیرند و به بخش های متفاوتی تقسیم می شوند . تجزیه و تحلیل بدین معنی است که مشخص می شود که اطلاعات از کدام صفحه ارسال شده است ، چه حجمی دارد ، کلمات موجود در آن کدام است ، کلمات چندبار تکرار شده است ، کلمات در کجای صفحه قرار دارند و...
در حقیقت بایگانی کننده صفحه را به پارامتر های آن خرد می کند و تمام این پارامترها را به مقیاس عددی تبدیل می کند تا سیستم رتبه بندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند .
د) پایگاه داده
تمام داده های تجزیه و تحلیل شده در بایگانی کننده به پایگاه داده ارسال می شود . در این بخش داده ها گروه بندی ، کدگذاری و ذخیره می شوند . همچنین داده ها قبل از اینکه ذخیره شوند ، طبق تکنیک های خاصی فشرده می شوند تا حجم کمی از پایگاه داده را اشغال کنند .
یک موتور جستجوگر باید پایگاه داده عظیمی داشته باشد و به طور مداوم حجم محتوای آن را گسترش دهد و البته اطلاعات قدیمی را نیز بروز رسانی کند . بزرگی و به روز بودن پایگاه داده برای یک موتور جستجو امتیاز بزرگی محسوب می شود .
ه) سیستم رتبه بندی
بعد از آنکه تمام مراحل قبل انجام شد ، موتور جستجوگر آماده پاسخ گویی به سوالات کاربران است . کاربران چند کلمه را در جعبه جستجوی آن وارد می کنند و سپس با فشردن کلید تایید منتظر پاسخ می مانند .
برای پاسخ گویی به درخواست کاربر ، ابتدا تمام صفحات موجود در پایگاه داده که به موضوع جستجو شده مرتبط هستند ، مشخص می شوند . پس از آن سیستم رتبه بندی وارد عمل شده ، آنها را از بیشترین ارتباط تا کمترین ارتباط مرتب کرده و به عنوان نتایج جستجو به کاربر نمایش می دهد .
حتی اگر موتور جستجوگر بهترین و کامل ترین پایگاه داده را داشته باشد اما نتواند پاسخ های مرتبطی را ارائه کند، یک موتور جستجوی ضعیف خواهد بود . در حقیقت سیستم رتبه بندی ، قلب تپنده یک موتور جستجوگر محسوب می شود و تفاوت اصلی موتورهای جستجوگر در این بخش قرار دارد .
نظرات شما عزیزان: