اپیزود ۱۴ – موتورهای جستجو چطور کار می‌کنند

خانه انجمن ها متن اپیزودهای اجرا شده اپیزود ۱۴ – موتورهای جستجو چطور کار می‌کنند

این جستار شامل 0 پاسخ ، و دارای 1 کاربر است ، و آخرین بار توسط هیأت تحریریه هیأت تحریریه در 1 سال، 2 ماه پیش بروز شده است.

  • نویسنده
    نوشته ها
  • #1756
    هیأت تحریریه
    هیأت تحریریه
    سرپرست کل

    [متن اپیزود]

    [لینک یوتیوب | لینک آپارات]

    موتورهای جستجو چطور کار میکنند؟

    یه زمانی وقتی برای ما سؤالی پیش میومد باید میرفتیم کتابخونهی محل و از در و همسایه سؤال میکردیم و بعد از مدتها تحقیق و تفحص بالاخره شاید میتونستیم جوابمون رو پیدا کنیم. اما این روزا موتورهای جستجویی مثل گوگل کارمونو خیلی راحت کردن. الآن دیگه میتونیم جواب سختترین سؤالامون رو توی کمتر از ۱ ثانیه پیدا کنیم. اما این موتورهای جستجو چطوری میتونن وقتی ازشون سؤالی رو میپرسیم همهی اینترنت رو بگردن و جواب ما رو لقمه شده برامون حاضر کنن؟

    خوب، بیاین یه سؤال ساده بپرسیم. سفر به مشتری چقدر طول میکشه؟

    این نتایج از کجا اومدن؟ و چرا این بالاتر از این یکیه؟

    بیاین ببینیم موتور جستجو چطور یه جستجو رو به نتیجه میرسونه. اولین چیزی که لازمه بدونیم اینه که وقتی یه جستجو انجام میشه، موتور جستجو همون موقع همهی سایتها رو برای پیدا کردن نتیجه نمیگرده چونکه تعداد وبسایتای موجود روی اینترنت خیلی خیلی زیاده و هر دقیقه صدها وبسایت به اینترنت اضافه میشن. پس اگه موتور جستجو قرار بود همچین کاری بکنه، هر جستجو یه قرن طول میکشید.

    به همین دلیل موتورای جستجو، اینترنت رو جلوجلو و به صورت دائم مورد بررسی قرار میدن تا اطلاعاتی که بعدن ممکنه ما ازشون بپرسیم رو حاضر اومده داشته باشن. پس اگه ما سرچ کنیم «سفر به مشتری»، موتور جستجو قبلا همهی نتایج رو روی سرورهاش به صورت ذخیره داره.

    اینترنت، مجموعهای از صفحات وب هست که با استفاده از لینکها به هم پیوند داده میشن. موتورای جستجو برنامهای دارن به نام عنکبوت که متن این صفحهها رو میخونه و اطلاعاتشون رو ذخیره میکنه و بعد از اتمام کار میره سراغ لینکهای روی صفحه و دونهدونه اونا رو هم باز میکنه و اطلاعاتشونو ذخیره میکنه. این کار بدون توقف ادامه داره تا جایی که همهی اینترنت رو پوشش بده. بنابراین اگر هیچکس به سایت شما لینک نداده باشه، احتمال این که موتور جستجو اصلن نفهمه سایت شما وجود داره زیاده. برنامهی عنکبوت، اطلاعات صفحات اینترنتی رو روی پایگاه دادهای که اسمش سرچ ایندکس یا مدخل جستجو هست ذخیره میکنه.

    حالا بیاین برگردیم به جستجوی اولیهی خودمون تا ببینیم موتور جستجو چطوری جواب سؤال ما رو پیدا میکنه. وقتی ما میپرسیم «سفر به مشتری چقدر طول میکشه»، موتور جستجو یه لیستی از همهی صفحاتی که شامل تک تک کلمات مورد جستجوی ما هستن تهیه میکنه. ممکنه میلیونها صفحه روی اینترنت وجود داشته باشه که حاوی کلمات جستجوشدهی شما باشه برای همین موتور جستجو مجبوره بهترین نتایج رو به ما نشون بده.

    هر موتور جستجو، الگوریتمها و الگوهای خاص خودش رو برای فهمیدن سؤال و پیدا کردن جوابهای واقعن مرتبط داره. جزئیات این الگوریتمها معمولن به دلیل رقابتی که بین شرکتهایی مثل گوگل و یاهو وجود داره سری هستن و هیچکس نمیدونه اونا دقیقن چطوری کار میکنن. اما تا جایی که میدونیم، همهی این الگوریتمها اول چک میکنن ببینن عبارتی که ما سرچ کردیم توی تیتر صفحه اومده یا نه و این که ترتیب کلمات توی تیتر صفحه آیا دقیقن به همون شکل که ما جستجو کردیم هست یا نه. کلمات کلیدی روی صفحات وب هم نقش زیادی روی اعتباری که موتور جستجو به اون صفحه میده دارن.

    مثلا گوگل بر اساس این که چند تا صفحهی دیگه روی اینترنت به یک صفحهی خاص لینک دادن، اون رو توی نتایج، بالاتر از بقیه قرار میده. پس هر چی بیشتر به یک صفحه لینک داده بشه، اهمیت اون صفحه برای گوگل بیشتر میشه. فلسفهی این کارم اینه که اگه سایتهای زیادی فکر کنن که محتوای یه صفحه بااهمیته، پس احتمال این که اون صفحه چیزی باشه که ما به دنبالش میگردیم بیشتر میشه. این الگوریتم که مختص گوگل هست، اسمش پیجرنک هست ولی نه به این دلیل که به صفحههای اینترنتی ربط داره بلکه به این دلیل که مخترع این الگوریتم، لری پیج یکی از بنیانگذاران گوگل بوده.

    خیلی از سایتها از طریق بازدیدکنندههاشون کسب درآمد میکنن، برای همین خیلیها سعی میکنن با کلک زدن به گوگل سایتشون رو همیشه توی نتایج جستجو بالاتر از بقیه نمایش بدن. برای همین موتورای جستجو هرازگاهی الگوریتمهاشون رو طوری بروز میکنن که صفحات جعلی و حقهباز از نتایج جستجو حذف بشن یا به جایی برگردن که بهش تعلق دارن. در عوض خود گوگل به عنوان حقهبازترین، از ملت پول میگیره تا سایتشون رو بالای صفحه نشون بده. اما در نهایت این وظیفهی خود ما هست که بدونیم روی چی باید کلیک کنیم و چه سایتهایی برای ما منبع معتبر محسوب میشن.

    این روزا موتورای جستجو قویترین نرمافزارهای هوش مصنوعی رو دارن و حتی از اطلاعاتی که ما اصلن در اختیارشون قرار ندادیم استفاده میکنن مثل موقعیت جغرافیایی ما، سن ما، سیستم کامپیوتر ما و چیزای دیگه.

    یا مثلا موتورای جستجو باید معنی چیزی رو که ما ازشون میپرسیم دقیق بدونن. توی مثال ما، گوگل میدونه که مشتریای که ما دنبالش میگردیم احتمالا یه سیارهس و منظور ما مشتری خریدار نبوده و این کار رو از طریق استفاده از هوش مصنوعی انجام میده.

    گوگل هیچوقت به صورت دقیق تعداد سرورهاش و حتی موقعیت جغرافیایی دقیق دیتاسنترهاش رو به عموم اعلام نمیکنه اما بعضیا تخمین میزنن که گوگل حداقل نهصد هزار تا سرور توی جاهای مختلف دنیا داره.

    فقط یکی از انواع سرورهای گوگلوبسرورهاشبرای هر جستجویی که ما انجام میدیم این کارا رو انجام میده:

    ۱. عبارت جستجو شده رو میگیره و به گوگل میفرسته،

    ۲. نتایج رو بررسی میکنه و رنک یا جایگاه هر صفحه روی صفحهی نتایج رو تعیین میکنه،

    ۳. بررسی میکنه که ما روی کدوم لینک کلیک کردیم و اونو ذخیره میکنه،

    ۴. پیشنهادهای املایی رو از سرور ملانقطی گوگل دریافت میکنه،

    ۵. و در نهایت یه لیست از تبلیغات مرتبط رو از سرور حاوی تبلیغات گوگل دریافت میکنه و نمایش میده.

    استفاده از موتورای جستجو هر روز کلی از کارای ما رو جلو میندازه اما خطراتی هم داره از جمله این که اطلاعات روی اینترنت همیشه موثق نیستن و احتمالن این که نتایج جستجوی ما خیلی دقیق نباشه زیاده. دیگه این که اگه عادت کنیم هر چیزی رو از گوگل بپرسیم، کمکم دیگه یادمون میره خودمون چطوری باید فکر کنیم و به نتیجه برسیم. پس میشه به گوگل به چشم یه ابزار مفید نگاه کرد به شرطی این که بدونیم چطوری و کی باید ازش استفاده کنیم.

    اگه از این ویدیو خوشتون اومده، اونو با دوستاتون به اشتراک بذارین. مرسی از منبع عظیم انرژیتون و این که اونو به اشتراک میذارین.

شما برای پاسخ به این جستار باید وارد تارنما شوید.