صفحه اصلی     /  ليست مقالات کامپيوتر     /    عضویت

کد مقاله:871520 پسوند مقاله:/مقاله رايگان موضوع مقاله: پروژه گوگل
مبلغ اعضاء طلایی: 0ریال مبلغ اعضاء نقره ای:0ریال مبلغ اعضاء آبی:0ریال

پروژه گوگل

The Anatomy of a Large-Scale Hypertextual Web Search Engine

در اين صحفه، با گوگل کنوني با نمونه اوليه از يک ماشين جستجوگر بزرگ شاخص مي باشد که اين يک ساختار بزرگ مي سازد که در متن ترکيبي کنوني به کار برده مي شود.

گوگل  يک طرح  براي عمل  و فهرست نمودن وب به طور مؤثر ارائه دادن نتيجه متقاعد کننده بيشتر جستجو نسبت به سيستم هاي موجود مي باشد.

نمونه اوليه همراه با متن تمام و پيوند دادن 24 ميليون صفحه مي باشد پايگاه داده قابل دسترسي در http:\\google\standford.edu مي باشد.

مهندس ماشين جستجو يک تکليف چالش انگيز مي باشد.

ماشين جستجو  ده ها و صد ها و ميليون ها صفحه هاي وب نظير تعدادي از دوره هاي مشخص و مجهز و واضح را فهرست مي کند.

آنها هر روز به ده ها ، ميليون ها از جستجو ها پاسخ مي دهند.

با اينکه اهميت اعتبار ماشين جستجوي بزرگ شاخص در وب تحقيقات علمي خيلي کوچکتري درباره آنها بوده است.

از اين گذشته ناشي از پيشرفت سريع تکنولوژي و ازدياد تکثير وب مي باشد. ايجاد شدن ماشين جستجوي وب امروزي که خيلي متفاوت از 3 سال گذشته است.

اين صحفه توصيفاتي از ماشين جستجو را آماده مي کند. وب مان – اول اين قبيل توصيفات پر جزئيات عمومي که بنا بر زمان مي دانيم.

بخش يک مسأله از يک مقياس گذاري استاندارد فنون جستجو بنابر عناصر داده ها بوسيله اين مقدار ، اينجا وجود دارد. چالش تخصصي جديد گرفتار شدني همراه با بکارگيري اطلاعات اضافي کنوني مافوق متن براي ارائه دادن بهترنتيجه جستجو مي باشد.

در اين صفحه آدرس ها اين سؤالات درباره اينکه سيستم بزرگ واقعي کارآزموده که مي تواند از اطلاعات اضافي کنوني در مافوق متن بهره برداري کرد چطور ساخته مي شود.

همچنين ما نگاه مي کنيم به مسأله اي در باره اينکه چطور مقداري به طور مؤثر همراه با جمع آوري مافوق متن کنترل نشدني در جايي که هر کس هر چيزي را که آنها مي خواهند مي تواند چاپ کند.

کليد واژه: شبکه جهاني اطلاعات ، ماشين هاي جستجو ، بازيابي اطلاعات ، رده بندي صفحه.

  1.Introduction

وب چالش جديدي براي بازيابي اطلاعات بوجود مي آورد.

مقداري از اطلاعات درون وب سريع رشد مي کنند به طوريکه بهتر از کاربرهاي جديد با تجربه در هنر جستجوي وب مي باشند.

مردم محتمل هستند براي به کارگيري وب عملي که آن رسم لينک مي باشد. اغلب با نگهداري کردن بالاي انساني ، با بريدن به قطعات کوچک همانند ياهو يا همراه با ماشين هاي جستجو گر مي باشد.

ليست گرفتن سرپوش عمومي پشتيباني انساني مبحث مؤثري مي باشد اما فاعلي هستند و البته گران براي ساخته شدن و نگهداري کردن آسان براي اصلاح کردن . و نمي توان همه مبحث هاي محرمانه را پوشش داد.

ماشين هاي جستجوي خودکار براي آنکه به همسان سازي کليد واژه اعتماد کنند معمولاً به همتا هاي کيفيت پايين خيلي مراجعه مي کنند.

براي درست کردن ماده بد تر، تعدادي اعلان کنندگان به خاطر سود بردن مردم کوشش مي کنند بوسيله اندازه گرفتن متوسط براي به اشتباه انداختن ماشين هاي جستجوگر خودکار.

ما ساختمان يک ماشين جستجوي بزرگ را داريم که داراي آدرس بسياري از مسأله هاي موجود سيستم است.

آن بويژه استفاده زياد از ساختار هاي اضافي کنوني در مافوق متن براي فراهم آوردن کيفيت بالاي نتيجه جستجو را بوجود مي آورد.

ما اسم سيستم مان را گوگل انتخاب مي کنيم زيرا آن يک هجي عمومي از googol مي باشد و خوبي اول هدفمان ساختمان بسيار بزرگ ماشين هاي جستجو گر مي باشد.

تکنولوژي ماشين جستجو بايد مقياس گذاري چشمگيري خوب نگه داشتن همراه با پيشرفت و رشد در جهت وب را داشته باشد.

در سال 1994 يکي از ماشين هاي جستجوي صفحه وب، شبکه ارتباطي جهاني چند بازارياب( wwww ) داراي فهرستي از 110000 صفحه وب و اسناد وب قابل دسترسي داشت.

به طوريکه در نوامبر 1997 ماشين هاي جستجوي بالا ادعا مي کردند فهرستي از 2 ميليون تا 100 ميليون اسناد وب را دارا مي باشند.

آن در سال 2000 قابل پيش بيني بود که مي تواند فهرست وسيعي از وب را که داراي بيش از يک ميليارد اسناد را داشته باشد را دارا باشد.

...   

<<<بیشتر مقالات سایت که اعضا به آن دستیابی پیدا می کنند با ذکر منبع می باشند.>>>

 

دان لود کامل

   توجه: برای دریافت رمز مقالات باید به عضویت دهکده خاله فر درآمده باشید.