Главная              Рефераты - Информатика

Основи реєстрації інтернет ресурсів в пошукових системах та каталогах - реферат

План

1. Пошукові системи, каталоги та принцип їх роботи

2. Як додати свій сайт до пошукової системи чи у каталог?

Використана література


1. Пошукові системи, каталоги та принцип їх роботи

Пошукові системи використовують для індексування сайтів так званих "пошукових роботів", спайдеров (від англійського слова "spider", що значить "павук"). Робот - це невелика програма, що ходить по посиланнях на сайті й індексує (збирає і запам'ятовує) інформацію, що зустрів на шляху.

Принцип роботи пошукових роботів приблизно наступний: ви надаєте пошуковій системі точну адресу сторінки, яку потрібно зареєструвати. Пошукова система перевіряє, чи існує по цій адресі сторінка, і якщо так, то сторінка вноситься в "графік відвідування". Між часом, коли ви зареєстрували сторінку в пошуковій системі та часом, коли вашу сторінку відвідає пошуковий робот може пройти від декількох хвилин до декількох тижнів.

Коли приходить "година Х", на вашу сторінку посилається пошуковий робот. Як правило, схема роботи робота наступна:

1) робот шукає файл robots.txt,

2) робот читає сторінку, для індексування якої він був посланий (глибина індексування, тобто читання сторінки міняється від робота до робота. Деякі зупиняються тільки на читанні заголовка сторінки і вмісту мета-тегів, інші можуть прочитати, скажемо перші 6000 символів на сторінці, а деякі індексують весь зміст веб-сторінки),

3) потім робот може або видалитися або продовжити індексування сайта,

4) через якийсь час робот знову може відвідати цю сторінку, якщо існує тег "revisit" чи відповідно до політики, яка проводиться пошуковою системою.

Відмінність каталогів від пошукових систем полягає в тому, що каталоги не посилають ніяких роботів, щоб індексувати вашу чи сторінку веб-сайту. Найбільш відомим каталогом є Yahoo.com.

Для реєстрації в каталозі вам необхідно знайти розділ, у який ви хочете помістити свою сторінку, надіслати короткий опис сайта і список ключових слів для пошуку вашої сторінки в каталозі. Потім ця інформація проглядається й оцінюється людьми, що вирішують, чи варто включати вашу інформацію в каталог чи ні.

Варто знати, що вам можуть відмовити в реєстрації, ваш сайт можуть помістити в інший розділ, можуть бути змінені опис сайта і/чи список його ключових слів. Усе залежить від модераторів.

Якщо реєстрація виробляється людиною, а не програмою, то пошук по каталогах дає більш релевантні результати, ніж пошук по пошукових системах. Корінною відмінністю каталогів від розвідувачів також є те, що пошук у них відбувається не по текстовій складовій усіх сторінок сайта, а тільки по короткому опису сервера й обраним при реєстрації ключовим словам.

Пошукові системи одержують різні результати, ґрунтуючись на тих самих вихідних даних. Усе залежить від алгоритмів обробки цих даних, закладених творцями пошукових систем.

Одні системи приділяють більшу увагу "індексу цитування", інші наявності всіх мета-тегів, треті взагалі не приділяють уваги мета-тегам. Rambler, наприклад, цілком ігнорує зміст мета-тегов (крім мета-тега robots). Якщо ви подивитеся на рейтинг вашого сайта в різних пошукових системах, він скрізь виявиться різним.

Тому й існують так називані вхідні сторінки, оптимізовані під роботу окремих пошукових систем.

Як правило, пошукові системи тримають у секреті точні рецепти, своїх алгоритмів ранжирування, відповідно до яких формуються їхні рейтинги. Цим переслідуються дві мети: захист від конкурентів і захист від спрямованого спама.

Крім того, пошукові системи відрізняються обсягом проіндексованих сторінок і періодом відновлення свого індексу.

В даний час пошукові обсяг індексації пошукових систем оцінюється по двох параметрах: по кількості веб-сторінок, що пошукові системи відвідали для створення своєї бази даних і кількості веб-сторінок, проіндексованих у базі даних.

AltaVista, наприклад, стверджує, що її база даних нараховує 250 млн. сторінок, а кількість відвідувань для індексації сторінок склало 400 млн. У пошукової системи FAST цей показник складає 400 млн. проти 700 млн., Excite - 250/920 млн., Inktomi - 110 млн./1 млрд.

Крім того, пошукові системи розрізняються періодом відновлення свого індексу, тобто часом, за який відбувається повне відновлення бази даних пошукової системи. Чим коротше цей період, тим більше релевантні результати ви будете одержувати на свій запит і меншу кількість "мертвих посилань". Саме тому ваш рейтинг в одній і тій же пошуковій системі може змінюватися: чи з'являються або зникають якісь сайти, уводяться зміни в алгоритм роботи пошукових систем, міняється структура інформації на вашому сайті. Період відновлення індексу генератора в трьох основних російськомовних пошукових машин - Яndех, Rambler і "Апорт" - тиждень. Тому, зареєструвавши свій ресурс у пошуковій машині, не варто відразу ж шукати посилання на нього в результатах пошуку - він стане доступним тільки тоді, коли буде обновлена база даних пошукової системи.

Другий показник дуже важливий для правильної оцінки "індексу цитування", тому що чим більше число веб-сторінок відвідав пошуковий робот, тим більшу кількість перехресних посилань він проіндексував.

2. Як додати свій сайт до пошукової системи чи у каталог?

Нижче приведено список найпопулярніших сайтів та addurl до них:


Зареєструвати сайт в Яндекс - найпоширеніша система пошуку інформації в мережі Інтернет у Росії. Адурілка яндекса знаходиться за цією адресою: http://webmaster.yandex.ru/

Зазвичай, сайти з унікальним контентом потрапляють в індекс досить швидко, за 1-2 апа (4-7 днів). Іноді ж доводиться чекати додавання сайту в індекс досить довго (від 1 місяця і довше). Ви також можете розмістити посилання на ваш сайт на якому-небудь іншому ресурсі (каталозі сайтів, дошці оголошень, форумі тощо), при цьому, час попадання сайту в індекс істотно скорочується.

Google - головний пошуковик у світі. Складно знайти людину, що використовує інші пошукові системи і не знає про гугл. Адурілка Google розташовано за такою адресою: http://www.google.com/addurl/

При додаванні сайту в форму жоден з пошукачів не дає гарантій, що сайт відразу ж опиниться в їх індексі. Буває, як і у випадку з Яндексом, доводиться чекати досить велику кількість часу. Однак, плюс Google тому в, що ви можете свій сайт додати дуже швидко в їх індекс, розмістивши посилання на нього на якому-небудь трастовому сайті або популярному форумі, куди пошуковий робот заходить досить часто.

Рамблер є також популярним пошукачем в Рунеті. Адурілка Рамблера: http://www.rambler.ru/doc/add_site_form.shtml

Ваш сайт може бути зареєстрований за допомогою спеціальної форми, якщо він знаходиться на території (у національних доменах) Росії і країн СНД. Переіндексування отриманих документів здійснюється з інтервалом приблизно в два тижні.

Мета - популярний український пошуковик. Щоб додати свого ресурсу до Реєстру українських сайтів необхідно зареєструватися або увійти під своїм логіном на МетаПаспорті. Адурілка Мети: http://meta.ua/webmaster/addurl.asp

На сайті також є розділ "На допомогу вебмайстеру", який дозволяє подати заявку на зміну опису сайту в реєстрі українських сайтів, користуватися професійної інтернет-статистикою, брати участь в рейтингу Мети.

Апорт - Російська пошукова система. Апорт є частиною порталу РОЛ і належить Golden Telecom. При пошуку враховуються особливості російської мови. Адурілка Апорту: http://catalog.aport.ru/rus/add/AddUrl.aspx

Після додавання сайту система говорить, що сайт потрапить в індекс протягом двох тижнів. Якщо ви захочете також розмістити свій сайт в каталозі Апорту, тоді на другому кроці необхідно заповнити ще одну форму з описом ресурсу.

Yahoo! - Пошук інформації в російському і світовому інтернеті. Друга за популярністю і одна з перших пошукових систем у світі. Адурілка Яху: http://siteexplorer.search.yahoo.com/submit

Для додавання сайту вам потрібно мати Yahoo! ID і бути залогіненим. Часто яху сам знаходить сайти і додає їх до свого індекс, як і Google. Проте, в деяких випадках, форма сабміта сайту може виявитися корисною.

Якщо сайт буде додано до індексу Yahoo, тоді він автоматично додасться і в пошукову систему AltaVista, також має світову популярність.

MSN (Microsoft Network пошук, а також Live.com) - популярний зарубіжний пошуковик від компанії Майкрософт. Адурілка МСН: http://search.msn.com/docs/submit.aspx

Цей пошуковик також не вимагає додавання сайту в індекс, так як воно найчастіше відбувається автоматично, при знаходженні посилань на ваш ресурс. Однак, при тривалій відсутності сайту в MSN, можна скористатися його адурілкой. Після реєстрації чекайте бота MSNBot, який буде шукати у вас сторінки, що відповідають прийнятим стандартам.

GoGo.ru - пошукова система нового покоління від Mail.ru. Додати свій сайт в пошуковик GoGo можна за адресою: http://gogo.ru/addsite.html

Достатньо вказати адресу головної сторінки, інші розділи будуть знайдені по посиланнях. GoGo не дають будь-яких гарантій про включення сайту в базу, мабуть сайти проходять легку модерацію. Для зростання відвідуваності співробітники GoGo рекомендують регулярно відправляти XML-файл з інформацією про оновлення в індексну базу GoGo.Ru.


I. UA - Український портал. Додавання сайту в пошук здійснюється за допомогою реєстрації його в каталозі порталу i.ua за наступною адресою: http://catalog.i.ua/site/add/

Також для додавання сайту в каталог вам необхідно вибрати відповідну тематиці сайту категорію другого рівня і вище, а потім натиснути на посилання "Додати сайт". В каталог можна додавати різні сторінки сайту, якщо вони мають різну категорію. Для використання цієї можливості, необхідно мати аккаунт на i.ua.

У Google та Яндекс є розділ пошуку по блогах. Якщо ваш сайт являє собою блог, на якому присутня можливість підписки по RSS, тоді використовуйте форми додавання сайту в сервісах ППБ: http://blogsearch.google.com/ping для Google та http://www.blogs.yandex.ru/add.xml для Яндекс.


Використана література

1. Пошук інформації в Інтернет. – Київ., 2001.

2. Інформаційно-пошукові системи світу. – Львів, 1999.

3.http://oog4.org.ua/nash-blog/80-adurilka-reestratsija-sajtu-v-poshukovih-sistemah

4.http://www.jobconsult.by/siteownstrength/34/174-04.html