Лекция: Работа с поисковыми системами и каталогами. Лингвистический и тематический поиск.
Для поиска информации используются специальные поисковые серверы, которые содержат более или менее полную и постоянно обновляемую информацию о Web-страницах, файлах и других документах, хранящихся на десятках миллионов серверов Интернета.
Различные поисковые сервера могут использовать различные механизмы поиска, хранения и предоставления пользователю информации. Поисковые серверы Интернета можно разделить на две группы:
v поисковые системы общего назначения;
v специализированные поисковые системы.
Современные поисковые системы часто являются информационными порталами, которые предоставляют пользователям не только возможности поиска документов в Интернете, но и доступ к другим информационным ресурсам (новостям, информации о погоде, о валютном курсе, интерактивным географическим картам и так далее).
Всеязычные:
v Google (34,4 % Русскоязычного сегмента [5])
v Bing (0,9 % Русскоязычного сегмента)
v Yahoo! (0,2 % Рунета) и принадлежащие этой компании поисковые машины:
v Inktomi
v AltaVista
v Alltheweb
v Англоязычные и международные:
v AskJeeves (механизм Teoma)
Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.
v Яндекс (46,3 % Рунета)
v Mail.ru (8,9 % Рунета)
v Rambler (3,3 % Рунета)
v Nigma (0,5 % Рунета)
v Генон (0,1 % Рунета)
v Gogo.ru (<0,1 % Рунета)
v Aport (<0,1 % Рунета)
Из перечисленных поисковых систем не все имеют собственный поисковый алгоритм — так QIP.ru используют поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.