30/07/2010

  /в начало
интернет-карты
настройка
FAQ
справка
путеводитель
форум
НАШИМ АБОНЕНТАМ
  МЕНЮ   СПРАВОЧНАЯ ИНФОРМАЦИЯ




Поиск в Интернет

Первый вопрос, который возникает у начинающего пользователя Интернета: "Как найти необходимую информацию в Интернете?" Прежде всего отметим, что нет правильных или неправильных путей поиска в Интернете. Несомненно, одни из них могут потребовать большего времени, чем другие, но в конечном счете предпочтение должно отдаваться тому методу, который кажется наиболее удобным и плодотоворным с точки зрения пользователя Интернета.

Можно выделить два основных способа поиска информации:
  • по ключевому слову (к примеру "рыбалка") или фразе ("рассказы о рыбалке"), которые вводятся в так называемую поисковую машину, и она проводит поиск информации в Интернете, содержащей указанное слово или фразу
  • в предметных каталогах поисковой машины, например в разделе "Развлечения и отдых"
Поиск по ключевому слову

Несмотря на бытующее предубеждение относительно сложности работы в Интернете, начинающего пользователя обычно приятно удивляет чрезвычайная простота поиска нужной информации в Интернете, который обычно осуществляется с помощью так называемых поисковых машин. Наиболее популярны в российском Интернете поисковые машины Яndex, Апорт! и Рамблер.

Такой удивительно удобный способ поиска информации в Интернете стал возможен благодаря разработке компьютерных программ, под общим названием "рoботы". Задача такой программы состоит в том, чтобы регулярно собирать в Интернете информацию о сайтах и помещать ее в свою базу данных, с которой и работает пользователь, когда обращается к услугам поисковой машины. Когда пользователь Интернета вводит в поисковую машину ключевое слово, то из базы данных сформированной Роботом, ему представляется перечень сайтов, в которых имеется ключевое слово.

В настоящее время в Интернете представлено несколько десятков популярных роботов. Но, к сожалению, их обилие создает определенные проблемы для пользователя, поскольку принцип работы каждого из роботов уникален и поэтому одно и то же ключевое слово, введенное в разные поисковые машины (Rambler или Yandex), базы данных которых сформированны разными роботами, дает различный перечень сайтов, как по порядку их представления, так и по охвату.

Можно выделить две основные причины таких отличий в работе роботов:
  • одни из них собирают все, что они в состоянии найти в Сети по заданной теме, а другие выбирают из сайтов только определенные страницы по заданной теме
  • одни из них успешно идентифицируют такие сложные объекты для поиска как рисунки карт, фреймовые ссылки и страницы, доступ к которым возможен только с паролем, а другие роботы такими возможностями не обладают.
Следует также отметить, что независимо от того, как велика база данных в поисковой Машине, она не в состоянии индексировать (то есть детально и автоматически классифицировать) всю информацию представленную в Интернете.

Рассмотрим теперь практическую сторону вопроса, на примере некоторых популярных отечественных и зарубежных поисковых машин (на примере Яndex и AltaVista)

Яndex (Яндекс)
http://www.yandex.ru/

Яндекс является пожалуй наилучшей поисковой машиной в российском Интернете. Эта база данных содержит около 200 000 серверов и до 30 миллионов документов, которые поисковая машина просматривает в течение нескольких секунд.

Поиск информации задается введением ключевого слова ("рыбалка", например) в специальное окно ввода и нажатием кнопки "Найти", справа от этого окна. Результаты поиска появляются в течение нескольких секунд, причем ранжированные по значимости - наиболее важные документы размещаются в начале списка. При этом ранг найденного документа определяется тем, в каком месте документа находится ключевое слово (в заглавии документа важнее, чем в любом другом месте) и числом упоминаний ключевого слова (чем больше упоминаний, тем ранг выше). Таким образом, сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных поисковой машиной сайтов. Содержательную часть сайта можно косвенно оценить по краткому его описанию, размещаемому поисковой машиной под адресом сайта.

Например, поиск сайтов по ключевому слову "рыбалка" даст список, в начале которого будут представлены веб-страницы (сайты), в заголовках которых содержится эта фраза. Если в найденных поисковой машиной документах будет содержаться эта фраза более одного раза, то машина ранжирует остальные документы по частоте встречаемости заданной фразы.

Но даже ранжированный список документов, предлагаемый поисковой машиной в ответ на ключевую фразу или слово, может оказаться практически необозримым. В связи с этим в Яндекс (как и других мощных поисковых машинах) предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска. Например, на ключевое слово "рыбалка" Яндекс предлагает список из более чем 200000 веб-страниц, где первый российский сайт по рыбалке www.fishert.ru занимает первое почетное место.


AltaVista безусловно является лучшим поисковым инструментом в Интернете. Эта база данных содержит более 100 миллионов веб-страниц, которые поисковая машина может просматривать в течении нескольких секунд.

Поиск информации задается введением ключевого слова ("fishing", например) в специальную рамку и нажатием кнопки "Search" (англ. "Поиск"), справа от рамки. Результаты поиска появляются в течение нескольких секунд, ранжированные по значимости - наиболее важные документы размещаются в начале списка.

Alta Vista также позволяет ограничить результаты поиска определенным языком, а через сервис "Advanced" (Дополнительно) найти страницы, которые созданы в определенное временные промежутки (годы, месяцы и т.п.). Например, на ввод ключевого слова "fishing" с указанием языка Russian, Alta Vista представляет около сотни русскоязычных веб-страниц.

Специальная синтаксическая поисковая функция Alta Vista обеспечивает не только поиск изображений (картинок), но также информацию по веб-страницам со схожей информацией (команда "Related pages").

Достоинства поиска по ключевому слову (фразе)
По ключевому слову поиск организуется узконаправленно, точно отражая потребность в информации пользователя. Обширный перечень найденных документов гарантирует, в определенной степени, полноту охвата информации. Легко организовывать поиск по базе данных.

Недостатки поиска по ключевому слову (фразе)
Неоднозначность выбранных для поиска слов и использование одних и тех слов в различных предметных областях приводит к тому, что в список включается много документов, не имеющих прямого отношения к запрашиваемой информации. Например, на фразу "рыбацкие сети", в список документов представленных поисковой машиной, могут войти не только рыбацкие, но и другие сети, не относящиеся к предмету текущего поиска - компьютерные сети, торговые сети и т.п.

Инструменты мета-поиска

В настоящее время в Интернете представлены Серверы, которые позволяют осуществлять одновременный поиск по нескольким базам данных. Например, поисковая машина Dogpile (http://www.dogpile.com) обеспечивает поиск по 14 базам данных Интернета, представленным в одном экране. Эти базы данных включают Alta Vista, Yaho, Lycos и другие. Сторонники такого мета-поиска полагают, что использование большого перечня поисковых машин существенно улучшает информативность поиска. Хотя эти и так, но теневой стороной этого утверждения является то, что поиск информации осуществляется не по объединенной базе данных всех поисковых машин, а его необходимо все равно проводить в базе каждой поисковой машины отдельно. В итоге пользователь нередко набирает, с одной стороны, практически необозримое число веб-страниц, а с другой, в каждом из списков, которые представляет отдельная поисковая машина, оказывается много документов, представляемых другими поисковыми машинами, то есть информация дублируется. Кроме того, время поиска также существенно увеличивается.

В связи с вышесказанным, наиболее целесообразно использовать этот подход к поиску лишь в тех случаях, когда заведомо ищется какая-то очень редкая и необычная информация, и поэтому удобнее организовывать поиск с какой-то одной веб-страницы в Интернете, где представлен набор ведущих поисковых машин, чем разыскивать отдельные поисковые машины в сети.

Предметные каталоги

Поиск информации по ключевому слову (фразе) в Интернете, во многих отношениях, аналогичен поиску информации о каком-то слове или фразе в книге, когда для этого используется, так называемый "Предметный указатель", где напротив слова или фразы, указана страница текста, на которой можно найти его разъяснение. С другой стороны, если нужно получить общее представление о том, чему посвящена книга, следует обратиться к ее содержанию. Аналогично и в Интернете, можно искать медицинскую информацию, пользуясь в поисковых машинах выделенными тематическими разделами (предметными каталогами). Эти амбициозные проекты направлены на организацию информации в Интернете по типу библиотечного каталога. Например, если необходимо найти информацию о рыбалке, следует обратиться к разделу "Развлечения и отдых", в нем выбрать раздел "Активный отдых", а в последнем - раздел "Охота и рыбалка", где должны быть сгруппированы материалы по этой тематике.

Преимущества предметных каталогов
Поскольку предметный каталог позволяет сразу выделять из огромных ресурсов сети нужную информацию, то исчезает необходимость задавать в поисковой машине высокоспецифические для поиска ключевые слова и, тем самым, облегчается поиск.

Организация информации в виде каталога является привычной, логически очевидной и поэтому для начинающего пользователя Интернета служит удобной стартовой площадкой.

Недостатки предметных каталогов
Поскольку каталог формируется не автоматически, а авторским коллективом, то в итоге перечень сайтов и Веб-страниц оказывается менее полным, а материалы менее свежими, чем в аналогичных разделах автоматизированных Поисковых Машин, работающих по ключевым словам или фразам.

Итак выше был дано общее представление о спектре инструментов поиска информации в Интернете. Какой из них наиболее целесообразно использовать - зависит от поставленной задачи поиска и от того, что необходимо найти. Если возникает необходимость поиска информационных ресурсов высокого качества, то оцененные предметные каталоги подходят в наилучшей степени. Для того, чтобы получить более широкое представление о предмете поиска, предпочтительнее пользоваться общими предметными каталогами. Когда поиск узконаправлен (точечный), тогда можно использовать поиск по ключевому слову. Но обычно достаточную информацию из Интернета можно извлечь лишь используя комбинацию вариантов поиска.


© 2009-2010 INTERCOM
Эл. почта:

Наш адрес: г. Саратов, ул. Князевский взвоз, 3/5
Тел: (8452) 238311
Схема проезда к офису