<<предыдущая лекция | содержание | следующая лекция>> |
Информационно-поисковые системы
Основные протоколы, используемые в сети Интернет, не обеспечены достаточными встроенными функциями поиска, не говоря уже о миллионах серверов, находящихся в ней. Протокол HTTP, используемый в Интернет, хорош лишь в отношении навигации, которая рассматривается только как средство просмотра страниц, но не их поиска. То же самое относится и к протоколу FTP, который даже более примитивен, чем HTTP. Из-за быстрого роста информации, доступной в Сети, навигационные методы просмотра быстро достигают предела их функциональных возможностей, не говоря уже о пределе их эффективности.
Не указывая конкретных цифр, можно сказать, что нужную информацию уже не представляется возможным получить сразу, так как в Сети сейчас находятся миллиарды документов и все они в распоряжении пользователей Интернет, к тому же сегодня их количество возрастает согласно экспоненциальной зависимости. Количество изменений, которым эта информация подвергнута, огромно и, самое главное, они произошли за очень короткий период времени. Основная проблема заключается в том, что единой полной функциональной системы обновления и занесения подобного объема информации, одновременно доступного всем пользователям Интернет во всем мире, никогда не было. Для того чтобы структурировать информацию, накопленную в сети Интернет, и обеспечить ее пользователей удобными средствами поиска необходимых им данных, были созданы поисковые системы.
Поисковая система (она же Информационно-поисковая система) – это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска.
Поисковые системы обычно состоят из трех компонент:
Главной задачей любой поисковой системы является поиск информации соответствующей информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего.
Соответствие результатов поиска сформулированному запросу называют релевантностью.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Улучшение поиска – это одна из приоритетных задач современного Интернета.
Обычно, использование поисковых систем является первым, с чем знакомятся начинающие пользователи. Современные поисковые системы очень просты в освоении, интуитивно понятны и насколько это возможно скрывают от пользователя свои сложные механизмы. Чтобы начать использовать систему достаточно в строке поиска набрать интересующий вас вопрос, предварительно обдумав, что вы хотите найти и где надо искать. В большинстве случаев, поисковая система самостоятельно исправит допущенные опечатки, произведет поиск с применением разных языковых изменений фразы.
По данным компании Net Applications, в ноябре 2011 года использование поисковых систем распределялось следующим образом:
Согласно данным LiveInternet об охвате русскоязычных поисковых запросов:
Некоторые из поисковых систем используют внешние алгоритмы поиска. Так, Qip.ru использует поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.
<<предыдущая лекция | содержание | следующая лекция>> |