Принцип работы поисковых систем



МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение высшего образования

«КУБАНСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ ИМЕНИ И.Т.ТРУБИЛИНА»

 

Факультет Прикладной информатики

Кафедра Компьютерных технологий и систем

 

КУРСОВАЯ РАБОТА

 

ОСНОВНЫЕ КОНЦЕПЦИИ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО ПРОГРАММИРОВАНИЯ

 

Направление подготовки: 09.03.03 Прикладная Информатика

Направленность: «Анализ поисковых систем в сети Интернет»

 

Выполнил:

Семененко Андрей Владимирович

Группа ПИ2103

Руководитель:

______________________________________

______________________________________

 

Дата защиты _____________

_____________

Оценка

___________________

_____________Ф.И.О


Краснодар 2021


ОГЛАВЛЕНИЕ

 

ВВЕДЕНИЕ.. 3

ГЛАВА 1. ВХОЖДЕНИЕ В ТЕМУ И ОСНОВНЫЕ ПОНЯТИЯ.. 4

1.1. История. 4

1.2. Принцип работы поисковых систем.. 5

1. 3 . Список определений.. 6

ГЛАВА 2. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПОИСКОВЫХ СИСТЕМ И СОЗДАНИЕ МОДЕЛИ «ИДЕАЛЬНОЙ» ПОИСКОВОЙ СИСТЕМЫ... 9

2.1. Сравнительный анализ поисковых систем.. 9

2.1.1. Google. 10

2.1.2. Bing. 11

2.1. 3 . Yahoo !. 12

2.1. 4 . Яндекс. 13

2.1.5. Baidu. 14

2.1.6. DuckDuckGo. 16

2.1.7. Sogou. 17

2.1.8. Naver. 17

2.1.9. Ecosia. 18

2.1.10. Haosou. 18

2.2. Создание модели «идеальной» поисковой системы.. 19

ЗАКЛЮЧЕНИЕ.. 22

СПИСОК ЛИТЕРАТУРЫ... 23

 


 


ВВЕДЕНИЕ

 

Интернет стал неотъемлемой частью нашей жизни. Благодаря этому изобретению наша жизнь изменилась до неузнаваемости: расширился спектр возможностей в различных сферах нашей жизни такие как образование, работа, развлечение и быт. Также благодаря Интернету наша жизнь стала гораздо проще. Например, можно общаться с человеком, с любой точки земного шара, не выходя из дома. Или же найти нужную информацию за считанные секунды.

Одна из самых полезных функций сети Интернет – это доступ к любой информации. Благодаря ней нам не приходится идти в библиотеку за очередной книгой, чтобы узнать что-нибудь новое. Почти вся информация обо всем хранятся на множестве серверов, разбросанные по всему миру и соединенные между собой Всемирной паутиной.

Конечно, в Интернете информации очень много и необходим мощный инструмент, с помощью которого можно найти то, что нужно. Такими инструментами называются поисковые системы. Благодаря ним можно найти не только подходящие сайты, но и картинки, видео, новости и прочий контент. Такие системы значительно облегчают веб-серфинг.

Цель данной курсовой работы заключается в раскрытии сущности поисковых систем, изучение их истории, сравнительный анализ популярных поисковых систем и на основе полученной ранее информации разработать модель “идеальной” поисковой системы.

 


 

ГЛАВА 1. ВХОЖДЕНИЕ В ТЕМУ И ОСНОВНЫЕ ПОНЯТИЯ

 

История

Незадолго после появления Интернета предпринимались попытки организации доступа к информационным ресурсам. Для этого создавались различные каталоги в пределах одной локальной сети. Но уже в 1990-х, когда Интернет стал доступен для широкого круга населения, требовалось создать каталог, который позволил бы каждому человеку максимально быстро и удобно находить информацию по глобальной сети. Для этого были созданы тематические каталоги, которые представляли собой наборы ссылок на различные сайты, объединенные под одну тематику. Первым из них стал Yahoo, открытый в 1994 году. Однако полноценными поисковыми системами их назвать нельзя, поскольку поиск ограничивался в пределах зарегистрированных в каталогах информационных ресурсов. Даже самые полные каталоги содержали в себе лишь ничтожную часть Всемирной паутины. Поэтому на данный момент они актуальны лишь на отдельных тематических сайтах и форумах, где контента не так много.

В этом же 1994 году появилась на свет полноценная поисковая система –WebCrawler. Вслед за ней появились AltaVista и Lycos. В 1997 в стенах Стэнфордского университета, Сергеем Брином и Ларри Пейджом была создана самая популярная на текущий момент поисковая система – Google.

Логично, что 1997 год можно охарактеризовать как год расцвета поисковых систем. В этом же году, был создан отечественный аналог Google – Яндекс, который является довольно популярной системой в русскоязычном сегменте Интернета. Конечно, было создано еще немало подобных поисковиков, но они чаще всего перенимали алгоритмы и базы других, более крупных поисковых систем.

С течением лет известные и не очень поисковые системы постепенно не только расширяли свою базу и улучшали свои алгоритмы, но и внедряли в поисковые системы новые технологии, добавляли новые функции. Например, еще в середине 00-х Google представила прототип виртуального помощника. Он выполнял те же функции, что и поисковик, но с ним можно общаться, используя клавиатуру. Он выдавал ограниченное число фраз, в зависимости от того, что напишет пользователь. В 2010 году эта же компания представила технологию распознавания речи. Помимо поиска так же появились функция поиска фотографий, хранения электронных писем, интерактивная карта с поиском мест, переводчик с использованием синтеза голоса для озвучки. Позже появились еще больше функций, связанные с хранением данных, голосовыми ассистентами, виртуальными покупками… То есть, почти все известные поисковые системы превратились в мощные многофункциональные онлайн-сервисы для повседневной жизни.

 

Принцип работы поисковых систем

Чтобы отобразить пользователю необходимую ему информацию, поисковые системы ищут, анализируют и сортируют по степени актуальности все возможные веб-страницы. После чего пользователь оценивает результат работы поисковика. Разумеется, не всегда результаты работы поисковых систем могут соответствовать ожиданиям пользователя. Информация может находиться либо быстро, либо слишком долго. Может быть актуальной для пользователя или не очень. Качество работы поисковых систем оценивается по таким принципам: С какого по счету запроса удалось найти актуальную информацию? На какой странице находится ссылка на подходящую пользователю информация? С какой скоростью обрабатывался запрос?

Разумеется, современные поисковые системы не лишены недостатков. У каждой системы свои алгоритмы, которые имеют свои плюсы и минусы. Например, один алгоритм быстро обрабатывает запрос, но требует строгого соблюдения регистра при его вводе. Другой же понимает вас с полуслова, но выдает не совсем актуальную информацию.

Чтобы понять, как работает поисковая система, нужно изучить его составляющие. Поисковая система — это совокупность следующих компонентов:

· Агент, который перемещается по Сети и собирает информацию. В свою очередь состоит из:

o Spider (паук) – встроенная в систему программа, которая скачивает веб-страницу. Визуально отображает скачанную страницу пользователю, в то время как онам работает с HTML кодом напрямую.

o Crawler («путешествующий» паук) – программа, которая ищет новые или измененные документы на данной странице для дальнейшего продвижения паука путем автоматического перехода по всем возможным внешним ссылкам, присутствующим на веб-странице.

o Indexer (индексатор) – анализирует скачанные пауками веб-страницы, включая текст, заголовки, служебные html-теги.

· Database (база данных) – хранилище для скачанных и обработанных страниц.

· Web-client – извлекает результаты поиска из базы данных поисковой системы и определяет соответствие страниц с запросом пользователя. Позволят также взаимодействовать пользователь с остальными компонентами системы.

 

Список определений

Далее эти определения будут встречаться в тексте. Они будут выделены курсивом. Данный список поможет лучше разобраться в теме.

Релевантность — степень соответствия найденного документа или набора документов информационным нуждам пользователя

Конфиденциальность — необходимость предотвращения разглашения, утечки какой-либо информации.

Семантика — это соответствие между синтаксически правильными программами и действиями абстрактного исполнителя, то есть это смысл синтаксических конструкций.

Bing Bar — это панель инструментов, предназначенная для встроенного в операционную систему Windows браузера Internet Explorer, которая интегрирована с поисковой системой Bing от «Майкрософт».

Метаданные — это субканальная информация об используемых данных.

«Пузырь фильтров» — явление, при котором веб-сайты определяют, какую информацию пользователь хотел бы увидеть, основываясь на информации о его месторасположении, прошлых нажатиях и перемещениях мыши, предпочтениях и истории поиска. В результате веб-сайты показывают только информацию, которая согласуется с прошлыми точками зрения данного пользователя. Вся иная информация, как правило, пользователю не выводится.

OpenSearch — Набор технологий, позволяющих веб-сайтам и поисковым системам публиковать результаты поиска в форматах, удобных для распространения и сбора.

TechCrunch — Интернет-издание о стартапах, интернет-бизнесе, инновациях и веб-сайтах. TechCrunch был основан Майклом Аррингтоном в 2005 году.

Пожертвование (Донат) — дар, передача денег в пользу какой-либо организации или лица; а также добровольная оплата без принуждения, то есть оплата в благодарность за уже имеющуюся вещь или полученную услугу.

Портал — крупный сайт, объединяющий различные сервисы.

Дата-центр — это специализированное здание для размещения (хостинга) серверного и сетевого оборудования и подключения абонентов к каналам сети Интернет.

Primary Nouns - это основные элементы, с которыми пользователь производит действия или манипуляции при работе с системой.

 

 


 


Дата добавления: 2021-12-10; просмотров: 18; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!