Средства поиска информации в WWW

ОДБ.13 Информатика и ИКТ.

Дата 27.10.2020 г. Группа № 26.

Тема 6.1. Организация и услуги Интернет.

Занятие № 21 Информационные сервисы сети Интернет: электронная почта, телеконференции, Всемирная паутина, файловые архивы.                    

Цели и задачи: способствовать расширению и углублению знаний студентов об информационных сервисах Интернета. Формирование ценностного отношения к работе в сети Интернет. Эффективное применение ресурсов сети Интернет в учебной и повседневной деятельности. Эффективная организация индивидуального информационного пространства.

Ход урока

I. Организационный момент

II. Контрольная проверка знаний

 

Интернет - это мировая компьютерная сеть. В ней множество компьютеров по всему свету соединены проводами, телефонными линиями, радио и спутниковой связью. Со своего персонального компьютера Вы можете связаться с любой точкой земного шара и получить доступ к информации, которая содержится на любом компьютере, подключенном в сеть Интернет. А так как количество пользователей всемирной сетью растет, то и растут Ваши возможности в ней. Вы можете вступать в дискуссии по тем или иным темам, посещать виртуальные выставки, вести электронный бизнес, общаться с помощью почты и многое, многое другое. Достоинствами работы в сети Интернет являются быстрота, дешевизна, многоаспектность и перспективность.

Прародителем Интернет была сеть ARPANet. Она возникла в 1969 году, в Америке, для того, чтобы облегчить сотрудничество между организациями оборонной промышленности, разбросанными по разным штатам. Сначала она соединяла компьютерные системы одного типа, но по мере развития возникла необходимость в обмене данными между "разнородными" сетями. Так возник проект Interneting Project. В результате был создан стандарт передачи данных - протокол TCP/IP.

Протоколом передачи данных называется соглашение, устанавливающее, каким образом должна осуществляться передача данных из компьютера в компьютер и как можно распознавать и устранять ошибки, которые могут при этом возникать. И для того, чтобы осуществилась идея неограниченной коммуникации между компьютерами Интернет, используется один и тот же протокол TCP/IP. Он состоит из набора протоколов, каждый из которых выполняет различные задачи.

TCP, UDP транспортные протоколы, управляющие передачей данных между машинами

IP, ICMP, RIP протоколы маршрутизации. Они обрабатывают адресацию данных, обеспечивают фактическую передачу данных

DNS, ARP протоколы поддержки сетевого адреса обеспечивают идетификацию машины с уникальным номером и именем

FTP, TELNET протоколы прикладных сервисов. Это программы, которые пользователь использует для получения доступа к различным услугам и др.

Протоколы семейства TCP/IP реализуют всевозможные сервисы (услуги) Интернет.

Gopher-система

Эта система является предшественником WWW и сейчас утрачивает свое значение, хотя пока и поддерживается в Интернет. Это информационные серверы, на которых содержаться документы академической направленности и большие текстовые файлы. Просмотр информации на Gopher-сервере организуется с помощью древовидного меню, аналогичного меню в приложениях Windows или аналогично дереву каталогов (папок) файловой системы. Меню верхнего уровня состоит из перечня крупных тем, например, экономика, культура, медицина и др. Меню следующих уровней детализируют выбранный элемент меню предыдущего уровня. Конечным пунктом движения вниз по дереву (листом дерева) служит документ аналогично тому, как конечным элементом в дереве каталогов является файл.

Электронная почта

Следующий вид сервиса Интернет - электронная почта, или E - mail. Она предназначена для передачи в сети файлов любого типа. Одни из главных ее преимуществ - дешевизна и быстрота.

Электронная почта является исторически первой информационной услугой компьютерных сетей и не требует обязательного наличия высокоскоростных и качественных линий связи.

Любой пользователь Интернета может получить свой «почтовый ящик» на одном из почтовых серверов Интернета (обычно на почтовом сервере провайдера), в котором будут храниться передаваемые и получаемые электронные письма.

У электронной почты есть преимущества перед телефонной связью. Телефонный этикет очень строг. Есть множество случаев, когда нельзя позвонить человеку по соображениям этикета. У электронной почты требования намного мягче. По электронной почте можно обратиться к малознакомому человеку или очень занятому человеку. Если он сможет, то ответит.

Чтобы электронное письмо дошло до адресата, оно, кроме текста послания, обязательно должно содержать электронный адрес получателя письма.

Адрес электронной почты записывается по определенной форме и состоит из двух частей:
имя_пользователя@имя_сервера

Имя_пользователя имеет произвольный характер и задается самим пользователем; имя_сервера жестко связано с выбором пользователем сервера, на котором он разместил свой почтовый ящик.

Пример, ivanov@kyaksa.net

В нашем классе имя пользователя – это имя компьютера, например, pc01, pc02 и т.д. имя сервера: server, поэтому электронный адрес компьютера в локальной сети класса: pc01@server

Чтобы отправить электронное письмо, отправитель должен подключиться к Интернету и передать на свой почтовый сервер сообщение. Почтовый сервер сразу же отправит это письмо через систему почтовых серверов Интернет на почтовый сервер получателя, и оно попадет в его почтовый ящик.

Однако получатель получит письмо только после того, как соединится с Интернетом и «скачает» почту из своего почтового ящика на собственный локальный компьютер.

Телеконференции UseNet

Телеконференции UseNet представляют собой электронные форумы. Пользователи Интернет посылают туда свои сообщения, в которых высказываются по определенной теме. Сообщения поступают в специальные дискуссионные группы - телеконференции, при этом каждое мнение становится доступным для всех участников конкретной группы. Уже сегодня UseNet имеет более 20 000 телеконференций, посвященных различным темам: компьютерам, рецептам, вопросам генной инженерии и многому другому.


Telnet

Программа Telnet была разработана для обеспечения дистанционного доступа к удаленному компьютеру в Интернет. При этом компьютер пользователя выступает в качестве терминала, подключенного к большому компьютеру. В отличие от компьютеров, терминалы не обладают собственными вычислительными возможностями. Они только обеспечивают доступ к какому - то компьютеру благодаря имеющимся у них монитору и клавиатуре. В качестве примера можно привести системы в аэропортах, на вокзалах, где Вы можете получить информацию о билетах, рейсах и т.п.

Системные основы WWW

Рассмотрим более подробно, что же такое World Wide Web (WWW). Обычно это словосочетание переводят как «Всемирная паутина». Каждый представляет себе паутину — это сеть, которую плетет паук. По смыслу слово «паутина» (Web) является синонимом слова «сеть».

World Wide Web (WWW) — это сеть документов, связанных между собой гиперссылками.

Таким образом, за использованием разных терминов закрепился разный смысл: сеть — это система взаимосвязанных компьютеров, т. е. техническая система, а паутина (Web) — это система взаимосвязанных документов, т. е. структура данных.

Разумеется, «паутина» документов существует на базе компьютерной сети.

Каждый отдельный документ, имеющий собственный адрес, называется web-страницей.

Каждая web-страница может иметь множество связей с другими страницами, которые хранятся как на том же самом компьютере, так и на других компьютерах сети. На рис. 2.5 схематически показано наложение паутины документов на компьютерную сеть. Сплошными линиями обозначены web-серверы и связи между ними, пунктирными — web-документы и их связи.

 

Web-сервер — это компьютер, на котором работает сервер-программа WWW. В его дисковой памяти хранятся web-страницы.

Web-страница (документ) может содержать самую разную информацию: текст, рисунок, звукозапись, видео. Каждая страница хранится в отдельном файле, имя которого имеет расширение htm или html.

Гиперссылка — это некоторое ключевое слово или объект в документе, с которым связан указатель для перехода на другую страницу в паутине. Обычно изображение гиперссылки на странице каким-то образом выделяется, например цветом или подчеркиванием. При подведении к гиперссылке указателя мыши он принимает вид руки с указывающим пальцем. Если при этом щелкнуть левой кнопкой мыши, то произойдет переход по указателю к связанному документу. Текст, в котором используются гиперссылки, называется гипертекстом. Гиперссылки могут быть связаны не только с текстом, но и с другими видами объектов: рисунок, фото, видео, звукозапись, телеканал и др.

В основе технологии WWW лежат следующие понятия:

• HTTP (HyperText Transfer Protocol, протокол передачи гипертекста);
• адрес URL (Universal Resource Locator, универсальный указатель ресурса);
• язык HTML (HyperText Markup Language, язык разметки гипертекста).

HTTP (HyperText Transfer Protocol) — протокол передачи гипертекста. Используется службой WWW. Браузер — клиент-программа WWW посылает запрос web-серверу, хранящему файл с необходимым документом. В ответ на запрос сервер высылает клиенту требуемый файл или сообщение об ошибке, если файл недоступен. Протокол HTTP регулирует данный вид взаимодействия между клиентом и сервером.

URL-адрес. Уже рассказывалось о системе адресации в компьютерном пространстве Сети. Это IP-адреса, доменные адреса. В пространстве информационных ресурсов Интернета используется своя система адресации. Она называется URL (Uniformed Resource Locator) — универсальный указатель ресурса. Каждая web-страница или файл имеют свой уникальный URL-адрес, который состоит из трех частей: имя используемого для доступа протокола; имя сервера, на котором хранится ресурс; полное имя файла (путь+имя) на сервере. Например, URL-адрес главной страницы web-сайта газеты «Первое сентября» выглядит так:

http://www.lseptember.ru/ru/first.htm

Здесь http:// — протокол доступа;

www.lseptember.ru — имя сервера;

/ru/first.htm — полное имя файла.

Префикс «www» образовался больше 20 лет назад и обозначал то, что на соответствующем домене работает именно web-сервер, а не какой-либо иной сервис. Но теперь, когда WWW стал доминирующим сервисом, смысл в его указании почти пропал.

Следует заметить, что имя составлено по правилам операционной системы Unix, под управлением которой работают серверы Интернета. В отличие от Windows вместо символа «\» (обратный слеш) здесь используется символ «/» (слеш). Кроме того, строчные и прописные буквы не являются взаимозаменяемыми.

Web-сайт (другое название — web-узел) — это совокупность взаимосвязанных страниц, принадлежащих какому-то одному лицу или организации. Web-сайт организуется на web-сервере провайдера сетевых услуг. Всякий сайт имеет главную страницу, являющуюся своеобразным титульным листом сайта. Как правило, главная страница представляет владельца сайта и содержит гиперссылки на разные его разделы. Пример главной страницы web-узла издательства «БИНОМ. Лаборатория знаний» приведен на рис. 2.6.

 

HTML — стандартный язык описания web-страниц. Теги (метки) языка HTML интерпретируются браузером, который на их основе строит в памяти компьютера объектную модель документа, а затем выводит эти объекты на экран. В результате пользователь видит отображение web-страницы в окне браузера.Язык HTML является основой любого гипертекстового документа, даже если он был создан в одном из конструкторов сайтов или визуальном редакторе.

Web-браузер — программа-клиент WWW. Слово browser можно перевести как «обозреватель». Наиболее распространенными программами этого типа являются Netscape Navigator, Internet Explorer, Opera, Google Chrome.

Средства поиска информации в WWW

Как уже говорилось выше, WWW — это система web-страниц, связанных между собой гиперссылками. Однако эти связи не имеют регулярности, как, например, в иерархической структуре данных. В этом смысле можно говорить о том, что система web-страниц не структурирована.

Единственной координатой web-документа является его URL-адрес. Однако URL-адрес никак не связан с содержанием документа. Но поиск данных осуществляется именно по содержанию. Как же в такой ситуации можно выполнять поиск нужной информации в паутине?

В поиске информации в WWW пользователю помогает поисковая служба Интернета — услуга поисковых серверов. Существуют две разновидности поисковых серверов: поисковые каталоги и поисковые указатели.

Поисковые каталоги. Если вам приходилось пользоваться услугами больших библиотек, то вы знаете, что такое библиотечный каталог. Существуют алфавитные и предметные каталоги. В алфавитных каталогах карточки с библиографическими данными книг разложены в алфавитном порядке фамилий авторов. В предметных каталогах карточки систематизированы по содержанию книг.

Систематизация в предметном каталоге производится по иерархическому принципу. На первом уровне иерархии весь книжный фонд делится на крупные разделы: художественная литература, учебная литература, общественно-политическая литература, научно-техническя литература и т. п. Каждый из этих разделов делится на подразделы; например, учебная литература делится на разделы высшего, среднего, дошкольного образования. Книги для среднего образования могут делиться по предметам, которые, в свою очередь, делятся по классам. Чтобы подобрать литературу по нужной теме, читатель должен понимать принцип организации каталога.

Поисковые каталоги WWW организованы по аналогичному иерархическому принципу. Только в них систематизируется информация не о книгах, а о документах, хранящихся в World Wide Web. На главной странице поискового каталога располагается список основных тематических разделов (рубрик). Например: финансы и экономика, государство и право, наука и образование, компьютеры, политика и т. д. Каждое имя в этом списке является внутренней гиперссылкой поискового каталога. Щелчок мышью по гиперссылке вызывает на экран список заголовков следующего подраздела и т. д. Очевидно, такая система подобна дереву файловой системы. Перемещаясь по дереву внутренних гиперссылок каталога, пользователь в конечном итоге получает список внешних ссылок на искомые web-документы.

Поисковые каталоги заполняются вручную специалистами, обслуживающими данную службу. При ручном способе отбора невозможно получить в каталоге исчерпывающую информацию о ресурсах Сети, и в этом состоит основной недостаток каталогов. Однако такой способ классификации исключает ссылки на случайные документы, не имеющие отношения к указанной теме. Таким образом, поисковые каталоги при относительно небольшом охвате ресурсов Сети обеспечивают хорошее качество подборки документов.

Примерами русскоязычных поисковых каталогов являются:

Yandex — http://yaca.yandex.ru;

Mail.ru (List.ru) — http://www.mail.ru;

Russia on the Net — http://www.ru.

Поисковые указатели. Другое название этого вида поисковой службы — поисковые машины. Очень часто в учебной и научной литературе в конце книги присутствуют предметные указатели — это перечень основных терминов с указанием страниц, на которых они встречаются. Например, в учебнике по информатике вы ищете в таком списке слово «процессор», напротив которого указаны номера страниц. Затем на этих страницах читаете всё, что написано о процессоре.

Принцип работы поисковых указателей заключается в создании и использовании индексных списков — аналогов книжных предметных указателей.

Задачи поисковых машин состоят в формировании индексных списков, охватывающих как можно большее число документов паутины, а также в ответах на запросы клиентов. Ясно, что таким способом проиндексировать вручную все документы WWW невозможно. Их число давно перевалило за миллиард. Поэтому поисковые машины строят индексные списки автоматически.

Основной составляющей поисковых машин являются программы просмотра web-документов, которые называют по-разному: роботами, червяками, пауками и пр. Наверное, наиболее подходящим названием является «пауки», если уж сеть WWW называть паутиной! Непрерывно, днем и ночью, они сканируют всё информационное пространство WWW, просматривая все документы, определяя в них ключевые слова и записывая в свою базу индексов данное слово с указателем на документ, в котором оно присутствует. Этот процесс не прерывается, поскольку содержание паутины всё время меняется и дополняется. Даже в уже просмотренные документы авторы могут внести изменения или вообще удалить их. Поисковая машина всё время должна поддерживать информацию в актуальном состоянии.

Эффективность работы поисковой машины зависит от используемых алгоритмов формирования базы указателей. Эти алгоритмы представляют «know how», т. е. объекты интеллектуальной собственности авторов, и обычно держатся в секрете. Число указателей к некоторым ключевым словам составляет многие тысячи. Чем лучше алгоритм, тем меньше в индексный список попадает «мусора» — случайных документов, не имеющих отношения к теме поиска.

В отборе наиболее важных документов пользователю помогает рейтинговый принцип, используемый некоторыми поисковыми указателями. На запрос пользователя по ключевому слову система выдает список ссылок на документы, расположенные по убыванию рейтинга. Рейтинг определяется по числу обращений к документу, которые были сделаны ранее. Самые популярные документы попадают в начало списка.

Число поисковых указателей превышает число поисковых каталогов. Популярными в России указателями являются:

Апорт 2000 — www.aport.ru;

Рамблер — www.rambler.ru;

Yandex.ru — www.yandex.ru;

Google — www.google.ru.

Поисковая служба Google работает как в международном, так и в российском секторе Интернета и является самой популярной.

Вопросы и задания

 

Тонкие вопросы Толстые вопросы
Какие информационные сервисы нам предлагает Интернет? На какие группы можно разделить информационные сервисы?
Программное обеспечение, которое позволяет перемещаться пользователю в сети Интернет? Какие известные виды информационных сервисов сети Интернет нам известны и как их можно систематизировать?
Для чего служат файловые архивы? Как скачать информацию прямо из Интернета?
Как сделать свою работу с сервисами наиболее быстрой и удобной? Как пользоваться ресурсами сети Интернет?

 

Домашнее задание: Изучив теоретический материал, перенесите в конспекты систему основных понятий и ответьте устно на вопросы.

Сфотографировать конспект и отправить преподавателю на эл.почту valvovk@mail.ru или отправить сообщением в группу ВКонтакте https://vk.com/club194179937


Дата добавления: 2020-11-23; просмотров: 90; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!