Критическая оценка и описание электронного документа



 

Серьезной проблемой является то, что в Интернете, конечно, можно найти все, но при этом качество найденного в Интернете может оказаться любым. И поэтому вопрос, каким именно образом надо оценивать найденную в Интернете информацию и как следует описывать электронный документ, является крайне важным.

Основные минимальные требования к электронному документу следующие.

URL: домен и электронный документ. Разместить информацию в Интернете может кто угодно, поэтому электронный ресурс, предлагающий информацию, имеет первостепенное значение. Важно различать домен, т.е. электронный ресурс в целом, и электронный документ, который размещен среди прочих (иногда десятков, иногда тысяч, иногда миллионов) документов.

Доверие к ресурсу-публикатору является первым важным показателем, по которому проводится оценка информации. Любой ресурс ангажирован (иначе просто быть не может), но ресурсы государственных организаций, а также научных институтов и журналов обычно вызывают большее доверие. Сайтам общественных организаций и персональным сайтам обычно доверять надо меньше, хотя из этого правила много исключений: персональный сайт известного автора зачастую надежнее и полезнее многих безликих и пустых сайтов организаций.

Атрибуция электронного документа. Из самого внешнего вида страницы, из того, как она сверстана, можно понять, является ли документ частью специально составленной коллекции или он оказался на данном сайте случайно. Указание автора документа и даты его создания или последнего обновления является важнейшим признаком вызывающего доверие сайта.

К сожалению, создатели сайтов не утруждают себя публикацией этой информации и ее отсутствие серьезно снижает уровень доверия к документу, особенно, если текст явно авторский. Чтобы оценивать достоверность и актуальность текста, необходимо знать его автора и время создания. Иначе неизвестна компетентность автора, текст является анонимкой, заведомо не внушающей доверия. А отсутствие даты создания (обновления) документа, содержащего выражения «в настоящий момент», «до настоящего времени» и т. п. или подразумевающего актуальность информации, делает его просто непригодным для использования.

 Еще хуже с изобразительным материалом: публикуя при биографии исторического лица его портрет, создатели сайтов очень редко считают нужным указывать авторство этого портрета и основания для его атрибуции (на каком, собственно, основании этот портрет считают портретом именно данного лица). И нередко атрибуции бывают ошибочными: например, на многих сайтах при справках о А.П. Куницыне (русском юристе, лицейском преподавателе А.С. Пушкина) за его портрет выдается портрет Сергея Львовича Пушкина, отца поэта (см., например, http://www.peoples.ru/state/teacher/kunicin/, https://tvernews.ru/news/202722/, http://volna.org/literatura/tsarskosielskii_litsiei.html, http://www.myshared.ru/slide/287392/). В действительности живописные портреты Куницына не известны, есть только графическая карикатура, выполненная лицеистом А.Д. Илличевским.

Документ в контексте других источников информации. Важные маркеры качества документа – это ссылки, примечания и другие указатели контекста его создания. Тем более, что полезную информацию о качестве документа вполне могут дать ресурсы, на которые ссылается автор.

Что известно об этом ресурсе. Некоторое значение имеет и репутация ресурса в Интернете: его рейтинг посещаемости, ссылаются ли на этот ресурс другие ресурсы и если да, то какие именно (т. н. обратные ссылки), зарегистрирован ли ресурс в авторитетных каталогах. При работе со специализированными ресурсами большее значение, по сравнению с посещаемостью, имеют авторитетные обратные ссылки.

Проверка по независимым источникам. Обнаруженное в Интернете сенсационное утверждение обязательно надо проверять по независимым источникам. Именно независимым – это важно, ведь дублирующаяся информация в Интернете встречается очень часто. Следует иметь в виду, что ошибки в Интернете тиражируются ничуть не медленнее, если не быстрее, чем достоверные сведения.

Таким образом, мало найти в Интернете источник информации, надо еще суметь адекватно оценить его.

 

Скрытый Веб

 

Скрытый Веб (глубокий Веб, невидимая паутина) – это электронные ресурсы, которые трудно разыскать, хотя они в Интернете есть. Прежде всего Скрытый Веб – это та часть ресурсов Интернета, которая не проиндексирована поисковиками – либо вследствие технической трудности, либо по причине специального их закрытия для поисковых машин. Он включает и ресурсы, недоступные для индексации поисковиками (например, базы данных), и ресурсы, скрытые умышленно: доступные по подписке, паролю или каким-то специальным правилам.

Оценка величины Скрытого Веба является предметом спора. В 2000 г. его объем оценивали как в 500 раз превосходящий количество документов, индексируемых поисковиками. Однако, сегодня ситуация несколько улучшилась. За прошедшее время документы многих типов (файлы PDF, XLS, PPT и др.) стали доступны для поисковых машин. К тому же степень дублирования документов в Скрытом Вебе примерно такая же, как в среднем по Интернету. Так что сегодня превосходство Скрытого Веба над «Поверхностным» меньше примерно втрое. Но и это означает, что лишь немногим больше половины процента от всех имеющихся ресурсов доступны поисковикам и относятся к «Поверхностному» Вебу.

И уже из этого ясно, что нельзя и недооценивать важность и возможности Скрытого Веба, когда проводятся интернет-разыскания, потому что Специализированные базы предоставляют не только разнообразную, но гораздо чаще, чем обычные ресурсы, – проверенную информацию. К примеру, к Скрытому Вебу относятся базы данных научных статей, ведь полноценный доступ к ним и полнотекстовый поиск требует подписки. Так что при проведении поиска в Интернете пренебрегать Скрытым Вебом нельзя. Некоторые возможности поиска в Скрытом Вебе перечислены ниже.

Complete Planet. Поисковый каталог Complete Planet – это каталог страниц, которые содержат данные, недоступные для обычных поисковиков. На настоящий момент он объединяет более 70 тыс. баз данных и специализированных поисковых средств, в основном на английском языке.

Каталог включает базы данных по самому широкому кругу вопросов, при отборе ресурсов академическим ресурсам отдается предпочтение.

Yahoo ! Subscriptions. Специализированный поисковый движок Yahoo! Subscriptions осуществляет поиск по сайтам, доступ к которым возможен только для зарегистрированных пользователей. Он позволяет искать в базах данных Wall Street Journal, Financial Times, а также в ведущих подписных американских информационных базах, таких как Factiva и LexisNexis.

УИС «Россия». В университетской информационной системе «Россия» собраны материалы научной периодики и СМИ, юридические и статистические документы. Однако доступ к ней осуществляется по паролю.

Поиск мультимедиа. Звуковую, и видео информацию (а отчасти и графическую) можно отнести к Скрытому Вебу потому, что поисковые машины пока не способны распознавать содержание таких файлов. Поэтому поиск обычно ведется на основе подписей и комментариев к графическим, аудио- и видеофайлам.

Изображения.Для поиска графических файлов можно использовать сразу несколько вариантов поисковых механизмов:

· специальные разделы обычных поисковых машин (Google, Яндекс, Yahoo!);

· базы фотохостингов (широко известны: Flickr, Google Фото (куда перенесены и фотографии с закрытого ныне хостинга Picasa), Яндекс.Фотки, Instagram и др.);

· специализированные фотобанки (базы данных профессиональных снимков, обычно платные, но часть изображений часто находится в свободном пользовании или к ним возможен ограниченный бесплатный доступ): Getty Images, Depositphotos, Dreamstime, Shutterstock, Fotolia (поглощена компанией Adobe), Istockphoto, Fotodom, 123RF, Фотодженика, Фотобанк Лори, Pressfoto, Fotobiz и мн. др.);

· специализированные поисковики изображений (например, Picsearch.com).

Для поиска изображений с подписями (описаниями) на разных языках применяются специальные сервисы, например, межъязыковой поиск картинок PanImages.

В целом эффективность поиска изображений пока оставляет желать лучшего. Для написания работы по мировой истории поиск изображений имеет вспомогательное значение, поэтому останавливаться на нем мы не будем.

Видео. Распространение видеофайлов в Интернете стало одной из основных тенденций в последнее пятилетие. В настоящее время с распознаванием видео вопросы решены только теоретически, однако необходимых технических ресурсов для видеопоиска еще нет. Зато есть достаточные ресурсы для видеохостинга, поэтому на настоящий момент поиск файлов в таких хранилищах, как YouTube или RuTube остается главной возможностью поиска.


Дата добавления: 2020-11-15; просмотров: 105; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!