Сохранение и открытие документа в определенном формате

Тема: Технология работы с текстовой информацией. Текстовой редактор Word.

 

Тема: «Технология работы с текстовой информацией. Текстовой редактор Word»

 

Тип занятия: практическое

 

Актуальность выбора темы:

Текстовые редакторы наиболее часто используемые программные продукты. Ввод, редактирование и форматирование текста- необходимые умения при работе с компьютером. 

 

Профессиограмма:

Студенты должны знать:

1. Назначение и возможности текстового редактора MsWord.

2. Элементы редактирования и форматирования текста.

 

Студенты должны уметь:

1. Запускать Word.

2. Вводить текст, сохранить текстовой файл, открыть текстовой файл.

3. Редактировать текст, работать с фрагментами текста, буфером обмена, форматировать текст.

4. Вставлять в текст таблицу, форматировать таблицу. Вставлять в текст и форматировать рисунок из библиотеки рисунков Clipart, объект WordArt, автофигуры.

5. Отпечатать текст на бумаге.

 

Оснащение: ПО Word, карточки с заданиями

 

 

Для выполнения практического задания создайте текст методом копирования, который состоит из 3-х абзацев и занимает целую страницу, например, МБ.doc.

Изучите теоретическую часть темы, по ходу выполняя практические задания. Выполненную работу сохраните в файл для отчета (файл пересылать никуда не надо, я могу потребовать по почте послать скрин у некоторых). 

 

 

Ход занятия.

 

I. Создание и редактирование документов.

 

Для обработки текстовой информации на компьютере ис­пользуются приложения общего назначения — текстовые редакторы. Текстовые редакторы позволяют создавать, ре­дактировать, форматировать, сохранять и распечатывать документы.

Простые текстовые редакторы (например, стандартное при­ложение Windows Блокнот) позволяют редактировать текст, а также осуществлять простейшее форматирование шрифта.

Более совершенные текстовые редакторы (например, Microsoft Word), которые называют иногда тек­стовыми процессорами, имеют широкий спектр возможностей по созданию документов (вставка списков и таблиц, средства проверки орфографии, сохранение исправлений и др.). Для подготовки к изданию книг, журналов и газет в про­цессе макетирования издания используются мощные про­граммы обработки текста — настольные издательские сис­темы (например, Adobe PageMaker). Для подготовки к публикации в Интернете Web-страниц и Web-сайтов используются специализированные приложе­ния (например, Microsoft Frontpage).

Создание документа.

Создание документа начинается с выбора шаблона, то есть готовой пустой заготовки докумен­та определенного назначения (обычный документ, визитная карточка, резюме и др.). Шаблоны задают структуру доку­мента, которую пользователь заполняет определенным со­держанием.

Для создания документов со сложной структурой использу­ются Мастера. Например, целесообразно использовать мастер при создании факсов, так как общепринятая форма факсов должна содержать обязательный набор правильно размещен­ных на странице полей (Кому, От кого. Дата и др.).

В процессе создания документа в текстовом редакторе пользователь вводит символы с клавиатуры.

Создание документа.

1. Запустить редактор Word. Ввети команду [Файл- Создать…]

 

2. Выбрать тип Новый документ.

3. Ввести текст.

Сохранение документа.

1. Ввести команду [Файл- Сохранить… ]

2. Выбрать папку, в которой требуется сохранить документ и ввести имя документа.

3. Закрыть программу.

 

Редактирование документа.

Редактирование документа производится путем копирования, перемещения или удале­ния выделенных символов или фрагментов текста. Копиро­вание позволяет размножить выделенный фрагмент доку­мента, то есть вставить его копии в указанные места документа. При перемещении выделенный фрагмент выре­зается и вставляется в другое место документа, а при удале­нии он только вырезается.

В процессе работы над документом иногда бывает необ­ходимо заменить одно многократно встречающееся слово на другое (например, слово “ЭВМ” на слово “компьютер”). В этом случае можно использовать функцию текстового редак­тора Заменить. При вводе запросов на замену можно использовать звездочку (*), которая маскирует про­извольное число символов или знак вопроса (?), который за­меняет любой единичный символ.

 


Редактирование документа.

1. Открыть документ, например, МБ.doc.

2. Ввести команду [Редактирование-Заменить...]. На поя­вившейся диалоговой па­нели Редактирование-заменить на вкладке Заменить в поля Найти: и Заме­нить на: необходимо ввести соответствующие последовательности символов.

Вставка объектов в документ. Объектно-ориентирован­ный подход позволяет реализовать механизм встраивания и внедрения объектов (OLE — Object Linking Embedding). Этот механизм позволяет копировать и вставлять объекты из од­ного приложения в другое. Например, работая с документом в текстовом редакторе Word, в него можно встроить изобра­жения, анимацию, звук и даже видеофрагменты и таким об­разом из обычного текстового документа получить мульти­медиа документ.

Вставка объектов в документ

1. Например, для вставки в документ рисунка необхо­димо ввести команду [Вставка-Иллюстрации...], поя­вится диалоговая панель.

 

Проверка орфографии и синтаксиса. Для проверки ор­фографии (правильности написания слов) и синтаксиса (пра­вильного построения предложений) используются специаль­ные программные модули, которые обычно включаются в состав текстовых процессоров и редакционно-издательских систем. Такие системы содержат словари и грамматические правила для нескольких языков, что позволяет исправлять ошибки в многоязычных документах. На ленте выбрать РЕЦЕНЗИРОВАНИЕ, далее правописание.

Печать документа. Перед выводом документа на печать полезно предварительно просмотреть, как будет выглядеть документ на бумаге, так как его вид может зависеть от ис­пользуемого принтера.

 


Практические задания
1. В текстовом документе произвести замену всех букв “а” на бук­ву “о”.
2. В текстовый документ сначала вставить готовый рисунок из файла, а затем рисунок, созданный в приложении Paint.

II. Различные форматы текстовых файлов (документов)

Формат файла определяет способ хранения текста в фай­ле. Простейший формат текстового файла содержит только символы (числовые коды символов), другие же форматы со­держат дополнительные управляющие числовые коды, кото­рые обеспечивают форматирование текста.

Существуют универсальные форматы текстовых файлов, которые могут быть прочитаны большинством текстовых ре­дакторов, и оригинальные форматы, которые используются отдельными текстовыми редакторами. Для преобразования текстового файла из одного формата в другой используются специальные программы — программы-конверторы. В хоро­ших текстовых редакторах такие конверторы входят в со­став системы.

Рассмотрим некоторые наиболее распространенные фор­маты текстовых файлов.

Только текст ( Text Only) (TXT). Наиболее универсальный формат. Сохраняет текст без форматирования, в текст встав­ляются только управляющие символы конца абзаца. Приме­няют этот формат для хранения документов, которые дол­жны быть прочитаны в приложениях, работающих в различных операционных системах.

Текст в формате RTF (Rich Text Format) (RTF). Универ­сальный формат, который сохраняет все форматирование. Преобразует управляющие коды в команды, которые могут быть прочитаны и интерпретированы многими приложени­ями, в результате информационный объем файла сущест­венно возрастает.

Документ Word (DOC). Оригинальный формат используе­мой в настоящее время версии Word. Полностью сохраняет форматирование. Использует 16-битную кодировку симво­лов, что требует использования шрифтов Unicode.

HTML-документ (НТМ, HTML). Формат хранения Web-страниц. Содержит управляющие коды (тэги) языка размет­ки гипертекста.

Сохранение и открытие документа в определенном формате

1. Ввести команду [Файл-Сохранить как...].

С помощью диалоговой панели Сохранение документа выбрать папку для сохранения документа, в раскрываю­щемся списке Имя файла: присвоить документу имя и в раскрывающемся спис­ке Тип файла: выбрать требуемый формат.


Преобразование формата текстового документа можно также производить в процессе его открытия в редакторе. Например, для того чтобы преобразовать документ, суще­ствующий в формате RTF, в формат документа Word, нуж­но ввести команду [Файл-Открыть...], на открывшейся диалоговой панели Открытие документа выбрать файл, а в окне раскрывающегося списка Тип файла: выбрать ва­риант Текст в формате RTF. В процессе загрузки файла будет произведено преобразование формата документа.

Практическое задание.
Создать текстовой документ в редакторе Word и сохранить его в таком формате, чтобы его можно было прочитать в стандартном приложении WordPad и в стандартном приложении Блокнот.  

 

III. Форматирование документа

 

Основными объектами документа являются страница, аб­зац и символ. Для каждого из этих объектов необходимо за­дать значения параметров форматирования, которые опреде­ляют внешний вид документа.

Выбор параметров страницы.

Любой документ состоит из страниц, поэтому в начале ра­боты над документом необходимо задать значения пара­метров страницы: формат, ориентацию, размер полей и др.

При создании реферата или заявления целесообразно вы­брать формат страницы А4 (21х29,7 см), который соответст­вует размеру стандартного листа бумаги для принтера. Для объявлений и плакатов подходит формат A3, размер которо­го в два раза больше стандартного листа. Наоборот, для пи­сем можно выбрать формат А5, который в два раза меньше стандартного листа.

Существуют две возможные ориентации страницы — книжная и альбомная. Для обычных текстов чаще всего ис­пользуется книжная ориентация, а для таблиц с большим количеством столбцов — альбомная.

 

Параметры страницы

1. Ввести команду [Разметка страницы.. Параметры страницы.]. Появится диалоговая па­нель Параметры страни­цы с тремя вкладками Поля, Размер бумаги. Ис­точник бумаги. На вкладке Размер бума­ги с помощью раскрываю­щегося списка Размер бумаги необходимо выбрать используемый формат (реко­мендуется формат стандартного листа А4), а также ори­ентацию страницы с помощью переключателя Ориента­ция: (книжная или альбомная).

 

На странице можно установить требуемые размеры полей (верхнего, нижнего, правого и левого), которые определяют расстояние от краев страницы до границы текста. Для выво­да на каждой странице документа одинакового текста (на­пример, имени автора, названия документа и др.) удобно ис­пользовать верхний или нижний колонтитул. Расстояние от края страницы до колонтитула можно изменять.

2. На вкладке Поля задать размеры полей (расстоя­ния от краев страницы до границы области редак­тирования) с помощью счетчиков Верхнее, Ниж­нее, Левое и Правое. Расстояния от краев страницы до колонтиту­лов задать с помощью счетчиков верхнего: и нижнего:

Страницы документа требуется нумеровать, причём можно размещать по-разному (вверху или внизу страницы, по центру, справа или слева).

 

 

3. Ввести команду [Встав­ка-Номера страниц...]. На вкладке Номера стра­ниц задать местоположе­ние номера и его формат.

 

Практическое задание. Измените ориентацию страницы на альбомную. Прономеруйте страницы.

 

 

Форматирование абзацев

Абзац является одним из основных объектов текстового документа. Абзац с литературной точки зрения- это часть текста, представляющая собой законченный по смыслу фрагмент произведения, окончание которого служит естест­венной паузой для перехода к новой мысли.

В компьютерных документах абзацем считается любой текст, заканчивающийся управляющим символом (марке­ром) конца абзаца. Ввод конца абзаца обеспечивается нажа­тием клавиши { Enter} и отображается символом, если включен режим отображения непечатаемых символов.

Форматирование абзацев

1. Абзац может состоять из любого набора символов, рисун­ков и объектов других приложений. Форматирование абза­цев позволяет подготовить правильно и красиво оформлен­ный документ.

Выравнивание абзацев. Выравнивание отражает располо­жение текста относительно границ полей страницы. Чаще всего используют четыре способа выравнивания абзацев:

По левому краю — левый край ровный, а правый рва­ный.

По центру — оба края имеют неровные очертания, од­нако каждая строка абзаца симметрична относительно

середины.

По правому краю — правый край ровный, а левый рва­ный.

По ширине — оба края ровные, то есть располагаются точно по границам страницы. В этом случае последняя строка абзаца ведет себя как при левостороннем выравнивании.


Отступ первой строки (красная строка). Чаще всего абзац начинается отступом первой строки. Отступ может быть раз­личных типов. Положительный отступ (отступ), когда первая строка начинается правее всех остальных строк абзаца, применяется в обычном тексте.

Отрицательный отступ (выступ), когда первая строка выходит влево относительно остальных строк абзаца, применяется в словарях и определениях.

Нулевой отступ, применяется для абзацев, выровненных по центру и для обычного текста.           

Отступы и интервалы. Весь абзац целиком может иметь отступы слева и справа, которые отмеряются от границ по­лей страницы. Так, эпиграф к художественному произведе­нию или реквизиты адресата в заявлении имеют отступ сле­ва, а при изготовлении углового штампа можно использо­вать отступ справа.

Отступ абзаца слева, все строки абзаца смещены на заданное расстояние впра­во.

Отступ абзаца справа, все строки абзаца смеще­ны на заданное расстояние влево.

2. Для выравнивания абза­ца ввести команду [Фор­мат-Абзац...] и на поя­вившейся диалоговой панели Абзац сделать не­обходимые установки. На вкладке Отступы, и интервалы для установ­ки типа выравнивания выделенных абзацев вы­брать соответствующий элемент раскрывающе­гося списка Выравнива­ние.


Для установки типа отступа первой строки абзаца вы­брать необходимое значение в раскрывающемся списке первая строка: и установить конкретное числовое значе­ние отступа с помощью счетчика на:. Для задания отступа абзаца целиком от границ полей страницы выбрать нужное значение отступа с помощью счетчиков Отступ слева: и справа:. Для того чтобы текст выходил на левое (правое) поле страницы, задать отрицательное значение отступа.

 

Расстояние между строками документа можно изменять, задавая различные значения междустрочных интервалов (одинарный, двойной и так далее). Для визуального отделе­ния абзацев друг от друга можно устанавливать увеличен­ные интервалы между абзацами.

3. Межстрочный интервал выбирают с помощью выпадаю­щего списка междустрочный:, а интервал перед (после) абзаца — с помощью счетчиков Интервал перед: и после:.

4. Вкладка Положение на странице позволяет установить требуемое распределение абзацев по страницам, то есть можно запретить разры­вать абзац между стра­ницами, оставлять на странице первую или по­следнюю (висячую) строку и так далее. Часто бывает полезно за­претить в абзаце автома­тический перенос слов.

Практическое задание.

Набрать и отформатировать текст по образцу:

Абзац с выравниванием по ширине, отступ слева 6 см, шрифт Times New Roman, размер 12 пт, нормальный.


Абзац с выравниванием по центру, шрифт Arial, размер 14 пт, полужирный.

Абзац с выравниванием по левому краю, отступ пер­вой строки, шрифт Courier, размер 10 пт, курсив.

Списки.

Списки применяются для размещения в документе раз­личных перечней. Существуют списки различных типов:

• нумерованные списки, когда элементы списка сопровож­даются арабскими или римскими числами и буквами;

• маркированные списки, когда элементы списка отмеча­ются с помощью специальных символов-маркеров: •, &, и др.

Возможно создание и вложенных списков, причем вкла­дываемый список может по своему типу отличаться от основного.

 

Списки.

1. На ленте Главная Выбрать команду [Фор­мат-Список...] и на диалого­вой панели Списки на вклад­ке Маркерованный выбрать требуемый тип маркерованного списка.

Для детальной установки па­раметров списка щелкнуть по кнопке Изменить.

 

Таблицы.

Таблица является объектом, состоящим из строк и столбцов, на пересечении которых образуются ячейки. В ячейках таблиц могут быть размещены различные данные (текст, числа и изображения). С помощью таблиц можно форматировать документы, например, расположить абзацы в несколько рядов, совместить рисунок с текстовой подпи­сью и так далее.

При размещении в таблице чисел можно производить над ними вычисления по формулам: суммирование, умножение, поиск максимального и минимального чисел и др.

Преобразовать имеющийся текст в таблицу можно с по­мощью команды [Таблица-Преобразовать в таблицу...], од­нако часто бывает удобнее сначала создать таблицу и лишь затем заполнить ее данными. При вставке в документ табли­цы можно задать необходимое количество столбцов и строк.

Таблицы.

1. Вставить в документ таб­лицу можно при помощи команды [Таблица-Вставить таблицу...], указав на панели Вставка таб­лицы в соответствующих полях ввода число строк и столбцов создаваемой таблицы.

 

Можно подобрать подходящий дизайн таблицы, изменив тип, ширину и цвет границ ячеек, а также цвет фона ячеек. Изменение внешнего вида таблицы можно провести автома­тически или вручную.

 

3. Форматирование таблицы вручную можно выполнить, щелкнув правой кнопкой мыши внутри таблицы. Далее выбрать Свойства таблицы

 

4. Диалоговая панель Грани­цы. и заливка позволяет вы­брать требуемые парамет­ры.

На вкладке Граница можно задать тип границы (Нет, Сетка, Рамка и др.), тип и ширину линий границы. На вкладке Заливка можно за­дать цвет фона ячеек или выбрать узор.

 

 

Редактирование структуры таблиц. Изменение ширины столбцов или высоты строк реализуется с помощью мыши (перетаскиванием границ). Задать точную ширину столбца (высоту строки) можно с помощью команды [Таблица-Столбец (или строка или ячейка)...].

Вставка или удаление строк и столбцов в имеющуюся таблицу производится с помощью команд Вставить/уда­лить строку (столбец) меню Таблица.

 


Практическое задание.   Создать документ, содержащий расписание занятий. Применить различные варианты форматирования таблиц (шрифт, вырав­нивание, границы и фон ячеек).

 


Форматирование символов.

Символы являются теми основными объектами, из кото­рых состоит документ. Символы — это буквы, цифры, про­белы, знаки пунктуации, специальные символы, такие как @, *, &. Символы можно форматировать (изменять их внеш­ний вид).

Среди основных свойств символов можно выделить следу­ющие: шрифт, размер, начертание и цвет.

Шрифт. Шрифт — это полный набор символов опреде­ленного начертания, включая прописные и строчные буквы, знаки препинания, специальные символы, цифры и знаки арифметических действий. Для каждого исторического пе­риода и разных стран характерен шрифт определенного ри­сунка.

Каждый шрифт имеет свое название, например Times New Roman, Arial, Courier и др.

По способу представления в компьютере различаются шрифты растровые и векторные. Для представления растро­вых шрифтов используются методы растровой графики, и символы шрифта представляют собой группы пикселей. Рас­тровые шрифты допускают масштабирование только с опре­деленными коэффициентами.

В векторных шрифтах символы описываются математи­ческими формулами и допускают произвольное масштабиро­вание. Среди векторных шрифтов наибольшее распростране­ние получили шрифты типа True Туре.

Обычно различные символы шрифта имеют и различную ширину, например буква “Ш” шире, чем буква “А”. Однако имеются и моноширинные шрифты, в которых ширина всех символов одинакова. Примером такого шрифта является шрифт Courier.

Шрифты также разделяют на две следующие группы: шрифты, с засечками (например. Times New Roman) и рубле­ные (например, Arial). Считается, что шрифты с засечками легче воспринимаются глазом, видимо, поэтому в большин­стве печатных текстов используются именно они. Рубленые шрифты используют обычно для заголовков, выделений в тексте и подписей к рисункам.

Шрифт.

1. Полезно ознакомиться с набором шрифтов, установлен­ных на компьютере. Для этого необходимо ввести коман­ду [Шрифт] на ленте Главная.

Размер шрифта. Единицей измерения размера шрифта яв­ляется пункт (1 пт = 0,376 мм). Размеры шрифтов можно из­менять в больших пределах (обычно от 1 до 1638 пунктов), причем в большинстве редакторов по умолчанию использует­ся шрифт размером 10 пт. Ниже приведены примеры пред­ставления текста при различных размерах шрифта.

Шрифт размером 16 пт.

Шрифт размером 12 пт.

Шрифт размером 8 пт.

Начертание и вид символов. Кроме нормального (обычно­го) начертания символов обычно применяют полужирное, курсивное, полужирное курсивное.

Можно установить дополнительные параметры формати­рования символов: подчеркивание символовразличнымитипамилинии, изменение вида символов ( верхний индекс, нижний индекс, зачеркнутый), изменение расстояния между символами (разреженный, уплотненный) и др.

Цвет символов. Если планируется многоцветная печать документа, то для различных групп символов можно задать различные цвета, выбранные из предлагаемой текстовым ре­дактором палитры.

 

2. Для форматирования шрифта необходимо ввести коман­ду [Формат-Шрифт...], которая открывает диалоговую панель Шрифт.

 

На вкладке Шрифт мож­но с помощью раскрываю­щихся списков выбрать шрифт, размер, начерта­ние, цвет символов, вари­анты подчеркивания. Кроме того, можно уста­новить с помощью группы флажков Эффекты: до­полнительные параметры форматирования симво­лов

: верхний индекс, ниж­ний индекс и так далее.

Практическое задание. Создать документ, содержащий десять строк, записанных раз­личными шрифтами.

 

 

Компьютерные словари и системы машинного перевода текстов

Компьютерные словари. Словари необходимы для пере­вода текстов с одного языка на другой. Первые словари были созданы около 5 тысяч лет назад в Шумере и представ­ляли собой глиняные таблички, разделенные на две части. В одной части записывалось слово на шумерском языке, а в другой — аналогичное по значению слово на другом языке, иногда с краткими пояснениями.

Современные словари построены по такому же принципу. В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и так далее), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, где поиск нужного слова является достаточно трудоемким процессом.

Компьютерные словари могут содержать переводы на раз­ные языки сотен тысяч слов и словочетаний, а также предо­ставляют пользователю дополнительные возможности.

Во-первых, компьютерные словари могут являться мно­гоязычными, так как дают пользователю возможность вы­брать языки и направление перевода (например, англо-рус­ский, испано-русский и так далее).


Во-вторых, компьютерные словари могут кроме основно­го словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техни­ка, медицина, информатика и др.).

В-третьих, компьютерные словари обеспечивают быстрый поиск словарных статей: “быстрый набор”, когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода сло­восочетаний и др.

В-четвертых, компьютерные словари могут являться мультимедийными, то есть предоставлять пользователю воз­можность прослушивания слов в исполнении дикторов, но­сителей языка.

Среди российских словарей следует выделить словарь Lingvo, который содержит более 1,2 миллиона слов и слово­сочетаний, систему электронных словарей “Контекст” и словарь “Мультилекс”, который базируется на использова­нии лучших академических словарей.

Системы машинного перевода. Происходящая в настоя­щее время глобализация нашего мира приводит к необходи­мости обмена документами между людьми и организация­ми, находящимися в разных странах мира и говорящими на различных языках.

В этих условиях использование традиционной техноло­гии перевода “вручную” тормозит развитие межнациональ­ных контактов. Перевод многостраничной документации вручную требует длительного времени и высокой оплаты труда переводчиков. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страни­цы необходимо осуществить немедленно, и нет возможности и времени пригласить переводчика.

Системы машинного перевода позволяют решить эти проблемы. Они, с одной стороны, способны переводить мно­гостраничные документы с высокой скоростью (одна страни­ца в секунду) и, с другой стороны, переводить Web-страни­цы “на лету”, в режиме реального времени. Лучшими среди российских систем машинного перевода считаются PROMT и “Сократ”.

Системы машинного перевода осуществляют перевод текстов, основываясь на формальном “знании” языка (син­таксиса языка — правил построения предложений, правил словообразования) и использовании словарей. Програм­ма-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке.

Современные системы машинного перевода позволяют до­статочно качественно переводить техническую документа­цию, деловую переписку и другие специализированные тек­сты. Однако они неприменимы для перевода художествен­ных произведений, так как не способны адекватно перево­дить метафоры, аллегории и другие элементы художествен­ного творчества человека.

Системы оптического распознавания документов

Системы оптического распознавания символов. При со­здании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному доку­ментообороту, при необходимости отредактировать получен­ный по факсу документ используются системы оптического распознавания символов.

С помощью сканера достаточно просто получить изобра­жение страницы текста в графическом файле. Однако для получения документа в формате текстового файла необходи­мо провести распознавание текста, то есть преобразовать элементы графического изображения в последовательности текстовых символов.

Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображе­ния и так далее. Далее выделенные текстовые фрагменты графического изображения страницы необходимо преобразо­вать в текст.

 

Если исходный документ имеет типографское качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания реша­ется методом сравнения с растровым шаблоном. Сначала растровое изображение страницы разделяется на изображения отдельных символов. Затем каждый из них по­следовательно накладывается на шаблоны символов, имею­щихся в памяти системы, и выбирается шаблон с наимень­шим количеством отличных от входного изображения точек.

 

Растровые шаблоны символов

При распознавании документов с низким качеством печа­ти (машинописный текст, факс и так далее) используется метод распознавания символов по наличию в них определен­ных структурных элементов (отрезков, колец, дуг и др.).

Любой символ можно описать через набор значений пара­метров, определяющих взаимное расположение его элемен­тов. Например, буква “Н” и буква “И” состоят из трех от­резков, два из которых расположены параллельно друг другу, а третий соединяет эти отрезки. Различие между дан­ными буквами — в величине углов, которые образует третий отрезок с двумя другими.

При распознавании структурным методом в искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. В результате выбирается тот символ, для которого совокуп­ность всех структурных элементов и их расположение боль­ше всего соответствует распознаваемому символу.

Наиболее распространенные системы оптического распо­знавания символов FineReader и CuneiForm используют как растровый, так и структурный методы распознавания. Кро­ме того, эти системы являются “самообучающимися” (для каждого конкретного документа они создают соответствую­щий набор шаблонов символов) и поэтому скорость и качест­во распознавания многостраничного документа постепенно возрастают.

 

 

Литература:

Основная: 1. М.Г. Гилярова «Информатика для медицинских колледжей» Ростов-на-Дону, Феникс, 2017

Дополнительная: В.П. Омельченко, А.А. Демидова Информатика. Учебник для медицинских училищ и колледжей, Москва, Геотар- Медиа, 2016


Дата добавления: 2020-04-25; просмотров: 133; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!