Полное (без изменения) ключевое предложение исходного текста



Перефразированное ключевое предложение

Предложение, составленное из ключевых слов или словосочетаний с помощью связующих элементов

Предложение, обобщающее несколько предложений исходного текста, не обязательно ключевых

Смысловыми единицами аннотации могут быть:

Ключевые слова или словосочетания исходного текста с предшествующими им словами-реляторами (заранее заготовленные слова)

Специальные предложения исходного текста, содержащие оценочные элементы («рассматривается важная проблема», «ставится задача»)

Комп должен уметь:

Находить в тексте ключевые слова, словосочетания, предложения

Находить в тексте менее значимые единицы

Составлять из текстовых единиц (ключевых слов, словосочетаний) смысловые единицы реферата

Составлять предложения – текст реферата

Методы автоматического реферирования и аннотирования текстов:

Принадлежность слова, словосочетания к числу ключевых определяется специальным статистическим коэффициентом.

- позиционный – где ключевое предложение – это предложение, входящее в заголовок, подзаголовок, начало и конец некоторого фрагмента текста

- логико-семантический – где ключевое предложение – это предложение с наибольшим функциональным весом, на величину которого влияют разные факторы (связь с левым и правым предложениями, наличие в предложении семантически значимых слов)

- статистический – где ключевое слово – знаменательное слово текста, которое с учетом всех его синонимов встречается в тексте наибольшее число раз. Ключевое предложение – предложение, где два и более ключевых слов.

Составление реферата (аннотации) статистическим методом

Используя для выделения ключевых слов текста, один из вариантов статистического метода = F * m / N * n

F – частота употребления слова в тексте

M – число абзацев, в которых встретилось слово

N – число слов в тексте

N – число абзацев в тексте

А) Составить алгоритм, позволяющий получить аннотацию текста в виде релятора со следующими за ним ключевыми словосочетаниями текста. Ключевым словосочетанием – ключ, имя существительное со стоящими перед ним определением, выраженным именем прилагательным или причастием, не относящихся к числу общеупотребительных.

Б) словесный реферат текста в виде последовательной цепочки ключевых предложений. Ключевым считается предложение, содержащее три и более ключевых слов.

Алгоритм решения задачи

Комп по каждому абзацу текста составляет алфавитно-частотный словарь

Алфавитно-частотные словари объединяются в единый распределительный алфавитно-частотный словарь всего текста

ПК проводит чистку словаря, сжимая его до словаря потенциальных, ключевых словоформ

- удаляется вся служебная и общеупотребительная лексика

- объединяются все грамматические формы одного и того же слова

- объединяются синонимы

- удаляются лексические единицы, которые встретились только в одном абзаце

4. словарь потенциально ключевых слов делится а две части:

- главных опорных слов

- второстепенных опорных слов, что осуществляется на основе статистического коэффициента важности.

5. строится аннотация, используется словарь главных опорных слов. Аннотация строится из слов реляторов со следующими за ними словосочетаний

Строится реферат, используется словарь главных и второстепенных опорных слов. Просматривается исходный текст, комп извлекает из него предложения, содержащие три и более опорных слова.

Системы машинного перевода

Перевод – это вид человеческой языковой деятельности, в результате которой текст на одном языке ставится в соответствие тексту на другом языке, при этом обеспечивается их смысловая эквивалентность.

Типы перевода по степени автоматизации:

Традиционный (ручной) перевод, выполняемый человеком

Автоматизированный перевод

А) перевод, выполняемый компом с помощью человека. Компьютер делает перевод, а за справками обращается к человеку.

Б) перевод, выполняемый человеком с помощью компа

- в памяти ПК двуязычный словарь и текстовый процессор

- систему ТМ ( Translation Memory )

Эти программные продукты называют автоматизированным рабочим местом переводчика. В основе этих программ лежит принцип сбора и хранения фрагментов, переведенных человеком текстов на двух языках. Хранятся в специальном носителе переводов (памяти) и служат бесценным подспорьем при последующем выполнении переводов этой же тематики.


Дата добавления: 2022-01-22; просмотров: 41; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!