Определяет ту инфу, которая должна быть представлена в тексте



Определяет, как инфа должна быть представлена

Осуществляет построение синтаксической структуры предложений

Определяет порядок следования абзацев в тексте

Осуществляет выбор соответствующей лексики

Все эти задачи планировщик решает с порой на оболочку.

Лингвистический реализатор обеспечивает грамматическую правильность порождаемого текста и принимает окончательные синтаксические и морфологические решения.

Виды компьютерных систем порождения текста:

Системы, работающие на основе шаблонных технологий. Они строят будущий текст, манипулируя готовыми предложениями, словосочетаниями, как строительными блоками.

Эти системы достаточно просты и надежны, находят широкое промышленное применение. Содержание порождаемого текста представлено в виде фрагментов, созданных ранее людьми, следовательно выглядят естественно.

Компьютерные системы, работающие на основе лингвистически-мотивированных технологий. В это случае для создания текста системе необходимы знания структуры содержания порождаемого текста, а также сложные лингвистические знания, которые позволяют выразить это содержание языковыми средствами. Для создания таких систем необходимо изучить жанровые характеристики текстов, приемы организации содержания этих текстов. Промышленных систем не существует.

Системы распознавания речи

Несмотря на то, что проблемами распознавания устной речи ученые занимаются более 60 лет, до сих пор она в полном объеме не решены. Под распознавание речи компом в полном объеме понимается такое распознавание, которое подобно восприятию речи человеком в любых условиях. Механизм восприятия речи человеком обладает высокой степенью надежности. Решения проблемы распознавания речи в полном объеме мешают следующие факторы:

Не существует четких теоретических представлений, которые бы описывали весь комплекс преобразований, осуществляемых нервной системой при переработке речевых сигналов

Слитно произнесенная речь обладает следующими свойствами – границы слов размыты. Во многих языках, где существуют согласные, которые не произносятся, но пишутся, и если знаменательные слова произносятся отчетливо, то функциональные слова нечетко и даже могут исчезать.

В голосе говорящего человека всегда присутствует экстралингвистическая инфа, свидетельствующая о его особом эмоциональном состоянии, указывающая на возраст, пол, национальность

4. в процессе речевого общения большое значение имеют паралингвистические средства коммуникации: кинесика (мимика, жесты, позы), фанация (характеристики голоса человека), проксемика (расстояние между людьми). Исходя из вышеизложенного, сегодня автоматическое распознавание речи может осуществляться только при наложении определенных ограничений на процесс распознавания:

- распознавание изолированно произнесенных слов

- распознавание речи с предварительной настройкой на голос конкретного пользователя

- распознавание речи с опорой на небольшой, заранее определенный словарь

Промышленно-реализованные системы распознавания устной речи можно разделить на 4 группы:

Средства речевого управления (ПК, мобилки, бытовая техника)

Средство диктовки, позволяющее голосом вводить текстовую инфу

Информационно-справочные системы, работающие в диалоговом режиме в качестве автоответчика

Средство идентификации человека по образу речи

Системы автоматического синтеза речи

3 основных метода автоматического синтеза речи:

Кодирование (запись в двоичной системе речевых сигналов с их последующим  . Это один из самых элементарных подходов к созданию говорящего компа.

Комп в данном случае выступает как устройство для записи речи – магнитофон, слова и фразы, записанные ранее в комп в нужный момент воспроизводятся по командам, поступающим из соответствующей программы.

Возможность сказать слово или фразу, которые не были заранее занесены в память, здесь отсутствует. Еще недостаток – для хранения речевых сигналов в их непосредственной форме нужна память значительного объема. Полученная таким образом речь по качеству приближается к человеческой.

Фонетический синтез речи (акустическое моделирование голосового тракта человека) Принципиально отличается от описанного выше метода и имеет неестественное звучание. Синтезатор говорит голосом робота. Этот метод осуществляется по орфографическому тексту, написанному человеком. Комп умеет преобразовать буквы в фонемы, определить словесное фразовое ударение, интонацию, с которой нужно прочитать каждое предложение, преобразовать фонемы в их варианты алфавита и синтезировать непрерывный речевой сигнал с использованием аллофонов конкретного диктора, выбираемых из базы данных.


Дата добавления: 2022-01-22; просмотров: 19; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!