Где можно найти информацию об антонимах, гиперонимах, гипонимах и синонимах английского языка?



Примеры словарей:

 

 

12. Что представляет собой электронный корпус текстов?

Корпус - большой массив естественных текстов языка, письменных и устных, представленных на машинном носителе и должным образом упорядоченных с целью их использования в научных или практических целях. Исследование концептуальной картины невозможно без помощи компьютерного корпуса. Тематической корпус - обширная по объёму подборка текстов по конкретной тематике, специально составленная для поиска переводчиком определенной лингвистической информации. Тематический корпус работает в сочетании с программой конкорданснером. Программа конкордансер- специализированная программа, позволяющая автоматически построить список контекстов, в которых слово или словосочетание предстаёт в своём лексическом окружении и представляет полученные результаты в удобной форме.

Список компьютерных корпусов:

American national corpus http.anc.org

British national corpus http.corpus.byu.edu/bnc

The bank of English http.www.titania.bham.ac.uk/docs/swenguide.html

International corpus of English London Lund corpus of British English Http.www.Essex.ac.uk/linguistics Национальный корпус русского языка

ПОЛЬЗА КОРПУСА С помощью корпуса можно проверить правильность тех или иных решений, найденных переводчиком. Корпус помогает найти дефиницию термина не зафиксированного в словаре или глоссарии. К. помогает найти терминологические дублеты (эквиваленты), антонимы, номенклатурные наименования, расшифровку сокращений.

ИСПОЛЬЗОВАНИЕ КОРПУСОВ определение лексико-грамматической сочетаемости слова Выбор из нескольких вариантов Лексических эквивалентов Поиск дополнительной энциклопедической информации по теме

ПРЕИМУЩЕСТВА КОРПУСОВ дают представление о типологической, синтаксической сочетаемости быстрый поиск лингвистически релевантной информации в автономном режиме Высокая степень репрезентативности Регулярное пополнение состава корпуса и расширение объема выборки Возможность проведения собственноготисследования и принятия решения относительно типовой сочетаемости искового слова в языке перевода.

СПЕЦИАЛИЗИРОВАННЫЕ КОРПУСА В ПЕРЕВОДЕ Применение спец корпусов позволяет сократить время и усилия, которые необходимы переводчику для проверки принятого переводчиком решения. Использование корпуса помогает снизить субъективизм при отборе оптимальных вариантов и помогает отсечь допустимые и недопустимые варианты.

2 ВИДА КОРПУСОВ: НАЦИОНАЛЬНЫЕ И СПЕЦИАЛИЗИРОВАННЫЕ (полезны переводчикам экономической, технической тематики) Как правило специализированные корпуса создают сами переводчики- эти корпуса могут обнаруживаться в сети под названиям ad hoc, disposable, diy corpora.

ВИРТУАЛЬНЫЙ СПЕЦИАЛИЗИРОВАННЫ КОРПУС -обширная подборка текстов по конкретной тематике, специально составленная для поиска переводчику определенной лингвистической информации.

Основные свойства корпуса

* электронный — в современном понимании корпус должен быть в электронном виде

* репрезентативный — должен хорошо «представлять» объект, который моделирует

* размеченный — главное отличие корпуса от коллекции текстов

* прагматически ориентированный — должен быть создан под определенную задачу

Классификация корпусов

Классификацировать корпусы можно по различным признакам: цель создания корпуса, тип языковых данных, «литературность», жанр, динамичность, тип разметки, объем текстов и так далее. По критерию параллельности, например, корпусы можно разделить

на одноязычные, двуязычные и многоязычные. Многоязычные и двуязычные делятся на два типа:

1. параллельные — множество текстов и их переводов на один или несколько языков

2. сопоставимые (псевдопараллельные) — оригинальные тексты на двух или нескольких языках

ДОПОЛНИТЕЛЬНАЯ ИНФА НА ВСЯКИЙ СЛУЧАЙ

Чем электронный корпус отличается от электронной библиотеки?

Электронная библиотека — это собрание текстов в электронной форме. Корпус — это также собрание текстов в электронном виде, но эти тексты предназначены не для того, чтобы их читать, а для того, чтобы их изучать, для чего их особым образом обрабатывают — вносят необходимую информацию, которая называется разметкой или аннотацией. После того, как корпус обработали, мы можем искать в нем любую необходимую нам информацию. Для обработки информации используются специальные программы, которые называются конкордансеры. Они осуществляют поиск по тексту подобно тому, как поисковая система ищет информацию в Сети, и формируют конкорданс, то есть перечень всех контекстов, в которых какое-либо слово или словосочетание встречается в исследуемом тексте.

Большой корпус, который включает в себя тексты из различных источников

Зачем нужны электронные корпусы?

Корпус позволяет решать задачи, связанные с исследованием больших массивов текста. Корпусы — незаменимый инструмент работы для всех, кто занимается теоретической лингвистикой, полезны для литературоведов, историков,авторов учебных пособий, составителей словарей и справочников, так как корпус позволяет за несколько секунд найти тысячи примеров употребления того или иного слова или грамматической конструкции. Анализ и обработка разных типов корпусов являются предметом большинства работ в области компьютерной лингвистики (например, извлечение ключевых слов), распознавания речи и машинного перевода, в которых корпусы часто применяются при создании скрытых марковских моделей для маркирования частей речи и других задач. Корпусы и частотные словари могут быть полезны в обучении иностранным языкам. Брита́нский национа́льный ко́рпус (BNC от англ. British National Corpus) — это корпус текстов из 100 миллионов слов, содержащий образцы письменного и разговорного британского английского языка из широкого круга источников

История В рамках проекта по созданию BNC сотрудничали три издателя (Издательство Оксфордского университета в качестве ведущего соавтора, а также Longman и W. & R. Chambers[en]), два университета (Оксфордский и Ланкастерский) и Британская библиотека. Создание BNC началось в 1991 году под руководством консорциума BNC и было закончено к 1994 г. BNC является одноязычным[en] корпусом. Это синхронический корпус, так как в нём содержатся примеры использования языка только одного временного периода — конец XX века. По этой причине BNC не может служить источником данных о истории развитии британского варианта английского языка[4]. С самого начала те, кто участвовал в сборе письменных данных, стремились сделать BNC сбалансированным корпусом и, следовательно, искали и включали данные из различных источников[3].

Недостатки и ограничения BNC

Слишком общая классификация текстов

Ошибки классификации и обманчивые заголовки (При создании корпуса некоторые тексты были неправильно категоризированы, зачастую из-за вводящих в заблуждение заголовков)

Нехватка разговорного материала Соотношение письменного и разговорного материала в BNC — 10:1[6]. Это связано с тем, что затраты на сбор, транскрибирование и перевод в электронную форму миллиона слов речи, встречающейся в реальных условиях, по крайней мере в 10 раз больше, чем затраты на добавление миллиона слов из газет.

Ограниченные возможности изучения лексических взаимосвязей Взаимосвязи между некоторыми лексическими единицами слишком неоднозначны, чтобы их было возможно эффективно обнаруживать с помощью поисковых запросов

Ограниченное описание ситуаций

По материалам корпуса можно определить, произносится ли речь мужчиной или женщиной, но по ним невозможно выяснить, к кому обращается человек, произносящий речь — к мужчине или к женщин

Неприменимо для изучения специальных типов текстов

BNC — очень разнообразный и смешанный корпус, поэтому для исследования каких-либо крайне специфичных типов или жанров текстов он не подходит, так как такой тип или жанр скорее всего будет представлен крайне ограничено и тексты такого типа непросто найти в корпусе.

13.

14.

15.

16. Что такое конкорданс? Как представлена лингвистическая информация в Программе-конкордансере?

К лингвистическим ресурсам, кроме лексических баз данных, грамматических справочников и терминологических справочников относятся корпуса текстов. Многие зарубежные переводоведы и исследователи отмечают важность этого аналитического ресурса для перевода. Корпуса аутентичных текстов позволяют рассматривать языковые элементы в контексте. Средством обеспечения работы с электронными корпусами текстов являются программы-конкордансы. Программа-конкорданс – это программное обеспечение, предназначенное для извлечения (и отображения на экране компьютера) всех случаев вхождения слова или фразы в контексте языковых элементов, располагаемых справа и слева от ключевой единицы, на основе загружаемого для целей исследования определенного корпуса текстов. Программа-конкорданс позволяет быстро установить лингвистические условия функционирования той или иной лингвистической единицы и поэтому представляет огромный интерес для лингвиста, лексикографа и переводчика. Программы-конкордансы не заменяют такие средства, как словари и глоссарии, а обеспечивают альтернативный метод обработки текста при переводе. Цель такого поиска – установление структур, которые вызывают при переводе сомнения или требуют уточнения. Для поиска можно вводить часть слова, например, префикс или суффикс, целиком слово или группу слов. Программы-конкордансы предоставляют также статистические сведения: количество слов, классифицируют слова по частотности или в алфавитном порядке и самое важное для переводчика – показывают искомую единицу именно в том контексте, в котором она встречается. Составление конкорданса даёт возможность получить статист. данные о частотности слова и соседних слов, даёт возможность определить наиболее частотные сочетания с этим словом.

Полученная информация может накапливаться и сохраняться по мере перевода текстов. Программы-конкордансы позволяют переводчику получить информацию о той или иной лингвистической единице в тексте любой длины и сложности.


Дата добавления: 2018-08-06; просмотров: 526; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!