В каком формате представлены файлы текстов в специализированном (виртуальном) корпусе?



Лингвисты очень высоко оценивают возможности специализированных корпусов, используемых в интересах переводчиков совместно с программами-конкордансерами. Так, К. Варантола считает, что виртуальные корпуса дают переводчику огромные возможности для решения возникающих переводческих проблем (Varantola, Krista (2003)TranslationandDisposableCorpora.–In:FedericoZanettin, SilviaBernardiniandDominicSteward (eds.) Corpora inTranlator Education. –Vanchester: St.Jerome. – P. 59). Более того, они являются источником дополнительной энциклопедической и языковой информации, которую нельзя найти в таких источниках, как словари, Интернет и стилистические руководства (например, о лексико-грамматической сочетаемости слова, словоупотреблении, типовой структуре абзаца и текста в языке перевода и т.д.).Например, конкорданс помогает найти наиболее подходящее в конкретном случае имя прилагательное, выступающее в роли препозитивного определения по отношению к существительному, а двойной щелчок мышкой по этому слову в строке дает возможность увидеть полный контекст, в котором оно употребляется.

Специализированный электронный корпус помогает также понять, что означает тот или иной неизвестный термин, встретившийся в переводимом тексте и не зафиксированный ни в одном из словарей или глоссариев, т.е. для поиска дефиниции.

Кроме того в специализированном корпусе можно отыскать терминологические дублеты, антонимы, референты и номенклатурные наименования, а также расшифровку встретившихся в оригинале сокращений.

18. На каких принципах основывается работа «электронного переводчика»

Принцип работы электронных переводчиков.

На сегодняшний день существует два вида электронного перевода и два принципиально разных подхода к построению алгоритмов электронного перевода:

· основанный на правилах (rule-based),

· основанный на статистике (statistical-based).

Первый вид перевода - автоматизированный (machine-aided или

machine-assisted translation (MAT)). Здесь программа просто помогает переводчику делать перевод. Примером автоматизированного перевода может послужить программа Translation Memory Tools, а точнее Trados.

В группе компаний TechInput основой или базой Translation Memory является система аналогов-сегментов, например, англо-русских и русско-английских фраз и терминологических значений. Эта система создана на основе переводов для основных Заказчиков, осуществлявшихся на протяжении последних 10 лет. База сегментов и терминологических значений постоянно пополняется в процессе выполнения переводов и появления новых аналогов-сегментов и терминов. Таким образом, поддерживается качество переводов и унификация терминологической и фразеологической структур, т.к. все переводчики, включая удаленных, пользуются единой базой Translation Memory.

Если рассмотреть детально, автоматизированный перевод включает в себя несколько форм организации взаимодействия компьютера и человека:

· пред-редактирование - форма редактирования, при которой переводчик приспосабливает текст к обработке программой, устраняя возможные неоднозначные прочтения, упрощает текст, после чего начинается программная обработка,

· интер-редактирование - форма редактирования, при которой переводчик вмешивается в работу программы, разрешая трудные случаи,

· пост-редактирования - форма редактирования, при которой происходит переработка машиной исходного текста, после чего переводчик исправляет ошибки и недочеты в переведенном машиной тексте,

· смешанный - форма редактирования, при которой процесс машинного перевода может включать в себя одновременно пред- и постредактирование.

Второй вид электронного перевода - это собственно электронного перевод, основанный на статике. Он, предположительно, в будущем может составить конкуренцию переводчикам. Такой перевод полностью автоматический, осуществляется без участия редактора. Принцип работы электронного перевода заключается в сравнении больших объемов языковых пар, а точнее на поиске наиболее вероятного перевода предложения с использованием данных, полученных из двуязычной совокупности текстов. Языковые пары — тексты, содержащие предложения на одном языке и соответствующие им предложения на другом. Примером для языковых пар могут послужить параллельные тексты. Как следствие электронный перевод обладает свойством "самообучения", но, не смотря на это, он будет малопригоден, например, для переводов художественной литературы и стихов.

Как утверждает компания Microsoft, говоря об устном электронном переводе, создана математическая технология, которая способна работать по принципу работы человеческого мозга. А точнее, глубокие нейронные сети распознают сеноны (последовательные комбинации фонем) и преобразуют их в речь, что позволяет совершать в три раза меньше ошибок по сравнению с традиционными системами. Но распознавание речи является только первым

этапом перевода. Главная составляющая здесь - преобразование предложений на иностранном языке, применение которых часто осложнено специфическими грамматическими правилами. По этой причине, не смотря на то, что все слова в предложении будут знакомы, электронный перевод может выдать совершенно не правильный перевод, что исключено при переводе переводчиком.

 

19. ABBYY Aligner – это программа предназначенная для автоматизированного выравнивания параллельных текстов. ABBYY Aligner является ценным средством и полезным инструментом для переводчиков, переводческих компаний и их клиентов, позволяет повышать качество и скорость выполнения переводов, минимизировать трудозатраты переводчиков и финансовые расходы их заказчиков. Программа с высокой точностью находит соответствующие друг другу предложения в текстах на разных языках и позволяет сохранить результат в базе переводов Translation Memory или в формате RTF. Автор: http://www.abbyy.ru/aligner Цена: Платная Ссылка: Скачать ABBYY Aligner (149 МБ) Подробное описание ABBYY Aligner ABBYY Aligner значительно облегчает задачу обработки параллельных текстов и создания баз Translation Memory. Программа имеет гибкую схему лицензирования, которая подходит различным заказчикам - как корпоративным, так и индивидуальным. ABBYY Aligner не требователен к техническим характеристикам компьютера, быстро устанавливается и позволяет моментально начать работу. Благодаря 20-летнему опыту ABBYY в лингвистических исследованиях и разработках программа ABBYY Aligner обладает высоким качеством выравнивания параллельных (или двуязычных) текстов. В большинстве подобных программ применяются методы автоматического выравнивания по порядку предложений в тексте. Это приводит к возникновению большого числа ошибок в конечном результате, которые возможно устранить только вручную на этапе постредактирования. Программа ABBYY Aligner обрабатывает параллельные тексты с помощью другого усовершенствованного и более эффективного метода. Используя словарные базы, созданные в ABBYY специально для ABBYY Aligner, программа не просто разбивает тексты на сегменты и сопоставляет их по порядку, а сравнивает сегменты исходного текста с сегментами переведенного текста, проверяя их на смысловое сходство. Таким образом, программа наиболее точно находит соответствующие друг другу сегменты и качественнее выравнивает текст. Основные возможности и преимущества ABBYY Aligner - Работа с 90 направлениями перевода. ABBYY Aligner выравнивает параллельные тексты на 10 языках и работает с любыми из 90 направлений перевода для следующих языков: английский, немецкий, французский, испанский, итальянский, польский, португальский, турецкий, украинский, русский. - Автоматическая обработка большого объема документов (пакетный режим). В ABBYY Aligner реализован пакетный режим обработки файлов – режим, позволяющий поставить в очередь большое количество документов, которые будут выравниваться автоматически без участия пользователя. -Понятный интерфейс и удобство использования. Подобный интерфейс позволяет разобраться с основными элементами в самый короткий срок и делает работу с ABBYY Aligner комфортной и эффективной. - Открытие документов в различных популярных форматах. ABBYY Aligner может открывать стандартные текстовые форматы файлов, документы, созданные в распространенных офисных приложениях, таких как Microsoft Word, Excel, Power Point, а также позволяет

просто скопировать текст из другого приложения с помощью буфера обмена и вставить его в окно редактора ABBYY Aligner. Список поддерживаемых форматов: DOC, DOCX, TXT, RTF, PDF, HTML, PPT, PPTX, XLS, XLSX. - Сохранение результата в формате Translation Memory (стандарт TMX 1.4b) или RTF. TMX (Translation Memory eXchange format) – это международный стандарт, который поддерживается большинством систем для работы с базами TM. Благодаря этому, получив выровненный текст в ABBYY Aligner и сохранив его в формате TMX, можно затем использовать результат в различных других приложениях, например, в CAT-средствах — Computer Assisted Translation Tools, которыми часто пользуются переводчики. Формат RTF используется для различных целей, это стандартный формат для обмена текстовыми документами, он поддерживается многими продуктами Microsoft.

20. Для чего предназначена технология TranslationMemory(TM)? Перечислите наиболее популярные программы ТМ.

Translation Memory - база данных, где хранятся выполненные переводы. Технология ТМ работает по принципу накопления: в процессе перевода в ТМ сохраняется исходный сегмент (предложение) и его перевод. При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами. Если идентичный или подобный исходному сегмент найден, то перевод этого сегмента отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается перевести только новые сегменты и отредактировать частично совпадающие. Каждое изменение или новый перевод сохраняются в ТМ. А в результате, нет необходимости дважды переводить одно и то же предложение!

К программным продуктам класса ТМ относятся Trados, Transit и ряд других.

Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведённые тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП (память переводов) также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведённого текста может ухудшиться.

 

В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и может генерироваться практически всеми системами ПП. Благодаря этому сделанные переводы можно использовать в разных приложениях, то есть переводчик, работающий с OmegaT, может использовать ПП, созданную в Trados, и наоборот.

 

Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

 

Преимущества

Сокращение времени и объёма работы переводчика.

Улучшение последовательности перевода, особенно при работе группы переводчиков над одним проектом.

Увеличение прибыли за счёт увеличения производительности труда переводчика, группы переводчиков.

Повышение качества услуг за счёт увеличения точности и единообразия перевода терминов, особенно в специализированных текстах.

Недостатки

Может делать перевод более «сухим»; утрачивается сама суть текста, если перевод с использованием накопителя переводов выполняется переводчиком низкой квалификации.

Часто отсутствует связь предлагаемого программой предложения/текста с соседними предложениями и с текстом в целом.

Оригинал должен быть в электронном виде.

Одна незамеченная ошибка может распространиться на весь проект.

Необходимо обучение работе в самой программе, а при смене работы — возможно, и не один раз (если работодатели пользуются разными программами ТМ).

Подходит не ко всем видам текстов.

Высокая стоимость лицензионного ПО.

В соответствии с обзорами использования систем ПП к наиболее популярным системам относятся:

 

memoQ

XTM Cloud

Memsource

Deja Vu

OmegaT (бесплатная система, распространяемая по лицензии GNU GPL)

SDLX[3]

Trados

SmartCAT (бесплатная программа со встроенной функцией распознавания PDF)

STAR Transit

Wordfast (реализована как набор макросов для MS Word, новая версия 2009 года является отдельным приложением)

 

Из учебника Шевчука:

Переводчик часто сталкивается с проблемой как выполнить перевод быстро и хорошо или др.словами как перевести большой массив текста быстро и качественно. Ниже варианты ускорения перевода. (Тут я сделала скрин варианта только про Translation Memory, так как вопрос конкретно об этой системе)

21.

22.


Дата добавления: 2018-08-06; просмотров: 190; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!