ИНСТИНКТ ОВЛАДЕНИЯ МАСТЕРСТВОМ 12 страница



Генератор цепочек слов — это простейший образчик дискретной комбинаторной системы, поскольку он способен создать неограниченное количество различных комбинаций из ограниченного количества элементов. Невзирая на пародии, генератор цепочек слов способен составить неограниченное количество наборов грамматически правильных английских предложений. Например, донельзя простая схема

позволяет составить много предложений, таких как: A girl eats ice - cream 'Какая-то девочка ест мороженое' или The happy dog eats candy 'Эта радостная собака ест конфеты'. Эта схема позволяет составить неограниченное количество предложений благодаря петле наверху, которая может направить генератор от списка, представленного словом happy 'радостный', снова к этому же списку любое количество раз: The happy dog eats ice - cream 'Эта радостная собака ест мороженое', The happy happy dog eats ice - cream 'Эта радостная радостная собака ест мороженое', и т.д.

Когда инженеру требуется придумать систему для сочетания слов в определенном порядке, генератор цепочек слов — это первое решение, которое приходит в голову. Запись голоса, сообщающего вам телефонный номер, когда вы звоните в справочную — хороший тому пример. Там име-

80

Глава 4. Механизмы работы языка

ется запись произнесенных человеком десяти цифр, каждая из которых записана в семи различных интонационных моделях (одна соответствует первой цифре номера, одна — второй и т.д.). Имея всего семьдесят этих записей можно составить десять миллионов телефонных номеров; имея еще тридцать записей для трехзначных кодов областей, возможно составление десяти миллиардов номеров (на практике многие из них никогда не используются из-за налагаемых ограничений, например — на присутствие 0 или 1 в начале телефонного номера). В действительности, были сделаны серьезные попытки представить английский язык как одну большую цепочку слов. Чтобы сделать это по возможности реалистичным, переходы от одного списка слов к другому должны отражать действительную вероятность того, что такие типы слов могут следовать друг за другом в английском языке (например, существует ббльшая вероятность того, что за словом that 'это' последует is 'есть', а не indicates 'указывает'). Были составлены колоссальные базы данных этих «вероятностей последующего слова»; это делалось путем компьютерного анализа корпуса текстов на английском языке или опроса добровольцев, которым предлагалось назвать первые слова, пришедшие в голову после того, как они услышат данное слово или ряды слов. Некоторые психологи предполагали, что человеческий язык основан на громадной цепи слов, хранящейся в мозгу. Эта идея созвучна теориям реакции на раздражение: некое раздражение вызывает в качестве реакции произносимое слово, затем говорящий получает вызванную им самим реакцию, которая служит как дальнейший раздражитель, вызывая одно из нескольких слов в качестве очередной реакции и т.д.

Но вызывает подозрения тот факт, что генератор цепочки слов кажется прямо-таки созданным для пародирования, как, например, в романе Фрейна. Суть этих разнообразных пародий в том, что литературный жанр, являющийся объектом иронии, настолько бессмыслен и заезжен, что простой механический метод позволяет наплодить неограниченное количество образчиков этого жанра, которые почти без натяжки могут сойти за истинное произведение. Юмор заключается в следующем несоответствии: по всеобщему признанию, люди (даже социологи и журналисты) не могут на самом деле быть генераторами цепочек слов; они только кажутся таковыми.

Современные грамматические исследования начались тогда, когда Хомский продемонстрировал, что генераторы цепочек слов не просто слегка подозрительны; принцип их работы в корне отличен от принципа работы человеческого языка. Они являются дискретными комбинаторными системами, но не того типа. Возникают три проблемы, каждая из которых освещает один из реальных аспектов работы языка.

Во-первых, предложение на английском языке полностью отличается от цепочки слов, соединенных вместе в соответствии с вероятностью последующего слова, характерной для английского языка. Вспомните предложение Хомского: Бесцветные зеленые мысли спят яростно. Он сочинил его, чтобы показать, что грамматически правильной может быть

Грамматика за работой

81

не только бессмыслица, но и невероятная последовательность слов. Вероятность того, что в английском тексте за словом бесцветные последует слово зеленые, естественно, равна нулю. Нулевой является и вероятность того, что за словом зеленые последует слово мысли, за словом мысли спать, а за спать яростно. Тем не менее, данная цепочка слов — это правильно построенное английское предложение. В противоположность этому, если действительно составлять цепочки слов, пользуясь таблицами вероятности последующего слова, получающиеся в итоге цепочки слов далеки от того, чтобы называться правильно построенными предложениями. Например, вы подбираете ряд слов, которые с наибольшей вероятностью могут последовать за каждой последовательностью из четырех слов, и используете эти подборки, чтобы слово за словом нарастить цепочку слов. При этом вы всегда смотрите на последние четыре слова, чтобы они определили следующее. Цепочка получится извращенно «ан-глийсковатой», но не английской, например: House to ask for is to earn our living by working towards a goal for his team in old New - York was a wonderful place wasn ' t it even pleasant to talk about and laugh hard when he tells lies he should not tell me the reason why you are is evident 'Дом для сдачи внаем должен зарабатывать нам на жизнь, работая над задачей, требующей коллективного решения в старом Нью-Йорке, был чудесным местом, не так ли, даже приятным для обсуждения и громкого смеха, когда он лжет, он не должен говорить мне причину, почему ты являешься очевидным'.

Несоответствие между английскими предложениями и цепочками слов на английском заставляет прийти к двум выводам. Когда люди усваивают язык, они усваивают его, запоминая не то, какое слово должно следовать за каким. Они усваивают его, запоминая, какая часть речи — существительное, глагол и т. д. следует за какой. Таким образом, мы можем признать бесцветные зеленые мысли, поскольку там точно такой же порядок существительных и прилагательных, который мы усвоили на примере более привычных предложений, например, strapless black dresses 'декольтированные черные платья'. Второй вывод будет о том, что существительные, глаголы и прилагательные не просто механически соединены в одну длинную цепочку; для предложений существует некая всеобъемлющая схема, или план, согласно которому каждое слово занимает определенное гнездо.

Если генератор цепочек слов достаточно умно сконструирован, он может справиться с этими проблемами. Но Хомский изначально отвергал саму идею о том, что человеческий язык является цепочкой слов. Он доказал, что некоторые типы английских предложений даже в принципе не могут быть составлены генератором цепочек слов, каким бы большим он ни был, и как точно бы он ни соответствовал таблицам вероятности. Рассмотрим следующие предложения:

Either the girl eats ice - cream , or the girl eats candy 'Или эта девочка ест мороженое, или эта девочка ест конфеты'.

If the girl eats ice - cream , then the boy eats hot dogs 'Если эта девочка ест мороженое, то этот мальчик ест сосиски'.

82

Глава 4. Механизмы работы языка

На первый взгляд кажется, что уместить эти предложения в схему просто:

Но этот генератор не работает. За either 'или' дальше в предложении должно последовать or 'или'; никто не говорит: Either the girl eats ice - cream , then the girl likes candy 'Или эта девочка ест мороженое, то эта девочка любит конфеты'. Аналогично, if 'если' требует then 'то'; никто не говорит: If the girl eats ice - cream , or the girl likes candy 'Если эта девочка ест мороженое, или эта девочка любит конфеты'. Но чтобы удовлетворить потребность слова, стоящего в начале предложения, в каком-то другом слове, стоящем в конце предложения, генератор должен помнить слово, стоящее в начале, все то время, что он продуцирует все слова, расположенные между началом и концом. В этом-то и состоит проблема: генератор цепочек слов подвержен амнезии, запоминая только то, из какого списка он выбрал самое последнее слово, и не помня ничего, что этому предшествовало. К тому моменту, как он достигает списка or 'или'/ then 'то', он не может вспомнить, что было сказано в начале: either 'или' либо // 'если'. Имея счастливую возможность оглядеть весь пройденный путь с высоты, мы можем вспомнить, какой выбор сделал генератор на первой развилке, но сам генератор, перебегая, как муравей, от списка к списку, запоминать не способен.

Тут можно подумать, что было бы просто переделать генератор таким образом, чтобы в конце предложения ему не приходилось вспоминать, какой выбор был сделан в начале. Например, можно было бы соединить either 'или' с or 'или', а также — со всеми возможными последовательностями слов между ними в одну огромную последовательность, а // 'если' соединить с then 'то' и со всеми возможными последовательностями слов между ними в другую огромную последовательность. Потом можно было бы обратиться к третьему варианту последовательности, растягивая цепь настолько, что я вынужден поместить ее отдельно. Но кое-что в этом решении вызывает немедленное отторжение: получаются три идентичные подсистемы. Разумеется, то, что люди могут сказать между either и or , они могут сказать и между if и then , а также после or или then . Но эта возможность должна естественным образом проистекать из строения некого генератора в голове у человека, позволяющего ему говорить. Она не должна зависеть от того, станет ли конструктор генератора тщательно расписывать три идентичных набора инструкций (или, что ближе к реаль-

84

Глава 4. Механизмы работы языка

ности, придется ли ребенку, изучать структуру английского предложения, трижды: между if и then , между either и or , а также — после then и or ).

Но Хомский продемонстрировал, что проблема лежит даже еще глубже. Каждое из данных предложений можно включить в состав любого другого, включая их самих:

If either the girl eats ice - cream or the girl eats candy , then the boy eats hot dogs 'Если или эта девочка ест мороженое, или эта девочка ест конфеты, то этот мальчик ест сосиски'.

Either if the girl eats ice - cream then the boy eats ice - cream , or if the girl eats icecream then the boy eats candy 'Или если эта девочка ест мороженое, то этот мальчик ест мороженое, или если эта девочка ест мороженое, то этот мальчик ест сосиски'.

В случае с первым предложением генератору нужно запомнить if 'если' и either 'или' так, чтобы потом их можно было продолжить словами or 'или' и then 'то', именно в такой последовательности. В случае со вторым предложением ему нужно запомнить either 'или' и if 'если' так, чтобы потом можно было продолжить предложение словами then 'то' и or 'или'. И так далее. Поскольку в принципе не существует предела количеству // и either , с которых может начинаться предложение и каждому из которых требуется свой собственный порядок then и or , чтобы быть законченным, не выйдет ничего хорошего из раскладывания каждой последовательности в памяти на свои собственные цепочки списков — получится неограниченное количество цепочек, которые не поместятся в обладающем конечными ресурсами мозгу.

Этот аргумент может показаться вам слишком схоластическим. Ни один реально живущий человек никогда не начнет предложение со слов: Either either if either if if 'Или или если или если если', поэтому имеет ли значение то, что идеальная модель этого человека может продолжить данное предложение словами: then 'то'... then 'то'... or 'или'... then 'то'... or 'или'... or 'или'? Но Хомский просто действовал в русле математической эстетики, используя взаимодействие между either 'или' — or 'или' и // 'если' — then 'то' как простейший возможный пример одного из свойств языка — использовать «удаленные зависимости» между словами, появившимися в предложении ранее и позднее — чтобы на математическом уровне доказать, что генератор цепочек слов не способен работать с этими зависимостями.

На самом деле, языки изобилуют такими зависимостями, и простые смертные употребляют их постоянно при значительном расстоянии между словами, часто применяя несколько зависимостей одновременно — делая именно то, на что не способен генератор цепочек слов. Например, между грамматистами ходит старая байка о том, что предложение может заканчиваться пятью предлогами. Папаша тащится наверх в комнату сыночка, чтобы почитать ему сказку на ночь. Сыночек замечает, что у папаши за книга, и негодующе кричит: Daddy , what did you bring that book that I don ' t want to be read to out of up fort 'Папа, зачем ты принес наверх эту книгу,

Грамматика за работой

85

из которой я не хочу, чтобы мне читали?' К моменту произнесения слова read 'читали', сыночек должен был задаться целью сохранить в памяти четыре зависимости: to be read 'читали' требует to (предлог, обозначающий направленность действия — читали кому), that book that 'эту книгу, из которой...' требует предлогов out of , bring 'принес сюда' требует up 'наверх', a what требует for (словосочетание what for означает 'зачем'). Другой, еще лучший пример взят из реальной жизни (из письма в журнал «ТВ-гайд»9*):

How Ann Salisbury can claim that Pam Dawber's anger at not receiving her fair share of acclaim for Mork and Mindy's success derives from a fragile ego escapes me.

'To, как Энн Сэлисбери может заявлять, что гнев Пэм Добер, вызванный неполучением честной доли от вознаграждения за успех «Морка и Минди», происходит от уязвленного самолюбия, остается мне не понятным'.

В том месте предложения, которое начинается сразу после слова not , автор письма должен был держать в памяти четыре грамматически обязательных положения: 1) not требует - ing { her anger at not receiving acclaim 'гнев, вызванный неполучением') требует распространения в виде причастного оборота — гнев, вызванный; 2) at требует существительного или герундия ( her anger at not receiving acclaim ); 3) подлежащее в единственном числе Рат Dawber ' s anger требует, чтобы глагол, стоящий четырнадцатью словами дальше, согласовывался с подлежащим в числе ( Dawber ' s anger ... derives from 'гнев Пэм Добер... происходит от'); 4) подлежащее в единственном числе, начинающееся с How требует от глагола, стоящего от него через двадцать семь слов согласования в числе ( How ... escapes me 'То, как... остается мне непонятным'). Подобно автору, читатель должен держать все эти зависимости в памяти для того, чтобы понять предложение. Теперь, говоря технически, можно было бы соорудить модель цепочки слов, которая могла бы работать даже с такими предложениями, поскольку существует какой-то реальный лимит числа зависимостей, которые говорящему нужно держать в памяти (например, четыре). Но уровень избыточности в генераторе будет абсурдным: для каждой из тысяч комбинаций зависимостей в генераторе придется дублировать идентичную цепочку. Пытаясь поместить в памяти такую суперцепочку, можно легко сойти с ума.

* * *

Разница между искусственной комбинаторной системой, которую мы рассматриваем на примере генератора цепочек слов, и естественной системой, которую мы рассматриваем на примере человеческого мозга, обобщена в строке стихотворения Джойса Килмера: «Только Бог может

' «ТВ-гайд» — американский еженедельный журнал с программами телепередач на неделю, статьями по вопросам культуры и общественной жизни. Основан в 1953 г. — Прим. ред.

86

Глава 4. Механизмы работы языка

создать дерево» 10*. Предложение — это дерево, а не цепочка. В грамматике человеческого языка слова сгруппированы в синтаксические группы, подобно веточкам присоединенным к ветви. Синтаксической группе присвоено имя — ментальный символ — и маленькие синтаксические группы могут быть объединены в ббльшие. Возьмем предложение: The happy boy eats ice - cream 'Этот радостный мальчик ест мороженое'. Оно начинается двумя словами, выступающими вместе как единое целое — это именная группа the happy boy 'этот радостный мальчик'. В английском именная группа (NP) состоит из имени существительного (N), которому иногда предшествует артикль или «детерминатор» (сокращенно: «det») и любое количество адъективных слов (А). Все это можно обобщить в правиле, которое определяет как выглядят английские именные группы вообще. В стандартном лингвистическом обозначении стрелка означает: «состоит из», скобки означают: «присутствующий факультативно», а звездочка обозначает: «любое желаемое количество этих элементов», но я привожу это правило только для того, чтобы показать, что вся заключенная в нем информация может быть ясно выражена в нескольких символах; можно не обращать внимание на обозначения, а смотреть только на перевод, обычными словами приведенный ниже:

NP-> (det) A* N

«Именная группа состоит из присутствующего факультативно де-терминатора, за которым следует любое количество адъективных слов, за которыми следует существительное».

Это правило определяет строение перевернутой вверх ногами ветви дерева:

А вот — два других правила, одно из которых дает определение английскому предложению (S), а другое дает определение предикативной или глагольной группе (VP), оба они используют как составную часть символ NP:

S-ч NP VP

«Предложение состоит из именной группы, за которой следует глагольная группа»

10' Килмер Альфред Джойс (1886-1918) — американский поэт, автор прославившего его стихотворения «Деревья» («Trees»). — Прим. ред.

Грамматика за работой

87

VP-> VNP

«Глагольная группа состоит из глагола, за которым следует именная группа».

Теперь нам потребуется ментальный словарь, который бы уточнил, какое слово принадлежит к какой части речи (имя существительное, глагол, прилагательное, предлог, детерминатор):

N-» boy 'мальчик', girl 'девочка', dog 'собака', cat 'кошка', ice - cream 'мороженое', candy 'конфеты', hot dogs 'сосиски'

«Существительные могут быть извлечены из следующего списка: boy 'мальчик', girl 'девочка'...»

V-» eats 'ест', likes 'любит', bites 'кусается'

«Глаголы могут быть извлечены из следующего списка: eats 'ест', likes 'любит', bites 'кусается'»


Дата добавления: 2019-01-14; просмотров: 172; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!