Инкер Стивен Язык как инстинкт


Глава 5 СЛОВА, СЛОВА, СЛОВА



бет12/41
Дата28.04.2016
өлшемі7.41 Mb.
түріКнига
1   ...   8   9   10   11   12   13   14   15   ...   41
Глава 5 СЛОВА, СЛОВА, СЛОВА

Всё о лексике

Слово glamour 'волшебство' происходит от слова grammar 'грамматика', и со времен хомскианской революции, такая этимология вполне уместна. Разве созидательная мощь ментальной грамматики может не ослеплять ее способностью передавать неограниченное количество мыслей с помощью ограниченного набора правил? Существует книга о сознании и материи под названием «Грамматический человек» и нобелевская лекция, проводящая сравнение между механизмами, лежащими в основе жизни, и генеративной грамматикой. У Хомского брали интервью в «Роллинг стоун»2' и на него ссылались в «Сэтердей найт лайв»3'. У Вуди Аллена в «Проститутке из Менсы» клиент спрашивает: «А если я захочу, чтобы две девушки объяснили мне теорию Ноама Хомского?» «Это бы вам дорого обошлось», — отвечает главная героиня.

В отличие от ментальной грамматики, ментальный словарь никак не прославился. Он кажется не более, чем занудным списком слов, каждое из которых механически заносится в память. В предисловии к своему «Словарю» Сэмьюел Джонсон4' писал:

Печальная судьба тех, кто занимается неблагодарной работой — это быть движимым скорее боязнью дурного, чем быть влекомым благими перспективами; быть выставленным на растерзание цензуры безо всякой надежды на похвалу; быть униженным неправым судом или наказанным за небрежение; знать, что успех не повлечет рукоплесканий, а усердие останется без награды.

Среди этих несчастных смертных находятся и составители словарей.

Собственный словарь Джонсона определяет лексикографа как «безобидного трудягу, который ставит себе задачу проследить происхождение и детализировать значение слов».

В этой главе мы увидим, что такой стереотип несправедлив. Мир слов так же чудесен, как и мир синтаксиса, и даже больше. Во-первых,

' Слова, слова, слова — В. Шекспир. «Гамлет». — Прим. перев.



' «Роллинг стоун» — популярный музыкальный еженедельник в США. — Прим. ред.

' «Сэтердей найт лайв» — вечернее субботнее телешоу компании Эн-Би-Си (США), известно импровизированными комедийными сценками. — Прим. ред.

'Сэмьюел Джонсон (1709-1784) — английский лексикограф, критик и поэт. — Прим. перев.

116


Глава 5- Слова, слова, слова

словотворчество людей не знает границ (как и их творчество в области синтаксических групп и предложений). А во-вторых, запоминание каждого по-отдельности слова требует своей собственной виртуозности.

Вспомните вяг-тест (vwg-test), который не вызовет затруднений у любого дошкольника: «Вот ваг. А вот их двое. На картинке два___». Прежде,

чем ему предложили решить такую задачу, ребенок никогда не слышал, как кто-то это говорит, а самого его никогда не хвалили за произнесение слова «вага» (wugs). Таким образом, слова не просто извлекаются Из ментального архива. У человека должно иметься ментальное правило для образования новых слов из старых, что-то вроде: «чтобы образовать множественное число от существительного, надо добавить суффикс -s». Хитроумный механизм, стоящий за человеческим языком (при том, что язык является дискретной комбинаторной системой), используется как минимум в двух областях: предложения и синтаксические группы строятся из слов по правилам синтаксиса, а сами слова строятся из меньших частей с помощью другой группы правил — правил «морфологии».

Созидательная мощь английского языка — это просто жалкое подобие того, что мы встречаем в других языках. Английское существительное выступает всего в двух формах (duck 'утка' и ducks 'утки'), а глагол — в четырех (quack 'крякать' неопределенная форма или любая личная форма, кроме 3-го лица ед. числа, quacks 'крякает' — форма 3-го лица ед. числа, quacked 'крякал' — форма прошедшего времени, quacking 'крякающий' — причастие. В современном итальянском и испанском каждый глагол имеет около пятидесяти форм, в классическом греческом — триста пятьдесят, в турецком — два миллиона! Многие языки, которые я упоминал, как например: эскимосский, язык апачей, хопи, кивунджо и американский язык жестов известны своими чудесными созидательными возможностями. Как у них это получается? Вот пример из кивунджо — языка группы банту — о котором сказано, что на его фоне английский выглядит как шашки по сравнению с шахматами. Глагол Naikimlyiia, означающий 'Он ест это для нее', состоит из восьми частей:

N-: Показатель того, что слово является смысловым «центром» в данный момент разговора.

-а-: Показатель согласования подлежащего. Он определяет принадлежность того, кто ест, к t-ому классу одного из шестнадцати классов родовой принадлежности — «человек, единственное число». (Напомним, что лингвистический «род» имеет иное значение, нежели «пол».) Другие роды включают существительные, которые обозначают названия нескольких человек, тонких или вытянутых предметов, парных или объединенных в группу предметов, самих пар или групп предметов, инструментов, животных, частей тела, уменьшительных форм, абстрактных качеств, точных месторасположений и мест вообще.

-i'-: Настоящее время. Другие времена в банту могут относиться к сегодняшнему дню, сегодняшнему дню в более раннее время, вчерашнему дню, времени не ранее вчера, вчера или ранее, отдаленному прошлому, привычным действиям, продолжающимся действиям, последовательным

Всё о лексике

117


действиям, предполагаемым действиям, будущему, неопределенному времени, моменту «еще не» и действиям, происходящим иногда.

-ki-: Показатель согласования дополнения, в данном случае указывающий, что поедаемая вещь относится к 7-ому родовому классу.

-rh-: Бенефактивный показатель, указывающий в чью пользу происходит действие, в данном случае — в пользу члена 1-го родового класса.

-lyi-: Глагол «есть, кушать». -I-: Аппликативный показатель, указывающий, что состав ролевых исполнителей увеличился на одну дополнительную роль, в данном случае — на бенефактив. (Для сравнения представьте себе, что в английском нам пришлось бы добавлять суффикс к глаголу bake 'печь', когда он употребляется в предложении: I baked her a cake 'Я испек ей пирог' в противоположность обычному: / baked a cake 'Я испек пирог'.) -а: Конечная гласная, которая может указывать на изъявительное в отличие от сослагательного наклонение.

Если перемножить количество возможных комбинаций семи префиксов и суффиксов итоговая сумма будет равняться приблизительно половине миллиона, и это будет количество возможных для глагола форм в данном языке. В действительности, язык кивунджо и ему подобные выстраивают внутри одного сложного слова (глагола) целое предложение.

Но я был немного несправедлив к английскому языку. Английский действительно несовершенен с точки зрения «флективной» морфологии (словоизменения), в рамках которой слово изменяют так, чтобы оно удовлетворяло требованиям предложения (например, когда существительное маркируется показателем множественности -s или глагол — показателем прошедшего времени -ed). Но английский наверстывает упущенное в «деривационной» морфологии, в рамках которой из старого слова создается новое. Например, суффикс -able, как в словах learnable 'поддающийся изучению', teachable 'поддающийся обучению', huggable 'поддающийся к стискиванию в объятиях', переводит глагольное значение «сделать X» в значение прилагательного: «способный иметь X сделанным». Большинство людей с удивлением узнают, как много деривационных суффиксов имеется в английском. Вот наиболее часто встречающиеся:



-able

-ate

-i/У

-ize

-age

-ed

-ion

-ly

-al

-en

-ish

-ment

-an

-er

-ism

-ness

-ant

-fill

-ist

-ory

-ance

-hood

-ity

-ous

-ary

-1С

-ive

-y

В дополнение к этому английский легко и свободно занимается «словосложением», при котором два слова склеиваются вместе, чтобы образовалось новое, например toothbrush 'зубная щетка' и mouse-eater 'поедатель мышей'. Благодаря этим процессам количество возможных слов, даже в морфологически обедненном английском, невероятно. Специалист по компьютерной лингвистике Ричард Спроут

118


Глава 5. Слова, слова, слова

сделал подборку из всех отдельных слов в текстах, содержащих сорок четыре миллиона слов из новостных публикаций в «Ассошиэйтед Пресс»5' начиная с середины февраля 1988 г. К 30-му декабря список состоял из трехсот тысяч отдельных словоформ; почти столько же может содержать хороший полный словарь. Вы можете подумать, что в результате этого английская лексика, употребляемая в такого рода публикациях, будет исчерпана. Но когда Спроут посмотрел на то, что было опубликовано 31-го декабря, он нашел не меньше тридцати пяти новых форм, включая: instrumenting 'инструментирова-ние', counterprograms 'встречные программы', armhole 'отверстие для руки', part-Vulcan 'Вулкан отчасти', fuzzier 'пушистик', groveled 'склонный пресмыкаться', boulderlike 'валуноподобный', mega-lizard 'мега-ящери-ца', traumatological 'травматологический' и ex-critters 'в прошлом бывшие тварями'.

Еще более впечатляющим образом конечный продукт одного морфологического правила может быть исходным продуктом для другого или для самого себя. Можно говорить об unmicrowaveability 'неподдаваемости готовке в микроволновой печи' некоторых картофельных полуфабрикатов или о toothbrush-holder fastener box 'коробочка для креплений к стаканчикам для зубных щеток', где можно хранить toothbrush-holder fasteners 'крепления к стаканчикам для зубных щеток'. Это делает количество слов, возможных в языке, даже более, чем невероятным; так же, как и количество предложений, оно бесконечно. Если оставить в стороне те притязающие на бессмертие причуды, которыми наполнена «Книга рекордов Гиннесса», то самое длинное зафиксированное слово английского языка — это, возможно, floccinaucinihilipilification 'флокциносинигилипи-лификация', которому «Оксфордский словарь английского языка» дает следующее определение: «категоризирующий что-либо как вещь тривиальную или не имеющую ценности». Однако этот рекорд предназначен для того, чтобы быть превзойденным:

/loccinaucinihilipiliflcational 'флокциносинигилипилификационный': относящийся к категоризации чего-либо как вещи тривиальной или не имеющей ценности

/loccinaucinihiHpiliflcationalize 'флокциносинигилипилификационизировать': делать так, чтобы что-то относилось к категоризации чего-либо как вещи тривиальной или не имеющей ценности

floccinaucinihilipiUficationaUzation 'флокциносинигилипилификационизация': действие, приводящее к тому, что что-то начинает относиться к категоризации чего-либо как вещи тривиальной или не имеющей ценности

floccinaucinihilipilificationaHzationai 'флокциносинигилипилификационизаци-онный': относящийся к действию, приводящему к тому, что что-то начинает относиться к категоризации чего-либо как вещи тривиальной или не имеющей ценности

5* «Associated Press» — одно из крупнейших телеграфно-информационных агентств в США. — Прим. ред.

Всё о лексике

119


floccinaucinihUipilificationalizationaHze 'флокцнносинигилипилификациониза-инонизировать': делать так, чтобы что-то относилось к действию, приводящему к тому, что что-то начинает относиться...

Или, если вы страдаете от сескипедалиафобии, то есть боязни длинных слов, вы можете подумать о своей прабабушке, пра-прабабушке, пра-пра-прабабушке и так далее; на практике список будет ограничен только количеством поколений, начиная с Евы.

Более того, у слов, как и у предложений, слишком тонкое строение, чтобы их можно было производить с помощью генератора цепочек (механизма, который выбирает компонент из одного списка, затем перемещается к какому-либо другому списку, затем — к следующему). Когда Рональд Рейган выступил с предложением Стратегической оборонной инициативы, известной в народе как Звездные Войны, он представил такую картину будущего: приближающаяся советская ракета должна быть сбита ракетой противоракетного действия (anti-missile missile). Но критики тострили внимание на том, что Советский Союз может контратаковать ракетой противо-противоракетного действия (anti-anti-missile-missile missile). Нет проблем, сказали инженеры, обучавшиеся в Массачусетском Технологическом Институте, мы просто создадим ракету противо-противо-противоракетного действия (anti-anti-anti-missile-missile-missile missile). •Зти вооружения высоких технологий требуют грамматики высоких технологий — чего-то позволяющего уследить за всеми ant! в начале слова, чтобы закончить его соответствующим количеством missile плюс еще одно па конце. Грамматика структуры слова (грамматика структуры непосредственно составляющих для слов), которая может вставлять слова между unti- и его missile, выполнит эту задачу, а генератор цепочек с ней не спра-нится, поскольку он забудет компоненты, стоящие в начале длинного слова, к тому времени, как дойдет до конца.

* * *

Как и синтаксис, морфология — это умно организованная система, и многие кажущиеся странности слов — это предсказуемые следствия ее нпутренней логики. У слов тонкое строение; их составные части, подо-шанные друг к другу определенным образом, называются морфемами. Система структуры слова — это продолжение системы структуры непосредственно составляющих Х-штрих, где большие именные комплексы составлены из меньших именных элементов, а меньшие именные комплексы составлены из еще меньших именных элементов и т.д. Самая большая синтаксическая группа для имени существительного — это именная группа; в именную группу входит N-штрих; в N-штрих входит имя существительное — слово. Совершая прыжок от синтаксиса к морфологии, мы просто продолжим это разделение, разбивая существительное на меньшие и меньшие части.

120

Глава 5. Слова, слова, слова



Вот схема, представляющая структуру слова dogs (собаки):

Вершиной этого мини-дерева является «N» — «имя существительное», что делает возможной операцию присоединения, при которой слово целиком может быть размещено в именном слоте внутри любой именной группы. Ниже — внутри слова — мы видим две его части — чистую словоформу dog, обычно называемую основой слова, и флексию множественного числа -s. Правило, ответственное за словоизменение (правило, прославленное ваг-тестом) — простое:

N NoCHcma Ыфлексия

«Имя существительное может состоять из именной основы, за которой следует именная флексия».

Это правило прекрасно взаимодействует с ментальным словарем: dog будет значиться в нем как именная основа со значением «собака», a s будет значиться как именная флексия со значением «множественное число от...».

Данное правило — это простейший, самый чистый пример того, что можно назвать грамматическим правилом. В моей лаборатории мы используем его как легко поддающийся изучению образчик ментальной грамматики, позволяющий нам с мельчайшими подробностями отразить психологию действия лингвистических правил как в детском, так и в преклонном возрасте, как в сознании нормальных людей, так и людей с расстройствами нервной системы. Во многом подобным образом биологи выбирают в качестве объекта фруктовую мушку дрозофилу, чтобы изучить генетические механизмы. Будучи простым, правило, присоединяющее флексию к основе, оказывается на удивление мощной вычислительной операцией. Это происходит потому, что оно опознает абстрактный ментальный символ, такой как «именная основа», не ассоциируя его с определенным списком слов или звуков, или значений. Мы можем использовать это правило, чтобы изменить форму любого компонента с пометой «именная основа» в ментальном словаре, не заботясь о том, что означает это слово; мы можем не только превратить dog 'собака' в dogs 'собаки', но и hour 'час' — в hours 'часы', a justification 'оправдание' — в justifications 'оправдания'. Подобным образом это правило позволяет нам образовывать формы множественного числа, не принимая во внимание звучание слова; мы образуем множественное число от слов с непривычным звучанием, например, the Gorbachevs 'Горбачевы', the Bachs 'Бахи' и the Мао Zedongs 'Мао Цзедуны'. По той же причине это правило замечательно работает применительно к совершенно новым словам, таким



Всё о лексике

121


как: faxes 'факсы', dweebs (двибы — несуществующее слово), wugs (ваги — придуманное слово, использующееся в исследованиях детской речи) и zots (зоты — несуществующее слово).

Мы применяем это правило с такой легкостью, что, вероятно, единственный способ вызвать восхищение результатом его работы — это сравнить человека с одной компьютерной программой, превозносимой многими учеными-кибернетиками как шаг в будущее. Такие программы, называемые «искусственными нейронными сетями», не используют правило, которое я вам только что продемонстрировал. Искусственная нейронная сеть работает по аналогии, конвертируя wug 'ваг' в wugged 'вагал', потому что это смутно напоминает hug 'обнимать' — hugged 'обнимал', walk 'шагать' — walked 'шагал' и тысячи других глаголов, которые эта сеть была «обучена» распознавать. Но когда эта сеть сталкивается с новым глаголом, непохожим на что-либо ей ранее встречавшееся при «обучении», она часто коверкает его, потому что не знает абстрактной всеобъемлющей категории «глагольная основа», опираясь на которую можно добавить аффикс. Ниже приводится для сравнения несколько вариантов типичной реакции людей и искусственных нейронных сетей на ваг-тест.






Типичная

Типичная форма







форма

прошедшего




Глагол

прошедшего

времени, данная

Перевод




времени,

искусственными







данная

нейронными







людьми

сетями




mail

mailed

membled

отправлять почтой

conflict

conflicted

conflafted

конфликтовать

wink

winked

wok

моргать

quiver

quivered

quess

дрожать

satisfy

satisfied

sedderded

удовлетворять

smairf

smairfed

sprurice

(слово придумано)

trilb

trilbed

treelilt

(слово придумано)

smeej

smeejed

leefloag

(слово придумано)

frilg

frilged

freezled

(слово придумано)

Основы также могут состоять из частей на втором более глубоком уровне их структуры. В таких сложных словах-композитах, как: Yugoslavia report 'доклад о Югославии', sushi-lover 'любитель суши', broccoli-green 'зеленый, как капуста брокколи' и toothbrush 'зубная щетка',

122





Достарыңызбен бөлісу:
1   ...   8   9   10   11   12   13   14   15   ...   41


©netref.ru 2019
әкімшілігінің қараңыз

    Басты бет