January 7th, 2007

Виноградовские чтения в МГУ

Московский государственный университет
им. М.В. Ломоносова
Филологический факультет





XXXVIII

В И Н О Г Р А Д О В С К И Е Ч Т Е Н И Я


















Москва, 2006


Уважаемый коллега!


Филологический факультет
Московского государственного университета
им. М.В. Ломоносова
приглашает Вас на XXXVIII Ежегодные чтения,
посвящённые памяти академика

Виктора Владимировича Виноградова.



Чтения состоятся во вторник 16 января
в 11аудитории I-го гуманитарного корпуса
МГУ на Воробьевых горах.
Начало чтений – в 11 часов.
Продолжительность каждого доклада — 20 минут.




ПРОГРАММА
Виноградовских чтений 2007 года

Грамматическое слово академика В.В. Виноградова
(К юбилею книги В.В. Виноградова «Русский язык (Грамматическое учение о слове)»)

Вступительное слово профессора М.Л.Ремневой, декана филологического факультета МГУ им. М.В. Ломоносова.
I
В.И. Аннушкин (ИРЯ им. А.С. Пушкина). Русские учения о речи и филологическая концепция академика В.В.Виноградова
Н.Н. Запольская (Ин-т славяноведения и балканистики РАН). Стратегия грамматического описания: история и современность.
В.М. Алпатов (МГУ). В.В. Виноградов и круг Бахтина.
Е.А. Земская. Письма В.В. Виноградова к А.М. Земскому 1941-43 гг.

II
Е.В. Клобуков (МГУ). Грамматические классы слов в книге В.В. Виноградова «Русский язык»: традиции и новаторство.
Г.А. Золотова (ИРЯ РАН). Идеи В.В. Виноградова в Коммуникативной грамматике.
М.В. Всеволодова (МГУ). Категории русского предлога: результаты последних исследований.
Т.В. Шмелева (НовгГУ). К вопросу о притяжательных прилагательных
П.А. Лекант (РПГУ). Категориальный статус деепричастия.

Заключительное слово Г.А. Золотовой

Поиск в корпусе НКРЯ с помощью системы лексико-грамматического поиска

Специфика поиска в Национальном корпусе русского языка: что важно знать о ней преподавателю-словеснику
Крылов С. А. (Ин-т востоковедения РАН) (krylov-58@mail.ru)
Поиск информации в Национаьном корпусе русского языка (далее НКРЯ) характеризуется некоторыми особенностями, которые важно учитывать преподавателям-словесникам, использующим поиск по НКРЯ в своей профессиональной практике.
Поиск бывает двух типов: «поиск точных форм» (далее ПТФ) и «лексико-грамматический поиск» (далее ЛГП). ПТФ аналогичен поиску в Яндексе и потому не нуждается в пояснениях. Между тем ЛГП учитывает грамматические и семантические признаки слов. Существует два вида ЛГП – по подкорпусу со снятой омонимией (далее ЛГП-1) и по подкорпусу с неснятой омонимией (далее ЛГП-0).
Проиллюстрируем специфику ЛГП в НКРЯ на конкретном примере. Допустим, что в поисковом запросе – «существительные в им. п. со значением сверхъестественного существа (‘superanim’) + глагол в изъявительном наклонении со значением движения».
Среди первых 102 реакций на вышеуказанный запрос оказалось 22 предсказуемых исходя из общих соображений, не связанных со спецификой ЛГП в НКРЯ. Из них 16 адекватных запросу (титаны ушли, Ангел приходит, Призрак покидает, чудовища выходят, Бог приходит, Ангел пролетел, ангелы летают, Призрак бродит, СНЕГУРОЧКИ ИДУТ, Снегурочка поехала, лешие бродят, чудовище сбегает, привидения гуляют, ведьмы летают, черт пролезет, ЛЕ́ШИЙ БРО́ДИТ); 2 неадекватны в силу лексической и морфологической омонимичности в корпусе с неснятой омонимией (сирены провёл, Чебурашки идёт); 1 правильна, но синтаксически несогласована в силу сочинительного подлежащего (Кощей выходят); и 1 псевдоправильна в силу контактной связи со сравнительным подлежащим (зомби бродил). Остальные 80 реакций объясняются спецификой ЛГП в НКРЯ.

(no subject)

1. При ЛГП учитывается лишь «лексико-морфологический» состав сегментов, а их пунктуация не принимается во внимание. Поэтому два сегмента, совпадающих по «лексико-морфологическому» составу, но отличающиеся расстановкой знаков препинания (например, семент «он идёт» и сегмент «он, идёт»), в ЛГП будут иметь одинаковые поисковые образы. Среди 102 реакций 24 неадекватных, где неадекватность объясняется наличием пунктуационных знаков между членами сочетания (из них 15 сочетаний с запятой, 7 с кавычкой, 1 с дефисом, 1 с «точкой с запятой»).

корпусная лингвистика

2. При ЛГП учитывается лишь глобальный признаковый потенциал сегмента, тогда как наличие импликационных отношений между признаками одного словесного сегмента не принимается во внимание. Покажем это на примерах поиска. Если в запросе – «существительные в им. п. со значением сверхъестественного существа (‘superanim’)», то среди субстантивных сегментов, выданных НКРЯ, будут, в частности, такие, как господа (5 раз), гора (2 раза), сатира (1 раз), черта (1 раз), горе (1 раз), Кощеев (1 раз).
В русском языке (далее РЯ) все конкретные сегменты, репрезентирующие абстрактные сегменты типа черта, господа, гора, сатира, горе, (а также бук, Драконов и мн. др.) обладают таким свойством: ЕСЛИ сегмент обозначает ‘superanim’, ТО падеж словоформы не является именительным; и наоборот, ЕСЛИ он имеет характеристику «им. п.», ТО он не обозначает ‘superanim’. Если в поисковом запросе признаки «им.п.» и ‘superanim’ были заданы КОНЪЮНКТИВНО (а судя по правилам поиска, это должно быть именно так), то «на выдаче» пользователь получает в ответ набор употреблений не только таких словесных сегментов, где признаки «им. п.» и ‘superanim’ связаны в РЯ тоже конъюнктивно, но и набор употреблений таких словесных сегментов, у которых признаки «им. п.» и ‘superanim’ в РЯ связаны отношением взаимоисключения (т. е. в любом из употреблений такого сегмента представлен лишь один из этих признаков, а не оба сразу) и т. о. связаны не отношением совмещения, а отношением взаимоисключения. То же самое можно сказать про соотношение признаков «существительное» и ‘superanim’ у абстрактных сегментов типа Драконов, Кощеев.

корпусная лингвистика

3. Следует считаться с тем, что лексико-морфологические гипотезы, используемые в ходе ЛГП, нередко выходят за рамки норм РЯ. Так, признак ‘superanim’ усматривается у слова гор, поэтому при ЛГП-0 примеры с сегментами гор (2 примера) и горы (4 примера) фигурируют среди реакций на вышеуказанный запрос. Если усомниться в существовании лексемы гор с признаком ‘superanim’ или в её принадлежности к норме РЯ, то другие сегменты с той же основой также допускают отнесение к этому подклассу.

корпусная лингвистика

4. Учителю-словеснику, прибегающему к ЛГП, следут принять во внимание, что наименования семантических признаков, принятые в системе ЛГП, далеко не всегда прямо сооответствуют одноименным терминам для обозначения семантических признаков, используемым в современных толковых словарях, грамматиках или исследованиях по семантике. Между тем при описании семантических признаков в НКРЯ не указаны научные источники, послужившие основой для приписывания семантических признаков. В результате мотивы принятия тех или иных решений остаются как бы «за кадром». Так, неясен мотив приписывания признака ‘superanim’ сегменту тварь (2 раза) или признака «движение» сегментам задрали (1 раз), натягивают (1 раз), рвут (1 раз).
Неясно, следует трактовать глаголы каузации движения (глаголы перемещения объекта) в качестве подкласса глаголов движения или нет. Если трактуются, то тогда ясно, почему в число глаголов движения входят глаголы каузации движения вроде послать (32 примера, которые можно в этом случае отнести к адекватным реакциям на исходный запрос, доведя тем самым общую степень адекватности ответов до 54%), но остаётся неясным, чем именно должен отличаться результат поиска по комбинации семантических признаков «движение» + «помещение объекта» от запроса по одному из этих признаков («движение»). Если же не трактуются, то тогда неясно, почему глаголы типа послать трактуются как глаголы движения (послать 22 раза, носить 2 раза, ниспослать 1 раз, отпустить 1 раз, отправить 1 раз, выпустить 1 раз, спустить 1 раз, привести 1 раз, принести 1 раз, привлекать 1 раз). Единственным способом формулировки запроса, содержащего идею «движение, но не каузация движения» или «самостоятельное движение» является задание грамматического признака «непереходности» (обратим внимание, что, например, глаголам пересекать, покинуть, населить, заселить признак «непереходности» не свойствен; поэтому использование в запросе дескриптора «непереходность» вместо «самостоятельного движения» будет означать, что все конструкции с указанными глаголами в выдачу не попадут).

корпусная лингвистика

5. Примечательной особенностью ЛГП является то, что в нём не предусмотрен поиск по отрицательным значениям признаков. Для отчётливо бинарных оппозиций это не приводит ни к каким трудностям в формулировке запросов. Однако если оппозиция является более чем бинарной (как, например, грамматическая категория падежа или грамматический признак «часть речи»), то у пользователя поисковой системы может возникнуть ряд трудностей. Например, в метаязыке запросов нет никаких формальных средств для задания таких запросов, как «не родительный падеж» или «не именительный падеж». По этой причине некоторые типы запросов (на первый взгляд прямо вытекающие из состава метаязыка ЛГП) оказываются неосуществимыми. Например, невозможно сформулировать запрос на поиск «сочетаний глагола бояться с последующим существительным, стоящим в форме винительного падежа единственного числа, не являющейся одновременно при этом ни формой именительного падежа, ни формой родительного падежа», так как в метаязыке ЛГП отсутствуют средства для выражения отрицательных условий «не-именительный падеж» и«не-родительный падеж».

разные уровни понимания

Крылов С. А. (krylov-58@mail.ru)
Четырёхуровневая модель понимания: предмет семантики и её разделы
0.0. К моделированию понимания возможен подход, предполагающий различение нескольких уровней. на «оси обозначения» (З. М. Шаляпина), связывающей «поверхностные» сущности с «глубинными». Ср. концепции Ю. С. Мартемьянова, С. Лэма, У. Л. Чейфа, А. К. Жолковского и И. А. Мельчука, Ю. Д. Апресяна, Е. В. Падучевой, Н. Н. Леонтьевой и ряда других теоретиков автоматической обработки текста (АОТ), а также идею «уровней эквивалентности» в переводоведении (в трудах В. Г. Гака, В. Н. Комиссарова, А. Д. Швейцера и др.). Идея расслоения содержания на несколько уровней разделяется многими теоретиками семантики (от А. А. Потебни и Г. Пауля в XIX в. до Г. П. Мельникова, Г. П. Щедровицкого, А. А. Леонтьева, Б. М. Лейкиной, Т. В. Булыгиной, А. В. Бондарко, И. М. Кобозевой и др. в наши дни).
Изложим один из возможных подходов к различению уровней, соотносимых с разными степенями глубины понимания речевого отрезка (РО).

четырёхслойная схема семантических единиц

0.1. Предлагается различать 4 уровня понимания в соответствии с 4 уровнями, выделяемыми в плане содержания РО (т. е. в их содержательной стороне). Эти 4 уровня «содержания» (в самом широком смысле) можно или пронумеровать, или (с некоторой небольшой «натяжкой») создать для каждого из них подходящий термин.
I. Инвентарные семантические единицы: «значение» (в широком смысле слова).
(I.1) «Означаемое» (//«десигнат», «общее //системное значение»).
(I.2) «(Собственно) значение» (//«сигнификат», «частное //узуальное значение»).
II. Экстраинвентарные (комбинаторные, конструктивные) семантические единицы: «смысл» (в широком смысле) или «содержание» (в широком смысле).
(II.3) «(Собственно) содержание» (//«контекстное //контекстуальное значение»).
(II.4) «(Собственно) смысл» (//«окказиональное //актуальное значение»).
Договоримся для краткости ниже называть единицы этих 4 уровней «Означаемыми» (I.1), «Значениями» (I.2), «Содержаниями» (II.3) и «Смыслами» (II.4).

От Означаемых - к Значениям: инвентарная семантика

1.1. Означаемые, как и Значения, представляют собой инвентарные единицы: они принадлежат языковой системе (инвентарю), поэтому их в принципе можно задать конечным списком. Разумеется, этот список будет небольшим (и ограниченным, т. е. «закрытым») лишь для грамматических значений; а список лексических значений в языке огромен (и практически неограничен, т. е. «открыт»), но всё же его можно описать хотя бы с некоторой степенью приближения как конечное множество (так, эти степени приближения будут разными в «карманном», «учебном», «практическом (однотомном)» и «академическом (многотомном)» словарях). Этим свойством единицы 1-го и 2-го уровней принципиально отличаются от единиц (или «комбинаций единиц») 3-го и 4-го уровней.
Отличие между Означаемыми и Значениями давно известно лингвистике под именем различения «общих» (ОЗ) и «частных» (ЧЗ) значений (в важности этого различения, впрочем, сомневались многие теоретики: только одни из этих скептиков отрицали существование «ОЗ», а другие, напротив, отрицали существование «ЧЗ»).
Языковых знаков (ЯЗ) (в «соссюровском» смысле) столько же, сколько Означаемых. Совпадение экспонентов у ЯЗ с разными Означаемыми есть омонимия; совпадение Означаемых у знаков с разными экспонентами есть абсолютная (полная) «синонимия», «дублетность» или «омосемия». Совпадение Означаемого со Значением возможно лишь при моносемии (чаще всего у терминов). Так как большинство ЯЗ полисемичны, то обычно одно Означаемое состоит из нескольких Значений.
Первый, примитивный, уровень понимания РО – это понимание с точностью до Означаемых: омонимия (как грамматическая, так и лексическая) уже «снята», но полисемия ещё не снята. Такой уровень понимания, видимо, обладает некоторой степенью психологической реальности. Именно он фиксируется при поморфемном (лексико-грамматическом) глоссировании примеров в разнообразных работах по граматической типологии, когда лингвист пытается передать «буквальное» значение РО на некотором изучаемом языке (для этого употребляется помета «букв.»). В работах по АОТ обычен такой способ репрезентации высказывания, при котором исследователь отвлекается от феномена лексической и грамматической полисемии (как правило, не интересующей авторов подобных работ), но при этом обращает внимание на феномен лексической или грамматической омонимии («разрешение» которой считается важной и насущной, даже первоочередной, задачей АОТ – ср., в частности, «первоочередную» задачу «разрешения» синтаксической омонимии).

Частное Значение

1.2. Второй, более тонкий, уровень понимания РО – это понимание с точностью до Значений: снята не только омонимия, но и «языковая» полисемия ЯЗ, входящих в этот РО. Этот уровень обладает некоторой степенью психологической реальности.
Меру этой реальности можно оценить степенью единодушия между лингвистами, описывающими набор «отдельных значений» многозначной лексической единицы в словаре или набор потенциальных «частных значений», присущих той или иной граммеме некоторой грамматической категории. Разумеется, в этой сфере существуют некоторые разногласия по отдельным частным вопросам, но наличие таких разногласий не есть доказательство психологической искусственности выделения такого набора значений. Оно свидетельствует лишь о диффузности самой границы между инвентарными значениями и внеинвентарными (окказиональными) употреблениями. Кроме того, эта граница является «зыбкой» по принципиальным причинам: ведь язык изменчив по природе, и окказиональные употребления на наших глазах переходят в узуальные значения. Внимание, уделяемое проблемам репрезентации высказывания на 2-м уровне понимания (не говоря уже о более глубоких уровнях), в работах по АОТ пока что было практически минимальным.