КОРПУСНЫЕ МЕТОДЫ В ИССЛЕДОВАНИИ РЕЧЕВЫХ ЖАНРОВ: ПРОБЛЕМА КЛЮЧЕВЫХ ФРАЗ
В статье обсуждаются теоретические и практические проблемы, связанные с изучением речевых жанров на основе корпусных баз данных и в целом при помощи методов корпусной лингвистики. Богатство, разнообразие и несомненная эффективность корпусных методов для решения различных лингвистических задач убеждают в том, что и при лингвистическом изучении речевых жанров такие методы должны быть задействованы. В то же время разработанной корпусной методики для решения речежанровых проблем лингвистики пока нет, и в целом не ясны ни роль, какую должны сыграть корпусные методы в общем изучении РЖ, ни - главное - отношение тех единиц, которые используются/доступны оперативному анализу в корпусах, к жанрам речи: о методах корпусной лингвистики можно говорить только в тех случаях, когда лингвистические задачи решаются количественно и с использованием технических возможностей корпусно-поисковых систем. На первый план выходит проблема «ключевых фраз», или текстовых маркеров РЖ, по которым можно осуществлять поиск в корпусах...
В статье обсуждаются теоретические и практические проблемы, связанные с изучением речевых жанров на основе корпусных баз данных и в целом при помощи методов корпусной лингвистики. Богатство, разнообразие и несомненная эффективность корпусных методов для решения различных лингвистических задач убеждают в том, что и при лингвистическом изучении речевых жанров такие методы должны быть задействованы. В то же время разработанной корпусной методики для решения речежанровых проблем лингвистики пока нет, и в целом не ясны ни роль, какую должны сыграть корпусные методы в общем изучении РЖ, ни - главное - отношение тех единиц, которые используются/доступны оперативному анализу в корпусах, к жанрам речи: о методах корпусной лингвистики можно говорить только в тех случаях, когда лингвистические задачи решаются количественно и с использованием технических возможностей корпусно-поисковых систем. На первый план выходит проблема «ключевых фраз», или текстовых маркеров РЖ, по которым можно осуществлять поиск в корпусах. По мнению авторов, ключевая фраза речевого жанра представляет собой его существенную характеристику, которая присутствует в речежанровой компетенции носителя языка и должна быть включена в соответствующие жанроведческие описания в качестве дополнительного параметра. Характеристики жанра такого рода в будущих «энциклопедиях речевых жанров», добавляемые к характеристикам, сформулированным в результате других, более традиционных жанроведческих исследований, могли бы выглядеть так: жанр - наличие ключевой лексемы - ключевая фраза / ключевые фразы для идентификации жанра - количество вхождений в корпус (какой) - ключевые фразы для исследования контекста - количество вхождений в корпус. Формулируются главные требования, предъявляемые к ключевой фразе: 1) ключевая фраза должна максимально соответствовать семантике жанра; 2) в системе по этому критерию можно реально искать и находить большое количество примеров. Предлагается начальная классификация ключевых фраз речевых жанров, которые противопоставляются: 1) по природе самих речевых жанров различных типов (особенно значимым является противопоставление стандартизованных и свободных, прямых и косвенных жанров); 2) по техническим возможностям корпусов; 3) по задачам конкретного жанроведческого исследования (требуется ли идентифицировать жанры речи в речевом потоке или же осуществлять тот или иной количественный анализ текста в рамках уже идентифицированных речевых жанров).
Работа выполнена при финансовой поддержке Минобрнауки России в рамках базовой части государственного задания в сфере научной деятельности по Заданию № 2014/203, код проекта 1549.
The article discusses the theoretical and practical problems related to the study of speech genres on the basis of the material of databases, and generally using the methods of corpus linguistics. The richness, diversity and undoubted effectiveness of corpus methods for solving various linguistic tasks convince that such methods should be also used in linguistic studies of speech genres. At the same time, there is no developed corpus techniques for solving genre problems in linguistics. The role that should corpus methods play in general studies of speech genres is not clear. Also, most importantly, the relation between the units that are used / available in corpus databases, and speech genre is not clear. Methods of corpus linguistics exist only in cases where linguistic problems are solved with the use of quantitative and technical capabilities of corpus systems. In the foreground there is the problem of “key phrases”, or text markers of speech genres, which can be searched in the case...
The article discusses the theoretical and practical problems related to the study of speech genres on the basis of the material of databases, and generally using the methods of corpus linguistics. The richness, diversity and undoubted effectiveness of corpus methods for solving various linguistic tasks convince that such methods should be also used in linguistic studies of speech genres. At the same time, there is no developed corpus techniques for solving genre problems in linguistics. The role that should corpus methods play in general studies of speech genres is not clear. Also, most importantly, the relation between the units that are used / available in corpus databases, and speech genre is not clear. Methods of corpus linguistics exist only in cases where linguistic problems are solved with the use of quantitative and technical capabilities of corpus systems. In the foreground there is the problem of “key phrases”, or text markers of speech genres, which can be searched in the case. According to the authors, the key phrase of speech genre is its essential characteristic, which is present in speech genre competence of a native speaker and should be included in the relevant speech genre description as an additional parameter. Genre characteristics of this kind, in the future “encyclopedias of speech genres”, may be added to the characteristics set forth as a result of other, more traditional speech genre research. They might look like this: the genre - the presence of the key lexeme - key phrase / key phrases (for the identification of the genre) - the number of accesses to corpus - the key phrase (for the research of the context) - the number of accesses to corpus. The main requirements for key phrases are formulated: 1) a key phrase must have the main semantics of the genre; 2) in the corpus database system according to this criterion, you can actually search for and find many examples. An initial classification of the key phrases of speech genres has been proposed, that are opposed to themselves by 1) the nature of speech genres themselves of various types (particularly meaningful is the juxtaposition of standardized and free, direct and indirect genres); 2) the technical capabilities of buildings; 3) specific tasks of a speech genre study (whether to identify the genre of speech in the speech flow, or to carry out one or other quantitative analysis of the text within the already identified speech genres).
Keywords: STUDYING SPEECH GENRES, CORPUS LINGUISTICS