Практика выделения ключевых знаков журналистского текста
СОДЕРЖАНИЕ: В статье дано определение понятия «ключевые знаки текста», предложена их классификация. Представлен комплексный практический анализ журналистского материала, включающий выделение ключевых знаков с опорой на экспериментальные психолингвистические методики.Практика выделения ключевых знаков журналистского текста
Э. В. Булатова
В статье дано определение понятия «ключевые знаки текста», предложена их классификация. Представлен комплексный практический анализ журналистского материала, включающий выделение ключевых знаков с опорой на экспериментальные психолингвистические методики, компьютерный количественный метод определения частоты слов в тексте, а также содержательный способ обнаружения ключевых знаков в основных элементах смысловой структуры текста. Определен характер связи ключевых и частотных слов текста.
Ключевые знаки (далее — КЗ) текста — двусторонние материально-идеальные единицы разной семиотической природы, репрезентирующие ключевые смыслы текста. Ключевой смысл, в свою очередь, понимается нами как значимый компонент основного содержания текста. Тексты электронных СМИ могут содержать вербальные (ключевые слова и ключевые фразы), визуальные (ключевые изображения) и аудиальные (ключевые фрагменты аудиоряда) ключевые знаки.
Для вычленения КЗ в отдельном тексте может быть использован комплекс методик: экспериментальные психолингвистические методики, компьютерный количественный метод определения частоты слов в тексте, формально-содержательный способ обнаружения КЗ по сильным позициям текста, а также содержательный метод обнаружения КЗ, предполагающий опору на основные элементы смысловой структуры текста.
Практику выделения КЗ в журналистском тексте покажем на примере анализа статьи С. Новопрудского «Стена от плача», опубликованной в газете «Известия» в 2004 г. (Сохранены авторские шрифтовые выделения.)
Стена от плача
Время действия — начало XXI века. Место действия — город Гаага, расположенный в Нидерландах, едва ли не самой свободной стране мира, где разрешены однополые браки, эвтаназия и легкие наркотики. Сама история могла бы происходить сто, двести, две тысячи лет назад. В Гааге в начале XXI века по просьбе ООН Международный трибунал на полном серьезе судит. стену, которую Израиль хочет возвести, чтобы отгородиться от палестинских террористов.
Происходящее возле здания суда — трагедия и фарс одновременно. Сторонники стены пригнали за тридевять земель из Иерусалима остов взорванного террористом- смертником автобуса и раздают всем желающим «как бы билеты» на этот «как бы автобус». Противники выступают с хлестким, как им кажется, лозунгом: «Стена — тюрьма для палестинцев и гетто для израильтян». Но ни сторонники стены, ни ее противники, ни главный борец с международным терроризмом Джордж Буш, ни руководство Организации Объединенных Наций, заказавшее этот нелепейший судебный процесс, ни сам Господь Бог не знают, поможет ли новая стена избавить мир раз и навсегда от тех, кто взрывает себя и вместе с собой — десятки, сотни или тысячи невинных людей. Хотя нет, знают — не поможет.
Человечество не меняется. Люди не в состоянии ужиться друг с другом. А потому планомерно, век за веком убивают друг друга. И строят стены — чтобы отгородиться друг от друга, точнее — враг от врага. Израиль научился убивать именно тех людей, которые непосредственно организуют теракты, и взрывать именно их дома, в совершенстве овладел искусством зрячей, точечной мести. Но одних смертников заменяют другие — этим людям незачем жить на земле, ибо они слепо и свято верят, что, уничтожив людей другой веры и другой нации, обретут вечное загробное блаженство.
Религия и политика остаются дымовой завесой, дешевым, лживым, но надежным прикрытием обыкновенного варварства, безумной жажды уничтожения ближнего. Именем Аллаха обыкновенные тупые убийцы становятся борцами за веру. Политическая риторика возводит этих тупых убийц в ранг участников национально-освободительного движения, борцов за «родную землю».
Человечество никогда в этом не признается, но главная наша трагедия — отсутствие общечеловеческих ценностей. Их не было и нет. Например, до сих пор не является такой ценностью 1 (одна) человеческая жизнь. Интересы партии, секты, страны все время оказываются «выше» жизни, важнее ее. Стена — древний и достаточно наивный способ защиты от терроризма в ситуации, когда террористом может оказаться почти каждый «мирный гражданин». Но эта стена — всего лишь ответ на ту, другую, более прочную и древнюю стену ненависти. Ту, которая выстраивалась веками религиозных и национальных распрей между арабами и евреями. Эта вражда между двумя древними семитскими народами, начавшаяся задолго до возникновения ислама, потом, после появления самой молодой мировой религии, получила дополнительный идеологический допинг.
Проблема в том, что люди, населяющие Землю, — не единоверцы и не единомышленники. И никогда не станут таковыми. Ни религиозные проповеди (каждая религия на словах призывает к миру, а на деле как минимум смиряется с террором, а как максимум — даже поощряет его), ни заградительные стены сами по себе не помогут вырваться из этого заколдованного кровавого круга. Хотя и стены, и проповеди по- своему важны — как некие действия, как попытки действий. Выход — формирование всеми доступными человечеству способами коммуникаций хотя бы минимального набора общечеловеческих ценностей.
Мы молились, молимся и будем молиться разным богам. Едва ли на Земле возможен и один-единственный государственный строй. Но, не прекращая силовых акций противодействия терроризму, мы должны попытаться договориться хотя бы о том, что нет ничего важнее человеческой жизни. Хотя бы об этой единственной общечеловеческой ценности...
Палестинцам не нравится заградительная стена, потому что они работают в Израиле? Значит, палестинцы должны убедить свое руководство разгромить действующие террористические организации. Заставить своих детей раз и навсегда отказаться от развлечения в виде забрасывания камнями израильских солдат. Или — если это невозможно — жить за стеной, работая на своей земле. Возможно, работа на своей земле повысит ценность собственной жизни в глазах потенциальных террористов. А заодно — ценность других человеческих жизней, которые эти будущие террористы готовы загубить.
Увы, пока все это — прекрасные мечты. Пока мы строим стены и судим стены. Вместо того чтобы судить себя и прекратить карать других.
Текст некреолизованный, следовательно, в нем могут быть выделены только вербальные КЗ. С целью их определения в первую очередь построим смысловую структуру текста, демонстрирующую причинно-следственные связи тезисов и позволяющую вычленить доминантные и второстепенные КЗ.
Фон: информация из первых двух абзацев о том, что в Гааге ООН судит стену.
ГМ (главная мысль): Стена не поможет избавить мир от терроризма.
Кт 1 (констатирующий тезис): человечество не меняется. Люди не в состоянии ужиться друг с другом.
Рт 1 (развивающий тезис) к Кт 1: поэтому убивают друг друга и строят стены, чтобы отгородиться друг от друга, точнее — враг от врага.
Иллюстрация к Рт 1: Израиль овладел искусством зрячей, точечной мести. Рт 2 к Рт 1: но одних смертников заменяют другие.
Рт 3 к Рт 2: так как этим людям незачем жить на земле, ибо они слепо и свято верят, что, уничтожив людей другой веры и другой нации, обретут вечное загробное блаженство.
Кт 2: религия и политика остаются дымовой завесой, дешевым, лживым, но надежным прикрытием обыкновенного варварства, безумной жажды уничтожения ближнего.
Рт к Кт 2: именем Аллаха обыкновенные тупые убийцы становятся борцами за веру. Политическая риторика возводит этих тупых убийц в ранг участников национально-освободительного движения, борцов за «родную землю».
Кт 3: человечество никогда в этом не признается, но главная наша трагедия — отсутствие общечеловеческих ценностей. Их не было и нет.
Рт 1 к Кт 3: до сих пор не является такой ценностью 1 (одна) человеческая жизнь.
Рт 2 к Рт 1: не является ценностью, так как интересы партии, секты, страны все время оказываются «выше» жизни, важнее ее.
Кт 4: стена не поможет, так как она древний и достаточно наивный способ защиты от терроризма в ситуации, когда террористом может оказаться почти каждый «мирный гражданин».
Рт 1 к Кт 4: эта стена — всего лишь ответ на другую, более прочную и древнюю стену ненависти, которая выстраивалась веками религиозных и национальных распрей между арабами и евреями.
Рт 2 к Рт 1: после появления самой молодой мировой религии эта вражда получила дополнительный идеологический допинг.
Кт 5: люди, населяющие Землю, — не единоверцы и не единомышленники. И никогда не станут таковыми.
Рт 1 к Кт 5: ни религиозные проповеди (каждая религия на словах призывает к миру, а на деле как минимум смиряется с террором, а как максимум — даже поощряет его), ни заградительные стены сами по себе не помогут вырваться из этого заколдованного кровавого круга.
Рт 2 к Рт 1: не помогут, хотя и стены, и проповеди по-своему важны — как некие действия, как попытки действий.
Рт 3 к Рт 1: не помогут, следовательно, единственный выход — формирование всеми доступными человечеству способами коммуникаций хотя бы минимального набора общечеловеческих ценностей.
Рт 4 к Кт 5: мы молились, молимся и будем молиться разным богам. Едва ли на Земле возможен и один-единственный государственный строй.
Рт 5 к Рт 4: но, не прекращая силовых акций противодействия терроризму, мы должны попытаться договориться о том, что нет ничего важнее человеческой жизни. Хотя бы об этой единственной общечеловеческой ценности.
Иллюстрация к Рт 5: действия палестинцев, которые позволят им осознать ценность человеческой жизни (предпоследний абзац).
АОС (аналитическая оценка ситуации, вывод): увы, пока все это — прекрасные мечты. Пока мы строим стены и судим стены. Вместо того чтобы судить себя и прекратить карать других.
К доминантным КЗ текста мы можем отнести ключевые фразы, образующие ГМ и АОС, поскольку 1) это сильные позиции текста (начало, конец), выделенные, кроме того, автором с помощью полужирного шрифта; 2) по отношению к ГМ определяется характер всех остальных элементов смысловой структуры и, следовательно, «вес» ключевых знаков, входящих в их состав. К второстепенным КЗ мы можем отнести ключевые фразы, образующие КТ смысловой структуры. На базе доминантных и второстепенных ключевых фраз могут быть выделены доминантные и второстепенные ключевые слова.
Ключевым словом «с максимальным весом» (по терминологии В. А. Лукина [1]) по результатам анализа смысловой структуры является слово «стена», поскольку оно образует сильную позицию текста (заголовок), является темой (предметом мысли автора) — компонентом ГМ. Кроме того, данное слово — самое частотное в тексте.
Приведем результаты компьютерного анализа частоты слов. Количество слов в тексте — 627. Наиболее частотные слова (Тор-20) приведены в табл. 1.
Мы видим, что тема текста («стена»), отраженная в заглавии — сильной позиции текста, является самым частотным словом. Наименование проблемы («терроризм»), лежащей в основе конфликта, и предикат «не поможет» (заметим, что программа не учитывает служебные слова) — компоненты главной мысли — также включены в двадцатку наиболее частотных слов. Частотное слово «судить» содержится в аналитической оценке ситуации (в выводе — сильной позиции текста). Все констатирующие (5) и некоторые развивающие тезисы (3 из 14) также содержат частотные слова («земля», «друг с другом», «ценность», «религия», «терроризм», «человечество», «общечеловеческий», «человек (люди)»).
Таблица 1
№ |
Слово |
Количество повторений в тексте |
Доля в тексте, % от общего числа слов |
1 |
Стена |
15 |
2,3 |
2 |
Земля |
7 |
1,1 |
3 |
Друг (друг друга) |
6 |
0,9 |
4 |
Человек |
6 |
0,9 |
5 |
Ценность |
6 |
0,9 |
6 |
Жизнь |
5 |
0,7 |
7 |
Век |
5 |
0,7 |
8 |
Террорист |
4 |
0,6 |
9 |
Действие |
4 |
0,6 |
10 |
Судить |
3 |
0,4 |
11 |
Человеческий |
3 |
0,4 |
12 |
Израиль |
3 |
0,4 |
13 |
Религия |
3 |
0,4 |
14 |
Молиться |
3 |
0,4 |
15 |
Человечество |
3 |
0,4 |
16 |
Терроризм |
3 |
0,4 |
17 |
Палестинец |
3 |
0,4 |
18 |
Борец |
3 |
0,4 |
19 |
Общечеловеческий |
3 |
0,4 |
20 |
Помочь |
3 |
0,4 |
Примечание. Данные получены с помощью программы на сайте istio.com.
Таким образом, частотные слова текста сосредоточены в главной мысли, аналитической оценке ситуации и констатирующих тезисах, что служит еще одним подтверждением их статуса ключевых фраз текста, ведь повтором всегда выделяется элемент, важный для авторского замысла. Часть этих структурных компонентов выделена автором с помощью полужирного шрифта.
Обратимся к результатам психолингвистического эксперимента. Количество респондентов — 42 человека. Экспериментальные задания: 1) выделить ключевые слова текста (не более 10); 2) выделить ГМ и АОС текста. Совокупное количество выделенных в тексте ключевых слов — 292. Наиболее частотные слова, отмеченные респондентами как ключевые для данного текста, представлены в табл. 2 (Тор-20 респондентов).
Сопоставим Тор-20 и Тор-20 респондентов. В Тор-20 содержатся не отмеченные респондентами частотные слова «земля», «век», «действие», «молиться», «палестинец», «борец», «помочь». Показательно, что большая часть данной лексики не входит в состав основных элементов смысловой структуры (ГМ, Кт, АОС) и, таким образом, не является КЗ текста. Вместе с тем в состав Тор-20 не вошли такие слова, как «отсутствие», «трагедия», «(не) меняться», «политика», «единоверец», «прикрытие», несущие значительную смысловую нагрузку и вклю-
№ |
Слово |
Количество повторений в НКС |
Доля в НКС, % от общего числа слов |
1 |
Ценность |
33 |
11,3 |
2 |
Общечеловеческий |
26 |
8,9 |
3 |
Стена |
18 |
6,1 |
4 |
Жизнь |
12 |
4,1 |
5 |
Отсутствие |
11 |
3,7 |
6 |
Терроризм |
11 |
3,7 |
7 |
Религия |
11 |
3,7 |
8 |
Трагедия |
9 |
3 |
9 |
Человеческий |
7 |
2,3 |
10 |
Друг (друг друга) |
6 |
2 |
11 |
Человечество |
6 |
2 |
12 |
(Не) меняться |
5 |
1,7 |
13 |
Политика |
5 |
1,7 |
14 |
Человек (люди) |
5 |
1,7 |
15 |
Израиль |
4 |
1,3 |
16 |
Судить |
4 |
1,3 |
17 |
Террорист |
4 |
1,3 |
18 |
Суд |
3 |
1 |
19 |
Единоверец |
3 |
1 |
20 |
Прикрытие |
3 |
1 |
Примечания: 1. Данные получены с помощью программы на сайте istio.com. 2. НКС — набор ключевых слов.
ченные в состав ключевых слов респондентами. Все эти слова являются компонентами констатирующих тезисов, т. е. второстепенными КЗ. Что касается лексики, входящей в состав развивающих тезисов, фона и иллюстраций, не образующих КЗ текста, то Тор-20 содержит 9 таких слов, Тор-20 респондентов — 5. Таким образом, лексика, входящая в Тор-20 респондентов, теснее коррелирует с основными элементами смысловой структуры — ключевыми фразами текста.
Наиболее частотным словом текста, как уже отмечалось выше, является слово «стена», а наиболее важным для респондентов оказалось слово «ценность» — второстепенный КЗ по результатам анализа смысловой структуры и доминантный знак по результатам эксперимента. Заметим, что данные количественного компьютерного анализа совпадают с данными Частотного словаря современного русского языка [2], согласно которым слово «стена» имеет большее по сравнению со словом «ценность» число употреблений на 1 млн слов корпуса (ipm). Частота слов в алфавитном списке словаря: «стена» — 261.0 ipm, «ценность» — 81.2 ipm; в разделе «Частотный словарь публицистики» указанного выше словаря: «стена» — 194.4 ipm, «ценность» — 97.5 ipm.
Вместе с тем по результатам эксперимента мы видим, что в интерпретации респондентов смысловой центр текста сместился с главной мысли «стена не поможет избавить мир от терроризма» на третий констатирующий тезис «главная наша трагедия — отсутствие общечеловеческих ценностей», представляющий авторское видение основной причины поднятой в тексте проблемы. Лексика, входящая в состав данного тезиса, в большинстве случаев выделялась респондентами в качестве ключевой, а сам тезис 17 из 42 опрашиваемых отметили как ГМ текста. В то время как собственно ГМ «опознали» только 2 респондента: «Стена — не выход из сложившейся ситуации, она не сможет отгородить страну от терроризма» и «Стена, которую Израиль хочет возвести, чтобы отгородиться от Палестины, не сможет решить проблему терроризма». Но, пожалуй, самое любопытное — формулировки, объединяющие слова «стена» и «ценности» в поле ГМ, предложенные четырьмя респондентами: «Строить стены бесполезно, пока нет общечеловеческих ценностей», «Проблема не в стене, а в отсутствии у людей моральных ценностей» и т. п. 7 респондентов в качестве ГМ выбрали констатирующий тезис «Человечество не меняется, люди не в состоянии ужиться друг с другом». Еще 1 респондент включил в него слово «ценности»: «Люди не могут ужиться друг с другом из-за отсутствия общечеловеческих ценностей». 5 респондентов в качестве ГМ указали АОС текста: «Мы строим стены и судим стены, вместо того чтобы судить себя и прекратить карать других». 3 респондента выбрали информационный повод публикации в качестве ГМ: «В Израиле хотят возвести стену, чтобы отгородиться от террористов». Трое опрашиваемых не определили ГМ. Несмотря на то что эксперимент продемонстрировал очевидную разницу в способности респондентов глубоко понять основной смысл текста, его результаты позволяют получить обратную связь: демонстрируют возможную интерпретационную картину, в данном случае — фиксацию внимания респондентов на концепте «ценности».
Подводя итоги, отметим, что подавляющее число частотной лексики (Тор-20) и лексики, выделенной респондентами в качестве ключевой (Тор-20 респондентов), относится к именам существительным и входит в состав ключевых фраз — основных элементов смысловой структуры текста. Тем самым подтверждается неоднократно высказанное исследователями положение о преобладании существительных в поле ключевых слов и о частотности последних.
Вместе с тем понятия «частотное слово» и «ключевое слово» не являются синонимичными: частотные слова не всегда являются ключевыми. Так, частотные слова «век», «действие» и некоторые другие не могут быть отнесены к числу ключевых по результатам содержательного анализа и эксперимента, поскольку они не несут значительной смысловой нагрузки: не входят в состав основных элементов смысловой структуры и не выделяются респондентами.
Использование комплекса количественных и «качественных» методик определения ключевых знаков текста позволяет выделить разные виды последних. Анализ смысловой структуры текста фиксирует ключевые фразы, на базе которых могут быть выделены ключевые слова. Компьютерный количественный анализ представляет собой удобный механизм определения частотной лексики, которую в сфере поисковой оптимизации называют ключевыми словами текста. Однако его результаты, по сравнению с экспериментальными данными, в меньшей степени коррелируют с результатами содержательного анализа смысловой структуры текста. Анализ данных опроса респондентов приобретает особую важность при дискурсивном подходе, поскольку позволяет уточнить характер ключевых знаков (доминантные/второстепенные) с точки зрения респондентов и получить информацию о том, как аудитория воспринимает определенный текст. Соотнесение результатов нескольких методик дает возможность с высокой степенью точности определить состав и характер ключевых знаков журналистского текста.
Список литературы
Лукин В. А. Художественный текст: Основы лингвистической теории и элементы анализа. М., 1999. 192 с.
Ляшевская О. Н., Шаров С. А. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М., 2009. 1087 с. [Электронный ресурс]. URL: http://dict.ruslang.ru/