Семантика текста. Ключевые слова
Интернет-журналист, направляя информацию о событиях в виде новостного сообщения, воздействует на читательскую аудиторию. Эффективность взаимодействия текста с аудиторией складывается из двух составляющих:
- Из информационной насыщенности текста, то есть наличие в нем большого объема взаимодополняющей информации. Речь идет не об огромном количестве символов, а о разностороннем описании события с использованием фактов из различных источников.
- Из высокой информативности текста, то есть представленная информация должна нести полезность читателю, быть актуальной и понятной.
Задачи работы интернет-журналиста
Задача автора - добиваться высокой информационной насыщенности в каждом тексте. Чтобы получить этот результат, надо применять правила работы с информацией:
- фиксацией действительности и ее отображением;
- созданием новостного текста;
- освоением текста аудиторией.
Работу интернет-журналиста можно описать с трех сторон:
Семантика текста - это характеристика его отношений с действительностью. Семантическая адекватность предполагает соответствие текста той реальности, которую отражает журналист. Каждая новость должна давать полную и объективную картину действительности. Выделяют 4 вида информации:
- дескриптивная (описание) - описание окружающего мира, факты. Однако каждый журналист по-своему преподносит те или иные факты. Это происходит по причине того, что дескриптивные сведения представляются в свете прескриптивной информации;
- прескриптивная (предписание) - информация, содержащая "социальный идеал" автора, его видение событий;
- валюативная (ценность) - информация, содержащая оценку факта. Она может быть высказана прямо или может содержатся в самом характере подачи информации материала;
- нормативная (норма) - рекомендации автора к действиям в той или иной ситуации. Эта составляющая более характерна статьям, чем новостным сообщениям.
Синтаксический аспект - это размещение рассмотренных ранее элементов структурных компонентов в конкретном тексте.
Прагматическая адекватность достигается при соблюдении трех необходимых условий информативности:
- небанальность;
- декорируемость - степень пригодности для понимания;
- релевантность - ценность в данный момент времени, ценность для аудитории сообщаемых сведений.
Декорируемость - это доступность сообщения, возможность понимания его аудиторией в соответствии с замыслом журналиста, извлечение из текста смысла, адекватного заложенному в него значению. Зависит от:
- использования доступного для потенциального читателя языка;
- степени учета уровня знаний, каким располагает потенциальная аудитория каждого новостного сообщения;
- ориентация на эмоциональный опыт аудитории и соответствующий образный язык;
- требуется ориентированость журналиста в социальной позиции собеседников, знание их образа мысли, менталитета аудитории.
Основанием для формирования той или ной структуры текста служит решение семантических и синтаксических вопросов в связи с найденным обоснованием прагматической адекватности текста. Все зависит от реальной потребности данной аудитории в информации, способностей потребителя, для активного восприятия информации и ее творческой переработки.
В течение жизни человек накапливает определенный словарный запас. Самые простые, часто употребляемые слова, запомнившиеся еще в раннем детстве, человек начинает произносить автоматически, не задумываясь о их смысле. В дальнейшем, узнавая новые слова, человек выясняет их значение, запоминает и использует произвольно в том значении, в котором он определил для себя.
В то время как у каждого человека при произнесении слова возникает собственный ассоциативный образ, у каждого слова есть объективное значение, выяснением которого занимается семасиология.
Семасиология - это раздел языкознания, занимающийся лексической семантикой, то есть значениями тех языковых единиц (слов и словосочетаний), которые используются для называния, номинации отдельных предметов и явлений действительности. Задачи семасиологии решаются в рамках более общей дисциплины - семантики, в предмет которой входит изучение значения слов и их изменения. Семантика помогает читателю понять суть текста. Особые комбинации слов формируют нить повествования. Грамотно сочетая слова и фразы, автор создает тексты, направляющие читателя, привлекающие или побуждающие.
Поисковые системы широко используют основы семантики для подбора материалов в ответ на запросы пользователей. Семантический анализ текста, проводимый любой поисковой системой, моментально определяет смысл статей.
Ключевые слова
Ключевые слова представляют собой слова (или их набор), которые описывают тему сайта или текст, и используются поисковыми системами для обеспечения точного соответствия (релевантности) результатов поиска.
Ключевые слова в новостном сообщении имеют ряд признаков:
- высокая степень повторяемости этих слов в тексте, частотность их употребления. Ключевые слова должны повторятся чаще других слов, если иные слова повторяются чаще ключевых слов, то их количество надо уменьшить;
- способность конденсировать, свертывать информацию, выраженную целым текстом, объединять его основное содержание. Данный признак ярко виден в заголовках и лид-абзацах.
При выборе ключевых слов для своего новостного сообщения, надо выбирать те ключевики, которые наиболее ярко раскрывают тему. При этом стоит избегать случайных и общих фраз, избегать повторов более 3-4 раз в тексте одних и тех же ключевых слов.
Алгоритм "формального определения зон наиболее вероятного расположения ключевых слов в тексте":
- определяется наиболее повторяющееся слово в тексте;
- определяются местоимения и синонимы к нему;
- необходимо установить интервал между основным словом и словами слева и справа от него. Оптимальной "тематической зоной" является интервал 3 слова;
- определение знаменательных слов или имен собственных;
- выбор падает на последние слова предложения, которые чаще всего являются ключевыми. Это рематическая зона расположения ключевых слов.
Тема - называемая или подразумеваемая, не содержащая новизны, информация новостного сообщения, логическое подлежащие суждения.
Рема - логическое сказуемое суждения, содержащие новую информацию о предмете сообщения. Она составляет ядро и основное содержание высказывания.
Определив ключевые слова, следует начинать составлять связный текст. Ведь ключи составляют не только содержательную сторону, но и образуют ряд связанных отношениями обусловленности опорных слов.
Часто ключевики выделены повторами разных типов, они последовательно занимают сильные места в тексте:
- лексическими;
- синонимическими;
- морфемными;
- синтаксическими.
Дальнейшая работа состоит в выявлении таких семантических и ассоциативных комплексов. На этом этапе происходит формирование словообразовательных гнезд: выбор однокоренных слов, группировка тематических групп, морфологических и синтаксических средств.
Ключевые слова и фразы делят на:
- Основные (релевантные) - имеют прямое отношение к теме, без них невозможно ответить на шесть главных вопросов: кто? что? где? когда? почему? как?;
- Сопутствующие - относятся к основному ключевому слову при ответе на один или несколько главных вопросов;
- Второстепенные - относятся к сопутствующим ключевым словам. Цель второстепенных ключевых слов заключается в предоставлении контекстного дополнения к вашей основной ключевой фразе. С помощью логических связей таких слов и раскрывается основная тема.
Помимо указанных групп ключей, существуют фразы-связки и уточнения, которые необходимы для более полного раскрытия темы новостного сообщения.
Значимые слова - ключевые слова вместе с фразами, описывающими и уточняющими событие.
Термины семантического анализа
Ключевые слова широко используются в коммерческих целях, в текстах, для поисковой оптимизации. Программы во время проведения семантического анализа используют следующие термины:
"Вода" - часть текста, не несущая смысловую нагрузку и не раскрывающая главную тему текста. Обычно "вода" включает плеоназмы, ненужные глагольные связки и фразы, которые можно заменить одним словом. Показателем является процентное соотношение незначимых слов к их общему количеству. Считается, что "воды" в тексте должно быть не более 40%. В тоже время текст совсем без "воды" будет выглядеть не живым и сухим.
"Стоп-слова" - предлоги, союзы, слова-связки, вводные слова. Поисковыми роботам они не распознаются и не воспринимаются. Показателем является количество и процентное соотношение стоп-слов. В статьях их- должно быть не более 5%.
Уникальные слова - слова, встречающиеся в тексте хотя бы 1 раз без учета повтора.
Значимые слова - слова, определяющие значимость текста, чаще всего это имена собственные и существительные; обычно одна группа значимых слов характерна только для одного конкретного события. В эту категорию входят ключевые и опорные слова.
"Тошнота" - является основным показателем. Это "тавтология", или оценка степени "заспамлености" текста частыми повторами слов. Поисковый робот может зациклится и остальные ключевые слова не воспринимать, что сведет к 0 все усилия автора. Есть два вида тошноты:
- классическая - характеризуется коэффициентом заспамлености самым повторяющимся словом, и определяется квадратным корнем из количества повторений самого "тошнотного" слова.Оптимальное значение указанного показателя равно 7, максимальное - 10;
- академическая - этот показатель растет при увеличении количества различных повторяющихся слов.
Семантическое ядро
Семантическое ядро сайта - база поисковых слов, их словосочетаний и морфологических форм, которые наиболее точно характеризуют вид деятельности, товары и услуги, предлагаемые сайтом, и специально подобранные для его продвижения. Обычно формируются с помощью специальных сервисов и с привлечением специалистов по оптимизации, вебмастеров. Зная семантическое ядро и алгоритм поиска, любой текст можно переформулировать так, чтобы существенно увеличить частоту его появления в результатах поиска. Нахождение такой оптимальной формулировки является целью поисковой оптимизации.
Для интернет-журналистики мы будем рассматривать семантическое ядро относительно новостного сообщения - как подборку понятий, имеющих существенное значение для определенной предметной области.
Точное определение семантического ядра зависит от области применения. В статистическом анализе текста существуют смысловые единицы, сходные с семантическим ядром:
- специфичные слова предметной области - это слова, которые встречаются исключительно в текстах предметной области. Чаще всего это профессионализмы, термины, слова с ярко выраженной стилистической окраской;
- высокоинформативные слова предметной области -это такие слова, которые позволяют рубрицировать тексты внутри предметной области.
Эти классы слов частично пересекаются и дополняют друг друга, но для их нахождения используются разные подходы, основанные на векторной модели текста. Специфичность слова оценивается по частоте появления слова внутри и вне множества текстов предметной области. Информативность оценивается по характеристикам распределения в текстах предметной области.
Специфичные и высокоинформативные слова могут быть опорными.
Опорные слова обозначают тему текста и позволяют определить не только его основную мысль, но и последовательность рассуждений. Определение опорных слов дает возможность выделить микротемы и более логично показать развитие событий, полностью раскрыть тему за короткое время.
Семантическое поле - самая крупная смысловая парадигма, объединяющая слова различных частей речи, значение которых имеют общий семантический признак.
В научном контексте методология семантического анализа описывается как интерпретация речевых конструкций, а также установление содержательного компонента в отношениях между частями текста. Элементами анализа могут выступать не только отдельные слова, но и их сочетания, общий смысл предложений и целого текста. Обращаясь к семантическому анализу текст изучается не только как совокупность слов и предложений, но и как выражение идеи, заложенной автором.
Семантическое ядро в интернет-журналистике - это логическая взаимосвязанность опорных слов и фраз, отражающих содержание конкретного новостного сообщения. Именно семантическое ядро служит ориентиром для поисковых систем при отнесении новостного сообщения к соответствующему сюжету в новостных агрегаторах, а также играет важную роль в ранжировании.
С развитием интернет-СМИ и интернета в целом, семантика получила значимую роль в осуществлении коммуникаций пользователя с поисковыми системами через поисковые запросы. По мере того, как алгоритмы поисковых машин менялись, подстраиваясь под запросы и ожидания читателей, менялись и способы использования ключевых слов. Современные поисковики и новостные агрегаторы отдают приоритет тем источникам, которые предоставляют полезные и информативные тексты, включающие, помимо набора ключевых слов и смысловую составляющую. Чтобы научится составлять тексты с полным семантическим ядром можно пользоваться программой http://istio.com.