LSI-Анализ
Для чего нужен LSI-анализ
Когда-то, в почти доисторические времена, на заре интернета, наивные поисковые машины считали самыми релевантными те страницы, на которых запрос в точной форме встретился больше всего раз. С тех пор всё изменилось, и нашпиговывать текст ключевиками стало не только опасно, но и бесполезно. Наши исследования показывают, что самые сильные из текстовых факторов — те, которые дальше всего от точного запроса. В частности, важны слова, которых в запросе вообще нет — например, синонимы и слова, выделенные в снипете. Последние могут, например, указывать на географическую локализацию (если запрос геозависимый) или определять интент (цели) пользователя: в Москве, недорого, своими руками.
Текст для поисковой машины — это набор взаимодействующих векторов. Каждое слово в нём может свидетельствовать о релевантности (тематической близости) запросу или, наоборот, «уводить» от него в сторону. Как понять, какие слова полезны, а какие, возможно, вредны, если у нас нет доступа к моделям и алгоритмам поисковика? Очень просто: нужно проанализировать то, что он уже находит по интересующим вас запросам.
Поисковые машины не поощряют оригинальность. Главный принцип оптимизации — стать похожим на тех, кто в топе. Даже если ты хочешь быть лучше их, приходится действовать с оглядкой. Слова, которые часто встречаются на страницах, попавших в топ, проверены поисковиком на релевантность запросу, а уход в сторону может быть расценен как попытка побега.
Собственно, в этом и состоит принцип LSI-анализа: сравниваем статистику употребления слов в вашем тексте или на странице вашего сайта со статистикой страниц в топ-10 или в топ-30 и видим, чего у вас не хватает, а что лишнее.
Результаты можно увидеть наглядно: слова в тексте будут раскрашены оттенками зеленого или красным в зависимости от того, встречаются ли они на страницах, попавших в топ, и если да, то насколько часто. А можно изучить таблицы со статистикой.
Только, пожалуйста, не надо бросаться сразу удалять все «красные» слова и без конца повторять «зеленые». Всё хорошо в меру: уникальные слова есть на каждой странице, в том числе и на тех, которые занимают самые верхние позиции. Помните, что текст должен быть в первую очередь естественным, интересным и полезным, и что вы пишете его не только для поисковых машин.
LSI-анализ: список заданий
Тут всё просто: вы видите таблицу со списком запущенных или уже выполненных заданий. По умолчанию они отсортированы по дате, но можно пересортировать по другим полям или, если заданий много, применить фильтры.
В одной из колонок выводятся результаты сравнения проверенных текстов (страниц) со страницами из топа по 100-балльной шкале.
Результаты по заданиям, запущенным по списку страниц, можно выгрузить в формат CSV и затем открыть в Excel.
Запуск LSI-анализа
Вы можете запустить анализ для текста или для списка страниц (задаются URL).
Не забудьте дать заданию «говорящее» название — иначе потом будет трудно его найти.
Выберите поисковую систему (Яндекс или Google), диапазон (топ-10 или топ-30) и регион, из которого должны задаваться запросы. При желании можно указать также тип сайтов (информационные или коммерческие) или страниц — (главные или внутренние; информационные или коммерческие). Информационность сайтов и страниц определяется автоматически.
Если вы оцениваете текст, введите список запросов и сайты-исключения — не забудьте указать в их числе свой собственный сайт, иначе может оказаться, что ваш текст сравнивается сам с собой.
Если вы оцениваете список страниц, укажите для каждой из них по одному или несколько запросов. По странице на строку; в качестве разделителей можно использовать точки с запятой или табуляции, например:
https://example.com/somepage; первый запрос; второй запрос
URL страницы должен быть в начале или в конце — порядок не важен. Данные можно загрузить из файла в формате CSV.
Сайты, с которых берутся страницы для оценки, исключаются из сравнения автоматически.
Во избежание ошибок желательно указать класс (CSS-селектор), в котором выводится SEO-текст. Если явного SEO-текста на странице нет — например, если страница информационная, — желательно задать класс, содержащий основной контент страницы без меню.
Результаты
Раскрашенный текст
Тут нет никаких чисел, зато всё наглядно. Ярко-зеленые слова — это те, которые у конкурентов встречаются часто, тематическое ядро с точки зрения поисковой машины. Другие оттенки зеленого и оранжевый — слова, которые встречаются у конкурентов реже. (Условные обозначения см. на странице Справка.)
Ярко-красное — это то, что встречается только у вас. Увидев «красные» слова не нужно пугаться и сразу их убирать — в них может быть, например, выражена специфика вашего «уникального торгового предложения». Но про те предложения и тем более абзацы, в которых явно преобладает красный цвет, точно стоит подумать — а нужны ли они вам вообще. Может быть, без них можно обойтись, и текст станет короче и яснее?
Серый цвет — «стоп-слова» (для них частота у конкурентов не оценивается). Полужирным выделены слова запросов и то, что поисковая машина выделяет в снипетах.
Статистика: чего в тексте не хватает
Здесь собрана подробная статистика по вашему тексту (и странице, если она проверялась) и страницам конкурентов.
Слова упорядочены по тому, на скольких страницах у конкурентов они встретились (Конкуренты/Страница/Страницы). Выводятся также данные о том, насколько часто они встречаются на тех страницах, где они есть — см. колонки Медиана.
Данные приводятся для страницы конкурента в целом, для SEO-текста (выделяется автоматически), для «текстовых фрагментов» (части страницы за вычетом SEO-текста) и для заголовка <title>.
Полужирным выделены слова, которых у вас значительно меньше, чем у конкурентов. Красным — те, которых в вашем тексте (или на странице) нет совсем.
«Лишнее»: от чего можно избавиться
Здесь приведена статистика слов, которые встречаются у вас, но отсутствуют у конкурентов. Каждое из них может быть вам действительно нужно — и тогда ничего страшного, все тексты разные, и в каждом могут быть уникальные слова.
Но они могут быть и лишними — особенно если они далеки от тематики запросов и уводят читателя в сторону. Например, если только у вас рассказана легенда о том, как в стародавние времена люди пользовались изделиями продвигаемой вами марки, стоит подумать, не избавиться ли от нее: такая оригинальность может мешать продвижению сайта.
Список конкурентов
Здесь собраны все страницы, которые попали в выдачу по вашим запросам — в топ-10 или в топ-30 в зависимости от того, какой вариант вы использовали в задании. Это особенно полезно, если запросов много: конкурентов нужно знать в лицо, а просматривать результаты поиска вручную неудобно.
Страницы ранжированы по «видимости» — в выдачу по скольким запросам каждая из них попала. Для каждой из страниц показаны также ее средние позиции в выдаче.
Уникальность
По многочисленным просьбам мы включили в LSI-анализ проверку на уникальность (плагиат). Она осуществляется через сервис Content-watch.ru и является факультативной; за проверку каждой страницы с вашего счета будет списано по 5 лимитов.
На вкладке «Уникальность» можно увидеть страницы, текст которых «пересекается» с проверяемым, и увидеть фрагменты, которые им соответствуют.
Часто задаваемые вопросы
Как рассчитывается цена за LSI-анализ?
Анализ каждой страницы или текста стоит 50 лимитов, при условии, что вы указали для них не более пяти запросов. Если запросов больше, за каждый дополнительный запрос дополнительно списывается по 5 лимитов.
Для чего и как указывать CSS-селектор для текста?
Если вы проверяете страницы с сайта и не указываете CSS-селектор, текст для анализа выделяется автоматически. Для этого используется алгоритм, который не всегда работает идеально, — это вообще довольно сложная задача, не имеющая идеального решения.
Алгоритм рассчитан на выделение SEO-текста на страницах коммерческих сайтов — например, интернет-магазинов. Он не всегда хорошо справляется с информационными страницами, сайтами услуг, ленгдингами и т. п.
На современных сайтах обычно используется система CSS-селекторов, обеспечивающая не только визуальное оформление текста, но и его логическое структурирование. Грубо говоря, меню оформляется тегами с одним классом, основное содержание страницы — с другим, вспомогательные контентные блоки — с третьим.
Мы рекомендуем для интернет-магазинов и других коммерческих сайтов указывать классы, которыми оформляется SEO-текст; в остальных случаях — классы, содержащие весь основной контент страницы (за исключением меню и других блоков, присутствующих на многих страницах сайта).
Можно указывать классы с тегом (например, div.content) или без него — в последнем случае они должны начинаться с точки (например, .description). В случае необходимости можно «собрать» текст из разных классов — можно указать несколько CSS-селекторов через запятую.
Что означает оценка, которая выставляется тексту?
Оценка в диапазоне от ноля до единицы показывает, насколько лексический состав проверяемого текста соответствует лексике страниц, попавших в топ-10 (или топ-30) по указанным вами запросам. Чем выше, тем лучше.
По нашему опыту, «хорошими» можно считать оценки примерно от 0,6 и выше. Но это зависит от тематики — например, для новостных сайтов оценки могут быть заметно ниже, и это нормально.
В моем тексте совсем не оказалось «красных» слов. Это хорошо?
Это немного подозрительно. Возможно, вы забыли внести свой сайт в список исключаемых, и среди страниц, с которыми сравнивается ваш текст, есть та, с которой он взят. В таком случае лучше внести сайт в список исключений и повторить анализ.