• Что такое кластеризация семантического ядра и как делать группировку? Кластеризация запросов семантического ядра. Что это? Как сделать? Автоматическая кластеризация

    В своей предыдущей статье: « » я назвал кластеризацию одним из основополагающих факторов успеха в продвижении. В этой публикации я подробно разбираю, что такое кластеризация, и как правильно применять её.

    Что такое кластеризация?

    Это автоматическое объединение запросов в группы, которое решает две важные задачи:

    1. Объединение похожих запросов (с одинаковым «интентом») вне зависимости от их семантической схожести. («интент» = намерение пользователя). Например, запросы «снять квартиру» и «аренда квартир» - выражают одно и то же желание пользователя.
    2. Проверка совместимости продвигаемых запросов: можно ли их продвинуть на одной странице в топ Яндекса одновременно . Т.е. возможно ли подстроить оптимизацию страницы под все эти запросы. Или же какие-то запросы требуют выноса на отдельную страницу.

    Из всех существующих сегодня методов наиболее эффективно эти задачи решает, так называемая, «кластеризация по топам », когда запросы сравниваются по количеству одинаковых URL-ов в топ-10 Яндекса.

    Теперь поговорим о каждом пункте подробнее.

    Объединение запросов с одинаковым интентом

    Что такое запросы с одинаковым интентом ? Это разные запросы, в которых человек, на самом деле, ищет одно и то же. Очевидно, что запросы «телевизоры самсунг » и «телевизоры samsung » должны продвигаться на одной странице. Но это - явные вещи.

    Однако существуют и куда менее очевидные примеры:

    • «спецодежда» - «рабочая одежда»
    • «ипотека» - «кредит под залог квартиры»
    • «автоломбард» - «кредит под залог авто»

    Семантически эти пары совсем не похожи, но фактически обозначают одно и то же. Классические способы поиска таких запросов, обладающих единым интентом (намерением пользователя), основываются на синонимах. Как правило, с этой целью используют словари синонимов или синонимы Яндекса . Однако в обоих методах есть свои серьезные минусы.

    Если мы будем пользоваться словарями синонимов, то найдем там весьма странные связи. Например, согласно одному из самых популярных словарей, синонимом к «мобильный телефон» являются:

    • мобила
    • мобильник
    • радиотелефон
    • сотовик
    • сотовый телефон
    • телефон
    • эбонитовый друг

    Сотовый телефон - однозначно полезный синоним. А вот «радиотелефон» - совершенно другой тип товара. Ну а кто такой «эбонитовый друг», остается только догадываться.

    Второй вариант поиска синонимов - попытаться «выцепить» их из подсветок Яндекса. Но это сопряжено с двумя проблемами:

    Во-первых, подсвечиваются не только синонимы, но и другие слова. Например, в подсветку по ключевой фразе «сотовые телефоны» попадает не только синоним «мобильные», но и: «цены», «москва», «купить», «каталог», которые подсвечиваются по другим причинам. В целом, это проблема решаемая, обходные пути есть.

    Во-вторых, синонимы в Яндексе являются невзаимными . Например, вхождение «мобильные телефоны» является синонимом к запросу «сотовые телефоны», а в обратном порядке это уже не работает. «Сотовые телефоны» не будет синонимом к «мобильные телефоны», и этот момент становится критически важным. Как понять, что запрос «сотовые телефоны» соотносится с запросом «мобильные телефоны», если слово «сотовые» по нему не подсвечивается?

    Наконец, как вы поймете, что запросы «ювелирный магазин», «ювелирные изделия» и «ювелирные украшения» обладают одним интентом, если, с точки зрения Яндекса, они не являются синонимами?

    Решение проблемы приходит через кластеризацию запросов по топам. Нахождение в топе одинаковых URL-ов сигнализирует об одинаковом интенте. Вот пример работы кластеризатора just-magic:

    Вроде бы, кластеризатор все правильно объединил: «мобильные телефоны» положил в одну группу с «сотовыми», а «ювелирные изделия» — в группу, где присутствует «ювелирный магазин». Почему же тогда «ювелирные украшения» попали в отдельную группу, несмотря на то, что тематика здесь та же (это видно по столбцу «spec-grp»)?

    Ответ на этот вопрос приводим в следующей части статьи.

    Проверка совместимости продвигаемых запросов

    Для продвижения нам не просто нужно собрать на странице похожие запросы, необходимо еще и проверить их совместимость.

    В Яндексе нет единой формулы ранжирования под все запросы. Запросы делятся на большое количество типов. И формулы для разных типов запросов часто предъявляют к странице взаимоисключающие требования для попадания в топ. Причем часто визуально эти запросы очень похожи. Например, запросы «смартфон» и «смартфоны». Первый — некоммерческий, геонезависимый. Второй - коммерческий геозависимый. Как видно, в данном случае единственное и множественное число - несовместимы на одной странице!

    Если вы вдруг подумали что это логично, то вот другой пример: запросы «ноутбук» и «ноутбуки». Они оба коммерческие и геозависимые и прекрасно совмещаются на одной странице.

    Коммерческость и геозависимость - лишь два самых очевидных признака. На самом деле, их намного больше. Например, главную или внутреннюю страницу поиск хочет видеть в топе по запросу. Когда мы не знаем всего многообразия признаков, единственный способ определить возможность совместного продвижения запросов на странице - это посмотреть, есть ли URL-ы, которые одновременно показываются по двум запросам, и подсчитать, сколько их.

    Логика здесь следующая:

    • Если по запросам в топе находятся одинаковые URL-ы, значит их можно продвинуть на одной странице.
    • Если по запросам общих URL-ов нет, то мы не знаем, возможно ли продвинуть запросы на одной странице. Скорее всего, это невозможно.

    И здесь мы сталкиваемся с вопросом: как именно объединять запросы на основании топов? Я различаю два метода - так называемые, «soft» и «hard» кластеризации.

    Следующая картинка наглядно объясняет разницу между ними:

    Soft-кластеризация сводится к следующему: для формирования группы берется один «центральный» запрос и все остальные сравниваются с ним по количеству общих URL-ов в топ-10 Яндекса. Если количество общих URL-ов превышает порог - запрос добавляют в группу.

    При hard-кластеризации запросы объединяют в группу, только если есть общий для всех запросов набор URL-ов, который показывается по всем этим запросам в топ-10.

    Soft-кластеризация дает группы бὸльшего размера, но часто ошибается в определении возможности совместного продвижения запросов на странице.

    Классический пример : представим себе, что в качестве «центрального» был выбран запрос, по которому в топе 5 главных и 5 внутренних страниц. К нему могут оказаться привязаны два запроса, у одного из которых в топе 10 «морд», у другого - 10 «внутряков». Очевидно, что из этих трех запросов мы можем продвинуть только два (в зависимости от типа страницы, который выберем - главная или внутренняя). В случае hard-кластеризации появление такой группы невозможно.

    Но это все лирика. Перейдем к численным оценкам.

    Итак, у нас есть два критерия оценки кластеризации:

    1. Насколько полно собрана группа запросов. То есть, попали ли в неё все запросы, имеющие один и тот же «интент». За 100% возьмем ситуацию, когда все запросы с одним интентом - попали.
    2. Насколько попавшие в группу запросы совместимы между собой. За 100% возьмем ситуацию, когда все попавшие в кластер запросы совместимы между собой.

    Ключевой параметр кластеризации - минимальное количество общих URL-ов для образования группы. Это число называют «порогом кластеризации ». Чем он выше - тем точнее получаемые группы, но при этом они закономерно уменьшаются в размерах. Экспериментальным путем было определено, что минимальный рабочий порог для «hard»-кластеризации - 3 URL-а, для «soft» - 4 URL-а. Работать с меньшим числом - нет смысла: слишком много «левых» запросов попадает в группы.

    Вот пример результатов для разных порогов для hard-кластеризации:

    Используя сервис just-magic.org , мы провели сравнение двух методов кластеризаций на выборках из разных тематик. Ниже представлен сводный график:

    Сравнения проводилось для методов «soft» и «hard». Для числа пересекающихся URL-ов от 3-х до 6-ти (это минимальное число общих URL-ов для формирования кластера).

    Как видно из графика, hard-кластеризация показывает очень высокую точность уже при пороге в 3 URL-а - 92%. Чтобы читатели статьи понимали, насколько это большая цифра, приведу пример: в исполнении опытного оптимизатора без инструментов точность будет составлять порядка 70%, а если за работу возьмется неопытный специалист, точность не будет превышать 30%. При этом, однако, полнота получается достаточно низкая - всего 40%. Но, опять же, смотря, с чем сравнивать. «Руками» оптимизаторы набирают максимум 20%.

    Soft-кластеризация демонстрирует очень хорошие показатели полноты, но точность - «хромает на обе ноги». Приемлемые для продвижение значения получаются только на пороге «5», но при этом полнота падает до 23%.

    Означает ли это, что данный метод неприменим? Нет. Все зависит от вашей задачи. Если вы занимаетесь «трафиковым» продвижением, и вам важно вывести на странице как можно больше запросов - неважно каких, то вам подойдет soft-кластеризация. Именно поэтому, когда в январе этого года в сервисе just-magic.org появилась hard-кластеризация, для модуля «маркеры» был сохранен «soft»-режим.

    Если же вам важно вывести на странице определенный набор запросов, то ваш выбор однозначен - только hard-кластеризация, только хардкор. Еще один плюс hard-кластеризации состоит в том, что получаемые группы - однозначны. То есть, запросы, оказавшиеся в одной группе по 4 URL-ам, не могут оказаться в разных группах по 3 URL-ам (при использовании soft-кластеризации, такое запросто может быть). Поэтому кластеризатор Just-Magic отображает группы сразу по 3,4,5 и 6 URL-ам.

    Стоит отдельно отметить, что если мы хотим в дальнейшем проводить текстовый анализ страницы, то допустимо использовать только hard-кластеризацию. Дело в том, что любой текстовый анализ по группе запросов для страницы очень строго соотносится с качеством этой группы. Только hard-кластеризация обеспечивает группы нужного качества.

    Подведем итоги

    Итак, какие бонусы дает кластеризация?

    Во-первых, это ускорение процесса разбора больших ядер. Раньше на это уходили недели и месяцы работы. С помощью кластеризатора оптимизатор делает это за пару часов.

    Во-вторых, это возможность распределить запросы по страницам таким образом, чтобы их было возможно одновременно продвинуть. «Ручной» альтернативы кластеризации здесь нет - даже опытный оптимизатор совершает до 30% ошибочных распределений, если действует «на глазок».

    Исходя из второго пункта, становится понятно, что кластеризацию при продвижении нужно использовать всегда . Даже если ядро меньше 100 запросов, сделать правильно распределение запросов по страницам «на глазок» вы не сможете. Исключением могут стать только тематики со сверхнизкой конкуренцией, где кластеризация по топам перестает работать из-за отсутствия в топах релевантных ответов.

    Если вы занимаетесь «трафиковым» продвижением, то можете пользоваться как «soft», так и «hard» методами кластеризации. Если же осуществляете «позиционное» продвижение, когда важно вывести в топ все запросы, то подойдёт только метод «hard». Также, с совместим только «hard»-режим.

    Используйте кластеризацию в своей работе, и вы обретете счастье и гармонию, а продвигаемые вами запросы гарантированно попадут в топ!

    Когда есть уже список запросов, это еще не семантическое ядро — надо бы для начала раскидать запросы по страницам, чтобы иметь представление о том, как наполнять сайт. Без хорошей семантики будет очень трудно получать трафик из поиска.

    Что такое кластеризация запросов

    Кластеризация запросов – это как раз распределение поисковых запросов одной тематики на группы для продвижения посадочной страницы.

    Кластеризация включает в себя следующие процессы:

    • группировка запросов в зависимости от намерений пользователя (интента);
    • проверка совместимости ключевых запросов для продвижения на одной странице в топе Яндекса.

    Запросы с одинаковым интентом – это разные запросы, через которые человек, по сути, ищет одну и ту же вещь. Очевидным примером служат запросы [ручка Parker] и [ручка Паркер]. Сложнее дело обстоит с такими синонимами как: [настольная лампа] – [ночник], [свидетельство о рождении] – [метрика], [монитор] – [экран]. Трудность заключается в том, что при поиске синонимов ключей через словарь Яндекса, система далеко не всегда предлагает адекватную выборку.

    На практике похожие запросы могут обладать уймой разных характеристик, из-за которых их нельзя будет разместить на одной странице. На помощь приходит кластеризация запросов по топам. Кластеризатор находит в топе выдачи поисковой системы одинаковые URL-ы, тем самым сигнализируя о присутствии одинакового интента. Результат работы выражается в следующем:

    • присутствие одинаковых URL-лов в топе по запросам означает возможность их продвижения на одной странице;
    • отсутствие общих URL-лов говорит, с высокой вероятностью, о невозможности такого продвижения.

    Зачем нужна кластеризация

    С помощью автоматических кластеризаторов можно быстро группировать даже самые большие семантические ядра. Если раньше на разборку ядра уходили недели и месяцы, то благодаря кластеризаторам работа сокращается до пары часов. Большим плюсом кластеризации является распределение запросов по страницам таким образом, чтобы их было возможно одновременно продвинуть. Сложно представить ручной аналог кластеризации высокой точности, так как даже опытный оптимизатор совершает до 30% ошибочных распределений. Из этого следует, что кластеризация ключевых слов необходима практически в любом случае.

    Когда я был вебмастером-чайником, я делал сайт, где под каждый запрос была отдельная статья. Конечно же, трафика он не получал — получился только фейл. И это проблема реально многих начинающих — неправильные запросы или неправильная кластеризация.

    Методы кластеризации

    При группировке запросов возникает неопределенность в методике их объединения на основании топов. На практике выделяют два основных метода: “soft” и “hard” кластеризация.

    Soft-кластеризация основывается на формировании группы с одного «центрального» запроса. Всех остальных подвергают сравнению с ним по количеству общих URL-ов в топ-10 Яндекса. Soft-кластеризация формирует группы достаточно большого размера, но часто возникают ошибки в определении возможности совместного продвижения запросов на странице.

    Hard-кластеризация характерна объединением запросов в группу, когда есть общий для всех запросов набор URL-ов, который показан по всем этим запросам в топ-10.

    Различают два критерия оценки кластеризации:

    1. Полнота – количество запросов в группе, имеющих один и тот же «интент». Если все запросы с одинаковым интентом попали в одну группу, показатель полноты – 100%.
    2. Совместимость запросов между собой, попавших в одну группу. За 100% принимают случай, когда все попавшие в кластер запросы совместимы между собой.

    Важную роль играет такой параметр как «порог кластеризации ». Это минимальное количество общих URL-ов для образования группы. Большое число означает высокую точность групп, однако при этом они закономерно уменьшаются в размерах. Опыт использования кластеризаторов семантики показывает, что минимальный рабочий порог для «hard»-кластеризации – 3 URL-а, для «soft» – 4 URL-а.

    Даже при пороге в 3 URL-а hard-кластеризация обеспечивает точность выше 90%. Для сравнения: без использования инструментов точность работы опытного оптимизатора, в лучшем случае, составит 70%, а новичка – не более 30%. Несмотря на высокую точность, “hard” метод дает лишь около 40% полноты.

    Soft-кластеризация обладает высоким показателем полноты, но существенно проигрывает в точности. Таким образом, “soft” и “hard” методы являются обратно пропорциональными по отношению друг к другу. Использование того или иного метода зависит от целей оптимизационного процесса.

    При «трафиковом» продвижении, когда важно вывести на страницу как можно больше любых запросов, лучше подходит soft-кластеризация. Если осуществляется «позиционное» продвижение, то решающее слово за hard’ом.

    Также hard-кластеризацию применяют при текстовом анализе страницы. Любой текстовый анализ по группе запросов для страницы довольно строго соотносится с качеством этой группы. Только “hard” метод обеспечивает группы нужного качества.

    Как сделать группировку семантического ядра

    Я обычно делаю кластеризацию в два этапа. В первом этапе я закидываю ядро в какой-нибудь сервис/программу автоматической кластеризации, а на втором этапе я добиваю ядро вручную. Через Excel. Вот примерно как эти мужичары:

    На этих видео в принципе понятно, как делать ручную добивку, а по поводу автоматических кластеризаторов — тут уж каждый выбирает, что ему больше по вкусу.

    Semparser

    Автоматический группировщик запросов от Топвизора представляет собой альтернативу Rush Analytics и Semparser, причем по интерфейсу похож на последний. Степень группировки и сохранение проекта в Exсel-файл присутствует.

    В кластеризаторе Топвизора присутствует операция «перегруппировка». После ее применения количество групп возрастает, а число запросов в них заметно уменьшается. Данная функция пригодится тем, кого не устраивает soft-кластеризация и подойдет хард-вариант.

    «Перегруппировка» тут платная, хотя и снимает не больше пары рублей.

    Достоинство Топвизора основано на большой скорости группирования. Семантическое ядро в 1000 запросов кластеризатор распределит за считанные минуты. Недостатки: дороговизна группировки и, конечно же, необходимость в ручной правке.

    Группировка через Key Collector

    Еще один пример автоматического кластеризатора представлен в качестве онлайн-инструмента на сайте coolakov.ru . Разбивка запросов на группы производится на основе схожести топ-10 Яндекса.

    Плюс: бесплатный онлайн-сервис.
    Минусы: невысокая точность группировки, отсутствие выгрузки в файл.

    Поводя итог, можно с уверенностью остановить свой выбор на автоматических кластеризаторах, предлагаемых различными онлайн-сервисами. Но, к сожалению, работа любого кластеризатора требует ручной доработки.

    Сегодня поговорим о таком важном процессе в подготовке к созданию контента для сайта, как кластеризация семантического ядра. Это группировка ключевых запросов из ядра по группам, чтобы каждой группе соответствовала своя страница. После сбора ключевых слов для проекта, они — список без какой-либо структуры и иерархии. В списке запросы как очень похожие друг на друга, так и которые существенно отличаются по смыслу.

    Кластеризация предусматривает группирование запросов, для максимальной релевантности одной странице. Кластеризацию проводят как руками, так и автоматически с помощью множества сервисов, существующих в интернете. Давайте рассмотрим все методики, которые возможно применить распределяя и группируя запросы по страницам сайта.

    Содержание статьи:

    Ручная кластеризация запросов ядра сайта


    Несмотря, что она достаточно трудоемкая и занимает много времени, является наиболее качественным вариантом группировки. Подходить для небольших проектов, когда количество ключей не слишком большое. Если ключей несколько тысячи, то лучше провести автоматическую кластеризацию, а потом доработать результаты руками.

    Делается она просто. Ключи собираются в отдельные группы по смыслу. Чтобы было понятнее, приведу пример. Есть собранные ключевые слова для информационного проекта о болезнях грудных детей. Нужно разбить все семантическое ядро на группы по отдельным болезням, чтобы написать о них и о способах лечения конкретные статьи.


    Выбирая из массы ключей, собранных по запросу «Грудничок», те, которые содержат слово «тремор», мы соберем кластер ключей, где будут все запросы, относящиеся к тремору у грудничков. Именно их и нужно использовать в написании статьи о болезни.

    В ручной группировке хорошо поможет обычный Excel или Google Таблицы, позволяющие сортировать, фильтровать и выделять нужные строчки и слова в них. Также есть бесплатные сервисы, облегчающие ручную группировку. Это, например, сервис Keyword Assistant, позволяющий в несколько кликов выделить нужные ключи из общего списка и поместить их в группу.

    Автоматическая кластеризация запросов — онлайн сервис

    Автоматическая кластеризация выполняет по определенным алгоритмам. Она делает все то же самое, что и человек. Из плюсов стоит выделить скорость работы в тысячи раз быстрее ручной, а также анализ ключевых слов и их позиций в поисковой выдаче.

    Из минусов – полное отсутствие логического мышления у алгоритмов, за счет чего нередко попадаются неверные включения запросов в группы. Также явно подходящие по смыслу запросы могут не включаться в одну групп. Пример, запросы «Как одевать ребенка при низкой температуре на улице» и «Температура 39 у ребенка» — это запросы, относящиеся к разным группам, но алгоритмы чаще объединят их в одну.

    Все равно после автоматической кластеризации семантическое ядро нужно дорабатывать руками, приводя его к идеальному виду. От качества группировки напрямую зависит дальнейшая оптимизация сайта.

    Для автоматической работы я рекомендую сервис Rush Analytics , являющийся мощным инструментом в помощь оптимизатору. Достаточно добавить все ключевые запросы и программа сгруппирует их максимально быстро. Единственный минус – сервис достаточно дорогой и если вам нужно единоразовое использование, то лучше найти оптимизатора, имеющего подписку. За сотню-другую рублей он добавить ключи для прогона в сервисе.

    Актуальны и следующие ресурсы: Seo intellect, KeyAssistant.

    Особенности кластеризации семантики для коммерческих сайтов

    Если с запросами для информационных проектов все понятно. Здесь у нас стоп-словами являются все коммерческие фразы со словом купить, заказать и т.д., то с коммерческими не все так однозначно. Стоит немного уделить внимание тому, как лучше сгруппировать ключи, например, для интернет-магазина.

    К примеру, магазин электроники будет продавать телевизоры. Есть масса запросов со словом телевизор и нам необходимо их кластеризировать. Все запросы, которые относятся к коммерческим, типа «Купить телевизор Samsung», «Купить телевизор диагональ 43», мы распределяем по своим кластерам: по брендам, диагонали или другим свойствам.

    А вот информационные запросы вроде «Как выбрать хороший телевизор» или «Какой телевизор хороший в 2017 году» мы сортируем отдельно и в структуре сайта предусматриваем блоговый раздел, где будем рассказывать пользователям о выборе или преимуществах того или иного свойства техники. Так мы сможем привлечь больше трафика за счет и информационных запросов.

    Как видите, кластеризация семантического ядра – это несложно, просто занимает достаточно много времени. Но является одним из столпов в подготовке к запуску проекта.

    • Читайте статьи по этой теме:

    В небольшом SEO-отделе большого контентного проекта, где я работаю, решили увеличить штат. Набирать планировалось людей с небольшим опытом или совсем без опыта. По этой причине было решено создать некий гайд, который бы служил исчерпывающим руководством по написанию новых статей. Руководство получилось действительно подробным и полным, один из его важных блоков – это кластеризация запросов.

    Зачем нужны сервисы кластеризации?

    В один кластер должны быть объединены только такие запросы, которые имеют хорошие шансы выйти в топ-10 поисковых систем с общей релевантной страницей. То есть, если по двум запросам в выдаче все страницы сайтов разные и нет пересечений, то следует относить их к разным кластерам. Также и наоборот: если два запроса возможно продвинуть на одной статье, то не следует разносить их на разные кластеры, чтобы не писать лишнего – бюджет на контент не резиновый.


    Общая схема составления ТЗ на написание SEO-статьи следующая:

    1. Сбор семантики – статистика поисковых систем, базы семантики, внутренняя статистика проекта;
    2. Кластеризация автоматическая – сервис или программа для кластеризации по подобию топов;
    3. «Посткластеризация» ручная – обработка того что не удалось кластеризовать автоматически;
    4. Приоритезация – определение важности полученных запросов в каждом кластере;
    5. Оформление ТЗ для копирайтера – лемматизация, LSI и различные указания для написания статей, по статье на каждый кластер.

    Вот именно для второго пункта нужно было выбрать самый подходящий сервис автоматической кластеризации. Для этой цели я провел сравнительный анализ самых известных, на мой взгляд, сервисов.

    Способы кластеризации

    Из способов, которые автоматизированы в каких-то известных сервисах или программах, можно выделить два:

    • По подобию топов (по поисковой выдаче);
    • По .
    Исходя из задачи – написание SEO-статей, был выбран метод по подобию топов. Поисковая система на трафик с которой мы ориентируемся – Яндекс, поэтому для кластеризации использовался топ-10 Яндекса. У данного метода есть два вида:
    • Soft – когда все запросы кластера связаны хотя бы с одним общим (маркерным) запросом;
    • Hard – когда каждый запрос связан со всеми запросами в своем кластере;
    а также такой параметр как «сила связи» – количество общих URL в поисковой выдаче по запросам.

    По рекомендациям создателей сервисов кластеризации для нашего случая был выбран вариант Soft с силой связи 4. Это важный момент, потому что для интернет-магазина, например, следовало бы выбирать другие опции.

    Методика сравнения

    Суть сравнения сервисов в следующем: выбрать идеально кластеризованный список запросов – эталонное ядро. Сравнить результаты кластеризации каждого сервиса с эталонным.


    Важно было хорошо составить такое эталонное ядро. Поскольку у нас контентный проект и большая часть контента – это вопросы и ответы пользователей, то материала для сбора статистики по проекту предостаточно.


    Было взято ядро на 2500+ ключевых фраз, которое отслеживается уже много месяцев. Из него выбраны только запросы вышедшие в топ-5 Яндекса. И из них взяты только те которые имеют релевантной страницу одного из широких разделов (категория вопроса, тема вопроса, категория документа, страница с формой «задать вопрос»), а не узкую страницу вопроса с ответами. Запросы были сгруппированы по релевантной странице. Оставлены только группы в которых более чем 4 запроса. В итоге получилось 292 запроса разбитых на 22 кластера.


    Забегая вперед скажу, что сравнивались результаты кластеризации по Московской выдаче Яндекса и без геопривязки. Региональная московская выдача показала себя лучше, поэтому далее будем говорить про нее.

    Сравнение сервисов

    В поиске самых популярных сервисов очень помог доклад Александра Ожгибесова на BDD-2017, к тем, что у него было добавлено еще несколько сервисов, получился такой список:

    1. Топвизор
    2. Pixelplus
    3. Serpstat
    4. Rush Analytics
    5. Just Magic
    6. Key Collector
    7. MindSerp
    8. Semparser
    9. KeyAssort
    10. coolakov.ru

    Первое на что проверялись полученные в результате кластеризации эталонного ядра по этим сервисам группы – это не делает ли сервис слишком широкие группы. А именно не попали ли запросы из разных групп эталонного ядра в один кластер по версии сервиса.


    Но только такого сравнения не достаточно. Сервисы делятся на два подхода к некластеризованному остатку фраз:

    • сделать для них общую группу «Некластеризованные»;
    • сделать для каждой некластеризованной фразы группу из нее одной.
    По причине п.2 появилась необходимость смотреть на количество фраз, которые находятся в одной группе эталонного ядра и попали в разные по сервисам.

    В сравнении я использовал оба этих параметра в виде соотношения – какой процент фраз от общего количества попал не в свою группу.


    Результаты сравнения:

    • Топвизор
      • разные группы эталона в одной по сервису – 4%
    • Pixelplus
      • одна группа эталона в разных по сервису – 7%
    • Serpstat
      • разные группы эталона в одной по сервису – 0%
    • Rush Analytics (132 фразы, demo)
      • разные группы эталона в одной по сервису – 11%
      • одна группа эталона в разных по сервису – 8%
    • Just Magic
      • разные группы эталона в одной по сервису – 0%
      • одна группа эталона в разных по сервису – 9%
    • Key Collector
      • разные группы эталона в одной по сервису – 12%
      • одна группа эталона в разных по сервису – 16%
    • MindSerp – не удалось получить демо, не выходят на связь
    • Semparser
      • одна группа эталона в разных по сервису – 3%
    • KeyAssort
      • разные группы эталона в одной по сервису – 1%
      • одна группа эталона в разных по сервису – 1%
    • coolakov.ru
      • разные группы эталона в одной по сервису – 0%
      • одна группа эталона в разных по сервису – 18%

    Итоги

    В качестве оптимального решения для нашего проекта была выбрана программа KeyAssort – это именно программа, а не онлайн-сервис, лицензия покупается однократно, привязывается к железу.


    Неплохие результаты показал популярный онлайн сервис Serpstat, но для нашего случая чуть хуже, а также значительно дороже. Если брать большие объемы запросов в месяц и использовать его только для кластеризации – он не рентабелен. Возможно, если использовать кластеризатор вместе с другими его инструментами, то он и окажется приемлемым по цене.


    Самые худшие показатели у программы Key Collector, что все равно не отменяет необходимость ее иметь в своем арсенале для любого сеошника.


    Очень удивил сервис MindSerp, через сайт которого я так и не смог получить никакой обратной связи по поводу демо. Если представители этого сервиса прочитают статью, может быть я добавлю в сравнение и его)

    Теги: Добавить метки

    Это только начало работы. Без кластеризации собранные данные хоть и будут полезны, но не смогут раскрыть весь свой потенциал. Под кластеризацией семантического ядра понимают группировку поисковых запросов после анализа выдачи поисковиков. Процесс достаточно трудоемкий (если делать вручную, подробнее я расскажу ниже), но совершенно необходимый для большинства ресурсов.

    Для многих сайтов важно отделить информационные запросы от коммерческих. Например, запросы вида «название товара» и «купить название товара» всегда будут иметь разную поисковую выдачу, так как первый - информационный, а второй - коммерческий. С практической точки зрения это означает то, что продвинуть их на одной странице будет крайне сложной задачей, поэтому их и группируют, после чего делают несколько страниц под каждый кластер.

    Выше я указал довольно простой пример, любой человек без особых знаний сможет отделить запросы со словом «купить» от всех остальных, не заглядывая в поисковую выдачу, но на практике часто попадаются более сложные варианты, где необходима полноценная кластеризация с анализом поисковой выдачи.

    Если говорить по пунктам, то кластеризация семантического ядра нужна для:

    • эффективного продвижения всех поисковых запросов;
    • составления правильных ТЗ для копирайтеров (об этом я еще расскажу ниже);
    • экономии средств. При хорошей кластеризации и качественном контенте большинство запросов займут топ без дополнительных движений со стороны оптимизатора (покупка ссылок и т.д.).

    Отмечу, что есть разные типы семантических ядер, кластеризация необходима только для контентного плана, а вот для снятия позиций или для контекстной рекламы это не требуется.

    Ручная кластеризация семантического ядра

    Здесь вам поможет обыкновенный Excel, в котором вам необходимо группировать ключевые фразы . В некоторых случаях от вас даже не потребуется изучать поисковую выдачу, все запросы можно распределить по кластерам без каких-либо затруднений. Стоит упомянуть и онлайн-сервисы, которые облегчают подобную работу.

    Пример группировки ключевых слов, здесь:

    • В первом столбце - порядковый номер группы;
    • Во втором - ключевое слово;
    • В третье - частотность;
    • В четвертом - суммарная частотность группы (важно для расстановки приоритетов)
    • В пятом - количество слов в группе.

    Kg.ppc-panel.ru

    Я не стал рассказывать о других сервисах, их на самом деле много. Подобные инструменты сегодня внедряют многие, ну а какой выбрать - личное дело каждого. Я предпочитаю пользоваться узкоспециализированными продуктами, поэтому мне удобнее работать с KeyAssort. Но кому-то больше подойдет сервис, который еще и проверит позиции, соберет ключи и т.д.

    Если у вас большой проект, в котором очень много ключевых фраз, то делать его без кластеризации семантического ядра будет очень большой ошибкой. Просто потому, что ваши конкуренты обязательно сделают это. Кроме того, если у вас уже есть работающий сайт, для него все равно можно сделать кластеризацию. Это поможет выявить ключевые слова, которые вы пропустили, и пересмотреть качество контента. Иногда достаточно просто написать одну статью или создать отдельный раздел, а не покупать ссылки, пытаясь продвинуть поисковый запрос, который оказался в неудачном кластере.