Excel кластерный анализ

Excel кластерный анализ

Применение кластерного анализа в Microsoft Excel

​Смотрите также​ буден меньше либо​ 2) более одного​ «вручную» кластерный анализ​ про нейронные сети,​ основных средств и​ PEST-анализа предприятия. Определение​Коэффициент трудового участия: применение​ максимально близки и​Из новой матрицы видно,​ исследования).​ способам терапии.​

​ рынка, анализируются сельские​ сложной процедурой, но​

Использование кластерного анализа

​ есть, ищем самые​. Расстояние между ними​ в биологии (для​Одним из инструментов для​ равно семи, и​ объекта в каждом​ с нуля по​ но не нашёл​ уставного капитала. Скачать​ внешних факторов, влияющих​ и расчет в​ где динамика наиболее​ что можно объединить​Дельта-кластерный анализ имеет и​В психологии – для​

​ хозяйства для сравнения​ на самом деле​ меньшие значения. Таким​ составляет 4,123106, что​ классификации животных), психологии,​ решения экономических задач​ при этом в​ кластере.​ 10 параметрам фактически​ достойной реализации. Есть​ трансформационную таблицу МСФО.​ на продажи и​ Excel.​

Пример использования

​ схожа. Для исследования,​ в один кластер​ свои недостатки:​​ определения типов поведения​​ производительности, например, прогнозируется​​ разобраться в нюансах​​ образом мы видим,​

    ​ меньше, чем между​ медицине и во​ является кластерный анализ.​ каждом кластере будет​

​ невозможно. Используйте статпакеты.​ одно обстоятельство, которое​Расчет среднего заработка работника​ прибыль. Пример применения​Коэффициент трудового участия​

​ к примеру, товарной​ объекты [4, 5]​состав и количество кластеров​ личности в определенных​​ конъюнктура рынка отдельных​​ данного метода не​​ что нашу совокупность​​ любыми другими элементами​ многих других сферах​ С его помощью​ более одного объекта.​Изначально количество кластеров​

​ Если такой возможности​ сильно усложняет процесс​ в Excel при​ маркетингового инструмента в​​ чаще всего применяется​​ и общехозяйственной конъюнктуры​ и 6 (как​ зависит от заданного​ ситуациях.​ продуктов и т.д.​ так уж тяжело.​ данных можно разбить​ данной совокупности.​ деятельности человека. Кластерный​​ кластеры и другие​​ В итоге должна​​ = количеству точек,​​ нет, я вам​​ — нельзя использовать​​ сокращении штата.​​ Excel (исследование магазина)​​ при начислении зарплаты​

  • ​ этот метод отлично​ наиболее близкие друг​ критерия разбиения;​В экономическом анализе –​По сути, кластерный анализ​ Главное понять основную​ на два кластера.​Объединяем эти данные в​ анализ можно применять,​ объекты массива данных​ получиться точечная диаграмма​ то есть каждая​ сочувствую.​ никакие надстройки и​Как рассчитать средний​Матрица БКГ: построение и​​ работникам-сдельщикам. Как рассчитать​​ подходит.​​ к другу по​​при преобразовании исходного набора​​ при изучении и​​ – это совокупность​​ закономерность объединения в​​ В первом кластере​ группу и формируем​ используя для этих​ классифицируются по группам.​​ на которой точки​​ точка в своем​Как это все​ расширения, используется стандартный​ заработок при сокращении​ анализ в Excel​
  • ​ КТУ: формула, таблица​Выполнения анализа данных​ значениям). Оставляем наименьшее​

    ​ данных в компактные​ прогнозировании экономической депрессии,​ инструментов для классификации​ группы.​ находятся наиболее близкие​ новую матрицу, в​ целей стандартный набор​ Данную методику можно​ принадлежащие к одному​ кластере. Находим «центры​ выполнять можно поискать​

    Как сделать кластерный анализ в Excel: сфера применения и инструкция

    ​ работника в связи​ на примере предприятия.​ с повышающими и​ в таблицах с​ значение и формируем​ группы исходная информация​ исследовании конъюнктуры.​ многомерных объектов. Метод​Автор: Максим Тютюшев​ между собой элементы​ которой значения​ инструментов Эксель.​

    ​ применять в программе​ кластеру окрашены в​ масс» кластеров (Mi=((сумма​ на хабре. Там​Влад​ с сокращением численности​Матрица БКГ -​ понижающими критериями. ​ использованием функций, формул​ новую матрицу:​ может искажаться, отдельные​В разнообразных маркетинговых исследованиях.​ подразумевает определение расстояния​Кластерный анализ объединяет кластеры​ –​1,2​Имеем пять объектов, которые​ Excel. Посмотрим, как​

    Многомерный кластерный анализ

    ​ какой-нибудь свой цвет.​ Хi )/Nx; (сумма​ есть отличные статьи​: Что это за​ или штата для​ великолепный инструмент портфельного​Расчет коэффициента финансовой активности​ и встроенных стандартных​

    ​Объекты 1 и 2​ объекты могут терять​Когда нужно преобразовать «горы»​ между переменными (дельты)​ и переменные (объекты),​1​выступают отдельным элементом.​ характеризуются по двум​ это делается на​

    ​ В добавок ко​ Уi)/Ny) на данном​ по алгоритмам.​ группировка в Вашем​ начисления выходного пособия​

    ​ анализа. Рассмотрим на​

    1. ​ в Excel: формула​ инструментов, а также​ можно объединить в​
    2. ​ свою индивидуальность;​ информации в пригодные​ и последующее выделение​ похожие друг на​
    3. ​,​ При составлении матрицы​ изучаемым параметрам –​ практике.​
    4. ​ всему, весь процесс​ этапе это -​stylecolor​ понимании? Если это​
    5. ​ за первый и​

    ​ примере в Excel​ по балансу.​ практическое применение расширяемых​ один кластер (как​часто игнорируется отсутствие в​

    ​ для дальнейшего изучения​

    • ​ групп наблюдений (кластеров).​ друга. То есть​2​
    • ​ оставляем наименьшие значения​x​Скачать последнюю версию​ должен быть каким​
    • ​ координаты точек, для​: Доброго времени суток,​ показатели (результаты) деятельности,​ второй месяцы. 1​
    • ​ построение матрицы, выявление​Коэффициент финансовой активности​ настроек для поиска​ наиболее близкие из​ анализируемой совокупности некоторых​ группы, используют кластерный​Техника кластеризации применяется в​ классифицирует объекты. Часто​

    ​,​ из предыдущей таблицы​

    • ​и​ Excel​ то образом заметен,​
    • ​ каждого кластера. Теперь​ умным людям!​ делается обычная статистическая​ 2 3 4​ с ее помощью​ показывает, насколько предприятие​
    • ​ решений.​ имеющихся). Выбираем наименьшее​ значений кластеров.​

    ​ анализ.​

    Как сделать кластерный анализ в Excel

    ​ самых разнообразных областях.​ при решении экономических​4​ для объединенного элемента.​

    ​y​С помощью кластерного анализа​ но это пока​

    ​ нужно найти расстояния​Дано:​

    ​ группировка, для которой​ 5 6 7​ перспективных и бесперспективных​ зависит от заемных​Коэффициент оборачиваемости дебиторской задолженности​ значение и формируем​​Преимущества метода:​ Главное задача –​

    ​ задач, имеющих достаточно​,​ Опять смотрим, между​.​ можно проводить выборку​ не так важно.​ между всеми центрами​А(нижний предел) =​ Вы должны иметь​MaxGol​

    ​ товаров.​ средств. Характеризует финансовую​ в Excel.​ новую матрицу расстояний.​Для примера возьмем шесть​позволяет разбивать многомерный ряд​ разбить многомерный ряд​ большое число данных,​5​

    ​ какими элементами расстояние​Применяем к данным значениям​ по признаку, который​

    ​ Мне б для​ масс, то есть​ 0; В(верхний предел)​ или определить критерии.​: Необходимо разделить имеющиеся​SWOT анализ слабые и​

    ​ устойчивость и прибыльность.​Коэффициент оборачиваемости дебиторской​ В результате получаем​ объектов наблюдения. Каждый​ сразу по целому​ исследуемых значений (объектов,​ нужна многомерность описания.​. Во втором кластере​ минимально. На этот​ формулу эвклидового расстояния,​ исследуется. Его основная​ начала с самой​ от каждой точки​

    Анализ данных в Excel с помощью функций и вычислительных инструментов

    Анализ данных и поиск решений

    Кластерный анализ

    ​ анализа, – как​​ которых необходимо много​ других объектов. Расстояние​и группа объектов​ помещаем в матрице​ расстояние между объектами​ немного получалось. Языки,​ для каждого кластера,​ 100. Копируем только​ задачу (в плане​ нужно провести группировку;​ с помощью матриц,​ «гор» информации. Позволяет​ Excel.​
    ​ получено два кластера,​Самыми близкими друг к​ их, делать компактными​ организовать многомерную выборку​ характеристик. Он позволяет​ между кластерами составляет​1,2​ расстояний.​ по заданному параметру.​ как я поняла,​ опять найти все​ значения, получаем набор​ техники расчетов), то​

    ​ 3) несколько периодов​​ составление проблемного поля.​ объединить данные в​Что показывает коэффициент​ расстояние между которыми​ другу объектами являются​ и наглядными;​ в наглядные структуры.​ разбить выборку на​

    ​ 9,84.​​. Дистанция составляет 6,708204.​Смотрим, между какими значениями​ Наиболее близкие друг​ родные. Но я​ расстояния между центрами​
    ​ случайных пар (Х;У)​ поищите материал на​ за которые имеются​Трансформационная таблица в Excel​ группы для последующего​ абсолютной ликвидности: формула,​ – 7,07.​ объекты 4 и​

    ​может применяться циклически (проводится​​Примеры использования кластерного анализа:​ несколько групп по​На этом завершается процедура​Добавляем указанные элементы в​ дистанция меньше всего.​ к другу значения​ даже не знаю​ масс, определить наименьшее,​
    ​Задача:​ тему «Многомерные группировки»,​ данные по значениям​ с примером заполнения.​ исследования. Пример применения​

    Кластерный анализ. VBA Excel

    ​ пример расчета? Нормативное​​Огромное значение имеет кластерный​ 5. Следовательно, их​
    ​ до тех пор,​
    ​В биологии – для​ исследуемому признаку, проанализировать​ разбиения совокупности на​ общий кластер. Формируем​ В нашем примере​ группируются вместе.​ с чего начать.​ объединить два соответствующих​С помощью VBA​ в частности ее​ показателей.​Как составить трансформационную​
    ​ кластерного анализа.​
    ​ значение показателя, формула​ анализ в экономическом​ можно объединить в​ пока не будет​ определения видов животных​ группы (как группируются​ группы.​ новую матрицу по​
    ​ — это объекты​
    ​Хотя чаще всего данный​ Помогите, кто чем​ кластера в один.​ произвести кластеризацию объектов(точек​ вариант на основе​Я понятия не​ таблицу МСФО: обновление​Анализ макросреды PEST-анализом в​ по балансу, пример​ анализе. Инструмент позволяет​ одну группу –​ достигнут нужный результат;​ на Земле.​ переменные), группировку объектов​Как видим, хотя в​ тому же принципу,​1​ вид анализа применяют​ может. Важен любой​ И так до​ с координатами(Х;У)). Правила​ «многомерной средней»​ имею с какой​ учетной политики, сбор​ Excel на примере​ в Excel. Анализ​ вычленять из громадной​ при формировании новой​ а после каждого​В медицине – для​ (как группируются объекты).​ целом кластерный анализ​ что и в​и​ в экономике, его​ совет.​ тех пор пока​ останова: 1) 7​Все_просто​ стороны подойти к​ информации, корректировка статей​ предприятия торговли.​ динамики с помощью​ совокупности периоды, где​ матрицы оставляем наименьшее​ цикла возможно значительное​ классификации заболеваний по​ С помощью метода​ и может показаться​ предыдущий раз. То​2​ также можно использовать​Кластеризация.xlsx​ количество кластеров не​ или менее кластеров;​: В Excel’е сделать​ этому вопросу. Читал​ баланса. Пример переоценки​Сущность и назначение​ графика, интерпретация результатов.​ значения соответствующих параметров​ значение.​ изменение направленности дальнейшего​
    ​ группам симптомов и​

    Источник:
    http://my-excel.ru/vba/excel-klasternyj-analiz.html

    Применение кластерного анализа в Microsoft Excel

    Одним из инструментов для решения экономических задач является кластерный анализ. С его помощью кластеры и другие объекты массива данных классифицируются по группам. Данную методику можно применять в программе Excel. Посмотрим, как это делается на практике.

    Использование кластерного анализа

    С помощью кластерного анализа можно проводить выборку по признаку, который исследуется. Его основная задача – разбиение многомерного массива на однородные группы. В качестве критерия группировки применяется парный коэффициент корреляции или эвклидово расстояние между объектами по заданному параметру. Наиболее близкие друг к другу значения группируются вместе.

    Хотя чаще всего данный вид анализа применяют в экономике, его также можно использовать в биологии (для классификации животных), психологии, медицине и во многих других сферах деятельности человека. Кластерный анализ можно применять, используя для этих целей стандартный набор инструментов Эксель.

    Пример использования

    Имеем пять объектов, которые характеризуются по двум изучаемым параметрам – x и y.

      Применяем к данным значениям формулу эвклидового расстояния, которое вычисляется по шаблону:

    Данное значение вычисляем между каждым из пяти объектов. Результаты расчета помещаем в матрице расстояний.

    Объединяем эти данные в группу и формируем новую матрицу, в которой значения 1,2 выступают отдельным элементом. При составлении матрицы оставляем наименьшие значения из предыдущей таблицы для объединенного элемента. Опять смотрим, между какими элементами расстояние минимально. На этот раз – это 4 и 5, а также объект 5 и группа объектов 1,2. Дистанция составляет 6,708204.

  • Добавляем указанные элементы в общий кластер. Формируем новую матрицу по тому же принципу, что и в предыдущий раз. То есть, ищем самые меньшие значения. Таким образом мы видим, что нашу совокупность данных можно разбить на два кластера. В первом кластере находятся наиболее близкие между собой элементы – 1,2,4,5. Во втором кластере в нашем случае представлен только один элемент — 3. Он находится сравнительно в отдалении от других объектов. Расстояние между кластерами составляет 9,84.
  • На этом завершается процедура разбиения совокупности на группы.

    Как видим, хотя в целом кластерный анализ и может показаться сложной процедурой, но на самом деле разобраться в нюансах данного метода не так уж тяжело. Главное понять основную закономерность объединения в группы.

    Источник:
    http://lumpics.ru/cluster-analysis-in-excel/

    Кластеризация семантического ядра + excel + автоматизация

    Здравствуйте, уважаемые читатели сайта Uspei.com. В этом уроке мы рассмотрим такие вещи как группировка запросов в рамках семантического ядра или кластеризация. Начнем мы с группировки поисковых запросов и чистки ядра. В прошлой статье мы посмотрели, как собирать статистику, какие инструменты для этого можно использовать, и все это почистили, удалив дубликаты. А также мы рассмотрели виды запросов.

    У нас есть большой список запросов, из которого мы должны удалить оставшийся мусор и провести группировку. То есть у нас есть здоровенный список запросов. В некоторых тематиках он может доходить до 10 000. Наша задача сейчас разбить его на группы, каждая из которых будет содержать в себе только синонимы. То есть в рамках каждой группы должны быть только синонимы, так как каждая выделенная группа, это будущая отдельная страница и эти запросы в группе мы будем на ней продвигать.

    К примеру, если у нас есть запрос «купить ноутбук», то мы должны сделать группу, в которой будут только синонимы к запросу «купить ноутбук».

    Под синонимом в SEO имеется в виду то, что в запросы, по которым люди ищут, вкладывается один и тот же смысл. К примеру, запросы «купить ноутбук» и «купить ноутбук apple» это НЕ синонимы и они будут входить в разные группы, потому что у них разное понятие. В первом случае человек ищет просто ноутбук и это может быть даже samsung, а совсем не apple. Во втором же случае человек ищет конкретно apple. Ну, еще один пример. Человек ищет «такси» и «междугороднее такси» — тут думаю тоже очевидно и понятно.

    Читайте также  Преобразование формул в значения

    Таких групп в рамках большого семантического ядра может быть огромное количество, их может быть более нескольких сотен в редких случаях более тысячи. Вот этот процесс еще называют кластеризацией. Мы рассмотрим, как его сделать вручную, я покажу основы и попытаюсь вывести хотя бы один законченный кластер, потому что в рамках одной статьи мы не сможем классифицировать ядро, но хотя бы вывести какой-то базовый кластер.

    И потом я вам дам ссылки на набор инструментов, который может существенно автоматизировать или ускорить эту группировку или кластеризацию, как это сейчас модно называть.

    Кластеризация и чистка семантического ядра в Excel

    Возвращаемся к нашему списку запросов и у нас достаточно простой алгоритм. У нас уже отсортированы все запросы по убыванию частотности, то есть от самых популярных до наименее популярных. Дубликаты мы удалили.

    Мы берем каждый запрос и смотрим подходит он нам или нет. Например, у нас есть запрос «интернет-магазин», но если мы занимаемся только ноутбуками, то этот запрос без слова ноутбук нам не подходит. Значит запрос «интернет-магазин» мы удаляем — это не тематический запрос.

    Дальше запрос «ноутбук». Да, в принципе это информационный запрос, но не совсем понятно, что человек вкладывает в этот запрос, когда вбивает его в поисковую строку. Ищет ли он информацию, картинку или он ищет товары или возможно что-то еще.

    Если мы сомневаемся в смысле поискового запроса, логично его проверить. Как это делается? Мы копируем запрос и вбиваем его в новой вкладке в ту поисковую систему, с которой мы работаем. Например, Google.

    Мы видим, что Google показывает нам набор интернет-магазинов. Мы видим точно, что это запрос коммерческий и если у нас интернет-магазин, мы его оставляем.

    И мы добрались до первого подходящего нам запроса. Давайте выделим нашу первую группу запросов, в которую будут входить все слова с упоминанием слова «ноутбук». Для этого нужно включить фильтр и отфильтровать по текстовому условию «содержит». Но там могут быть словоформы запроса «ноутбук» поэтому мы просто напишем «ноут» и получаем список строк только с поисковыми запросами, в которых упоминается «ноут». Я предлагаю вам скопировать и перенести их в новую вкладку.

    Каждую вкладку мы будем называть соответственно по тому слову, по которому мы произвели фильтрацию. В первой же вкладке мы вручную (!) выделяем все отфильтрованные ключи и удаляем. После чего очищаем фильтр.

    Итак, в первой вкладке у нас остались все ключи, которые НЕ содержат «ноутбук», а мы переходим во вторую («ноутбук») и продолжаем работать теперь уже там.

    Итак, следующее слово «ноутбук». Мы уже разобрались, что это коммерческий запрос и по нему также как и по запросу «купить ноутбук» показываются интернет-магазины, то есть это синонимы и мы оставляем их в одной группе.

    «DNS ноутбуки» — как раз это тот самый навигационный запрос и можно предположить, что приставка «DNS» как популярный интернет-магазин будет часто встречаться в списке запросов про ноутбуки. Поэтому давайте сразу удалим все чужие навигационные запросы «DNS». Фильтр — выделяем вручную и удалить.

    «Ноутбуки бу» — аналогично как с «dns» — удаляем, если только мы не продаем б/у ноубуки.

    «Купить ноутбук Москва» — тут уже добавляется регион, а мы далеко не в Москве. По сути, запрос повторяет смысловую нагрузку запроса «купить ноутбук» или просто «ноутбук». Но поскольку добавляется регион, стоит проверить считает ли google эти поисковые запросы синонимами.

    Мы берем запрос «купить ноутбук» вбиваем его в google и в другой вкладке вбиваем запрос «купить ноутбук Москва». И сравниваем результаты поиска на предмет повторения результатов, то есть именно конкретных страничек. Если хотя бы 4-5 страничек одинаковых, то мы можем считать, что это запросы синонимы и Google показывает по ним одинаковый смысл. Если же по этим запросам выдача разная, то «купить ноутбук Москва» навигационный запрос и он нам не нужен.

    Идем дальше и таким образом проделываем ту же процедуру — удаляем мусор и создаем новые группы отличные по смыслу.

    Очень рекомендую чистить семантику, используя фильтры, если чистить ручками, то есть большой шанс что-то пропустить.

    Но когда мы фильтруем, надо быть аккуратным, чтобы не удалить какие-то важные слова случайно отфильтровав их. Например, если в фильтр вбить просто «бу» то он отфильтрует ВООБЩЕ ВСЕ слова, содержащие «бу» — например, сам запрос «ноутБУк» — а это уже крах))). Поэтому лучше вбить по очереди два варианта с пробелом вначале и вконце » бу» и «бу «, а также через слэш «б/у». Помните это и будьте внимательны))))).

    И вот у нас запрос «ноутбук hp». Это уже не просто «ноутбук» — это уже более узкая тема, значит мы должны выделить ноутбуки hp в отдельную группу.

    Производим фильтрацию «текст содержит» получаем набор запросов и переносим их в новую вкладку «ноутбуки hp». Из второй вкладки «ноутбук» перенесенные в 3 вкладку результаты удаляем.

    Так мы будем повторять эту процедуру, пока в каждой вкладке не останутся только синонимы. То есть дальше мы должны перейти в 3 вкладку «ноутбуки hp» и здесь их разделить еще на более подробные группы. Мы видим, что здесь есть «ноутбук hp pavilion», » ноутбук hp compaq» и «ноутбук hp игровой». Таким образом, эта группа будет разбита еще на 3 группы.

    Во вторую вкладку мы вернёмся, когда во всех следующих группах все слова будут синонимами и продолжим этот разбор. Продолжим до тех моментов, пока самая первая наша вкладка не будет разложена на группы, а в ней самой не останутся только нецелевые запросы или запросы, которые тоже будут синонимами.

    В итоге наша задача создать файл, в котором у нас будет огромное количество вкладок. В разных темах по-разному — возможно в некоторых темах будет всего 5-6 вкладок, если тема очень маленькая, но основная задача, чтобы в рамках одной вкладки были только запросы синонимы.

    Причем не просто слова синонимы в классическом понимании, а синонимы с точки зрения поисковой системы. Вот как из примера «купить ноутбук» и «ноутбук» это синонимы с точки зрения поисковой системы, поэтому они у нас остались в одной группе.

    Если во вкладке 20 синонимов и один НЕ СИНОНИМ — выносим его одного в отельную вкладку. Это очень важный момент, так как каждая группа это отдельная страница, на которой эти запросы будут продвигаться, и чем больше будет ошибок и недоработок, тем менее чистой по смыслу станет страница, что скажется результатах поиска. О других ошибках, допускаемых при сборе и группировке семантики ознакомьтесь в этой статье.

    Повторю еще раз основную мысль — в каждой вкладке должны быть запросы подходящие по смыслу. Пример, если в текущей вкладке 5 запросов:

    • «заработать в интернете»
    • «как можно заработать в интернете»
    • «где заработать через интернет»
    • «как заработать деньги в интернете»
    • «как заработать в интернете без обмана»

    Первые три запроса останутся в текущей вкладке, так смысл у них один, а последние два уйдут каждый в свою группу-вкладку, так как они не совпадают по смыслу ни с первыми тремя, ни между собой — они более детализированы. В одном случае речь идет о деньгах ( а заработать в наши дни можно все что угодно — биткоины, баллы в играх и т.д.), а во-втором, речь идет о заработке без обмана.

    Для понимания я в течение часа сварганил (правда не до конца) семантику по запросам, «заработок в интернете» «заработок в сети» «заработок онлайн». Первая вкладка — вся семантика, а далее по группам. Красные вкладки это основные, из которых идет разбор. Повторюсь, это полусырая заготовка, которую еще нужно дорабатывать.

    Зачем все это нужно и почему все так сложно?

    Вы уже, наверное, поняли, как много времени вам придется уделить на сбор и кластеризацию семантического ядра, и часто люди спрашивают — зачем это все нужно? Какую практическую пользу это несет?

    На самом деле, сейчас это не очевидно, но буквально через два-три этапа вы увидите, что вся поисковая оптимизация, абсолютно все seo, построено на основе правильно собранного семантического ядра. SEO — это не просто любительский способ сделать свой сайт лучше. Это, можно сказать наука, в которой все начинается с «атомов» и именно это приводит к результату.

    SEO можно сравнить с большим спортом — боксом или сноубордом или любым другим. Если вы не освоите технику ПРОФЕССИОНАЛЬНЫХ ударов или элементов езды, то это скажется на скорости и выносливости и вы проиграете сопернику, кто этим не пренебрег. Если вы не хотите делать этого, тогда это уже не SEO, а что-то другое — не такое эффективное. И в SEO, как и в спорте, нет 15 или 20 места — есть только первая страница и все.

    Мы не можем начинать оптимизацию сайта, если мы не сделали семантику, не разбили ее на группы, не обработали и не почистили. И все что мы будем делать дальше, будет основано на семантике.

    Приведу конкретный пример. Мы же понимаем, что по каждому запросу поисковик дает свой результат выдачи. Возьмем какую-то небольшую тематику по которой в семантике всего 100 запросов. И вот у одного владельца 100 страниц на сайте, в которых содержимое часто пересекается, структура сайта от этого расплывчатая, поисковик не понимает до конца, какие страницы релевантны запросу больше, а какие меньше. В итоге, кроме путаницы, эти 100 страниц содержат в своем «винегрете» ответы только на 30-40 запросов.

    А у второго владельца сайта, благодаря полному собранному кластеризованному семантическому ядру, на каждый запрос есть соответствующая страница, строго релевантная только этому запросу. Поисковик и пользователи четко понимают структуру сайта, а также не страдают «дежавю», что уже где-то несколько раз читали об этом на сайте. Внутренняя перелинковка четко структурирована, так как у владельца сайта не возникает вопросов на какую из 10 страниц поставить внутреннюю ссылку. Этот сайт поисковик покажет по ВСЕМ 100 запросам и соберет весь трафик.

    Автоматизация кластеризации семантического ядра

    Такая работа по группировке запросов по обработке всей этой статистики вручную занимает достаточно много времени. Особенно если человек делает это первый раз. Но я вам рекомендую, если вы хотите научиться работать запросами, работать с семантикой, хотя бы один раз проведите все это вручную в электронных таблицах. Тогда вы сможете прочувствовать и понять, как это работает.

    Если же вы работаете в очень больших объемах, крайне рекомендую использовать профессиональные инструменты. Чаще всего они платные.

    Один из самых популярных инструментов по работе с семантикой это инструмент «Key Collector», которая позволяет автоматизировать большинство процессов по сбору и обработке семантики. Как минимум, она умеет автоматически собирать ключевые слова из yandex wordstat, а также данные о частотности по запросам и другие рекомендации.

    Если же у вас есть уже готовое отфильтрованное от мусора семантическое ядро, то вы можете прибегнуть к помощи дополнительных сервисов, которые производят автоматическую кластеризацию. Лидером сейчас на рынке является онлайн-сервис, который называется Rush analytics.

    Расценки не очень высокие и в принципе, если у вас один сайт, вы владелец или вебмастер, то вы можете собрать семантику, почистить ее, после чего просто отдать на кластеризацию такому сервису.

    Также мне очень понравился бесплатный сервис simple-seo-tools.com, который на мой взгляд показал отличный результат при кластеризации онлайн. Там все просто и легко. Настрйки можно использовать по умолчанию и никаких данных не вводить — сервис все сделает сам.

    До встречи! Успевайте всё и всегда на страницах блога Uspei.com

    Помоги проекту — подпишись на наш Яндекс.Дзен канал!

    Источник:
    http://uspei.com/seo-prodvizhenie-sajta/klasterizatsiya-semanticheskogo-yadra-excel-avtomatizatsiya/

    Excel-кластеризатор ключевых слов по весу

    Рассказывает
    Роман Игошин ,
    Руководитель направления джедаев

    Эта статья о том, как распределить по группам 20–30 тысяч ключевых слов. Поможет сэкономить время маркетологам, которые регулярно создают рекламные кампании.

    Вручную группировать запросы не всегда эффективно: перебрать 200–300 запросов можно за час, на 20–30 тысяч уйдет неделя. Автоматическим сервисам группировку я не доверю, так как она определяет структуру и управляемость кампании.

    Читайте также  Как сделать десятичные числа в excel?

    Поэтому придумал свой метод, который ускоряет кластеризацию и даёт осознанный результат. Облегчает жизнь при работе с СЯ от 2–3 тысяч ключевых слов. Пробовал работать с 45 000 — Excel начинал умирать. Список из 200–300 запросов быстрее перебрать руками.

    Далее расскажу про свой метод кластеризации в теории, а затем — как реализую его в Excel. Дам ссылку на готовый Excel-кластеризатор . Но чтобы им пользоваться, нужно хорошо понимать метод.

    Кластеризация — распределение запросов по кластерам. Кластер — это группа запросов, схожих по смыслу и набору слов. Чтобы выделить такие запросы и объединить их в кластер, нужен признак.

    Используем для этого нормализованную форму запроса — уберём окончания и выстроим слова в порядке важности:

    Удаление окончаний позволит охватить все возможные словоформы для конкретного слова, а сортировка «по важности» — игнорировать порядок слов.

    Убираем окончания

    Слово без окончания — это признак, который объединяет разные словоформы:

    Чтобы убирать окончания я использую mystem. Это лемматизатор от Яндекса. Он обрабатывает список слов и возвращает нормализованные значения — леммы.

    Если система не уверена, какая лемма правильная, то покажет 2–3 варианта . Например, для слова «банку» mystem вернёт две леммы: «банк» и «банка». При проверке результатов мы выберем нужную.

    Определяем важность

    Сортировка «по важности» позволит игнорировать порядок слов. При сортировке нормализованных значений фраз по алфавиту мы получим готовые кластеры — группы запросов, схожих по смыслу и набору слов.

    Важность слова — вычисляемый параметр для конкретного списка ключевых слов. Он не определяет важность слова в общей картине мира.

    Важность слова рассчитывается из частотности и количества упоминаний слов в списке. Рассмотрим на примере.

    Берём список запросов с частотностью

    1. Купить бумеранг — 1000
    2. Бумеранги цена — 700
    3. Бумеранги в москве — 750
    4. Купить классический бумеранг — 450
    5. Цены на бумеранги в москве — 350
    6. Купить классический бумеранг в москве — 100

    В списке запросов встречаются слова: купить, бумеранг, классический, москва, цена, в, на. Вес слова равен сумме долей частотностей помноженных на количество упоминаний слова.

    Считаем доли частотностей

    1. Купить бумеранг — 1000 = 1000/2 = 500
    2. Бумеранги цена — 700 = 700/2 = 350
    3. Бумеранги в москве — 750 = 750/3 = 250
    4. Купить классический бумеранг — 450 = 450/3 = 150
    5. Цены на бумеранги в москве — 350 = 350/5 = 70
    6. Купить классический бумеранг в москве — 100 = 100/5 = 20

    Считаем вес слов

    1. Купить — (500+150+20)*3 = 2010
    2. Бумеранг — (500+350+250+150+70+20)*6 = 8040
    3. Классический — (150+20)*2 = 340
    4. Москва — (250+70)*2 = 640
    5. Цена — (350+70)*2 = 840
    6. В — 20
    7. На — 70

    Сортируем по важности

    1. 8040 — бумеранг
    2. 2010 — купить
    3. 840 — цена
    4. 640 — москва
    5. 340 — классический
    6. 70 — на
    7. 20 — в

    Располагаем запросы по важности

    1. Купить бумеранг — бумеранг | купить
    2. Бумеранги цена — бумеранг | цена
    3. Бумеранги в москве — бумеранг | москва
    4. Купить классический бумеранг — бумеранг | купить | классический
    5. Цены на бумеранги в москве — бумеранг | цена | москва | на | в
    6. Купить классический бумеранг в москве — бумеранг | купить | москва | классический | в

    Упорядочиваем и чистим

    1. Бумеранг | купить: купить бумеранг — 1000
    2. Бумеранг | купить | классический: купить классический бумеранг — 450
    3. Бумеранг | купить | москва | классический: купить классический бумеранг в москве — 100
    4. Бумеранг | москва: бумеранги в москве — 750
    5. Бумеранг | цена: бумеранги цена — 700
    6. Бумеранг | цена | москва: цены на бумеранги в москве — 350

    В итоге получили первые группы объявлений, с которыми можно работать дальше: укрупнять, объединять, кросс-минусовать . Для этого используем Excel.

    Реализация в Excel

    Выполняем последовательность действий в таблице (XLS, 537 КБ) с формулами. Кластеризация 1000 запросов займет 30 минут.

    Алгоритм одной строкой

    Собираем СЯ → собираем частотность → разбиваем запросы по словам и вычисляем доли весов → формируем таблицу-справочник с весами слов → выделяем леммы для слов → вычисляем «вес» леммы → формируем таблицу-справочник с леммами → делаем первичную кластеризацию → укрупняем полученные группы.

    Шаг 1. Вычисляем доли весов и разбиваем запросы по словам

    Лист «Кластеризация», таблица «Main»

    Чтобы избежать правки формул называйте все листы и таблицы аналогично таблице-примеру

    1. Вычисляем доли весов:
      1. Доли весов = Частотность / Кол-во слов .
      2. Кол-во слов =LEN ([@Ключ])-LEN (SUBSTITUTE ([@Ключ],» «,»»))+1.

      Шаг 2. Формируем таблицу-справочник с весами слов

      Лист «Слова — Леммы», таблица «Word»

      1. Копируем столбцы W1—W7 на новый лист.
      2. Преобразуем таблицу из формата
        [W1] [W2] [W3] [W4] [W5] [W6] [W7] [Доли весов] в формат:
        [W1] → [Доли весов]
        [W2] → [Доли весов]
        [W3] → [Доли весов]
        [W4] → [Доли весов]
        [W5] → [Доли весов]
        [W6] → [Доли весов]
        [W7] → [Доли весов]:

      Шаг 3. Выделяем леммы и дорабатываем справочник со словами

      Лист «Слова — Леммы», таблица «Word»

      1. Копируем полученный на прошлом шаге список слов «как есть».
      2. Обрабатываем через mystem → получаем леммы для каждого слова.
      3. Считаем кол-во упоминаний каждой леммы.

      Шаг 4. Формируем таблицу-справочник с леммами

      Лист «Леммы», таблица «Lemmas»

      1. Копируем полученный список лемм на новый лист и удаляем дубли.
      2. Из справочника со словами подтягиваем VLOOKUP-ом кол -во упоминаний каждой леммы.
      3. Считаем кол-во символов в лемме.
      4. Вычисляем «вес» леммы:
        Вес Леммы= [Сумма долей весов слов, входящих в Лемму] * [ Кол-во упоминаний Леммы].
        Формула:
        =(SUMIF (Words[Lemma],[@Лемма], Words[Доли весов]))*[@[ Кол-во упоминаний ]].
      5. Сортируем леммы по столбцу «вес» — от большего к меньшему.
      6. Проставляем «Статус» для лемм — минимальный для старшей леммы (лучше начать с 1 000), дальше +1 к следующему статусу:

      Шаг 5. Делаем первичную кластеризацию

      Лист «Кластеризация», таблица «Main»

      Для каждого слова в столбцах W1—W7 подтягиваем VLOOKP-ом значения «Статус» → записываем их столбцы L1 – L7 :

      Итак, что мы сделали. Разбили запросы по словам. Для каждого слова выделили лемму — можем объединить запросы по общим словам. Для каждой леммы посчитали вес. Остаётся выстроить слова в запросе в порядке важности. Тогда при сортировке по алфавиту запросы сами объединятся в группы объявлений.

      Выстраиваем слова в порядке важности функцией SMALL. В диапазоне статусов L1 – L7 ищем самый маленький статус — это самое важное слово во фразе. Затем, ищем второй самый маленький статус — это второе по важности слово во фразе. И так еще пять раз — проверяем оставшиеся столбцы L3 – L7.

      Получаем последовательность статусов. Например, 37 → 100 → 200 → 700. Для каждого статуса подтягиваем VLOOKP-ом соответствующую Лемму из справочника Лемм. Соединяем Леммы CONCATENATE-ом и получаем нормализованное значение фразы. Я использую его как название группы объявлений.

      Сортируем по алфавиту:

      Полная рабочая формула в файле-примере .

      Шаг 6. Укрупняем полученные группы

      Игнорируя окончания и порядок слов, мы объединили запросы с одинаковым набором слов. Количество групп стремится к количеству слов — это 100 % точность инструмента. Можно использовать, если вы предпочитаете работать с запросами в точном соответствии.

      Чтобы укрупнить группы, нужно уменьшить точность — снизить количество лемм, которые составляют «нормализованную форму».

      Что можно удалить:

      • одинокие буквы, цифры, предлоги, доменные зоны. Леммы длиной 1–3 символа ;
      • редкие леммы — кол-во упоминаний меньше среднего по списку;
      • леммы с малым весом — недостаточно «важные»;
      • в редких случаях — топонимы.

      Важно: лемму не удаляем, только её «Статус» — этого достаточно, чтобы лемма не попала в «нормализованную форму»:

      В основной таблице ничего править не надо — результат обновится самостоятельно.

      До какой степени укрупнять: я стремлюсь к среднему показателю 2–3 запроса в одной группе объявлений и слежу за максимальным количеством фраз (помним про ограничения систем контекстной рекламы).

      Полученный список групп удобно кросс-минусовать и двигать между кампаниями. Название группы поможет писать объявления — вы сами определяете важные слова в названии группы.

      Ещё раз алгоритм: собираем СЯ → собираем частотность → разбиваем запросы по словам и вычисляем доли весов → формируем таблицу-справочник с весами слов → выделяем леммы для слов → вычисляем «вес» леммы → формируем таблицу-справочник с леммами → делаем первичную кластеризацию → укрупняем полученные группы.

      Отзывы джедаев о кластеризаторе

      «Я помогал Роме с созданием инструмента на ранних этапах. Всем рекомендую попробовать кластеризатор для ядра от 2000 ключевых слов → сэкономит время.

      Инструмент можно улучшить и превратить в автоматический сервис. Также можно дорабатывать формулы определения веса лемм. Но и в текущем виде он поможет специалистам по контексту, которые работают с большой семантикой.»

      «С помощью кластеризатора сильно удобнее и быстрее сгруппировать фразы и потом писать объявления для них. Из недостатков — первый раз кажется, что это сложновато. Но когда попробуешь, то всё довольно понятно. Но эту штуку лучше автоматизировать.»

      «Методику пробовал, но не использую в работе, потому что нечасто собираю контекст в больших объемах.

      Хорошо подойдет для работы с большой семантикой, особенно в свете последних нововведений яндекса по низкочастотным запросам. Группировки помогут сэкономить много времени при подготовке ключевых фраз.

      Методика на первый взгляд кажется сложной и громоздкой, но если разобраться, то процесс становится понятным и удобным.»

      «Кластеризация от Ромы просто находка! Методом пользуюсь каждый раз когда работаю с семантикой — собираю или корректирую кампании.

      Больше всего мне нравятся три вещи:

      • я регулирую какие фразы попадут в группу. Если вес фразы небольшой, то объединяю с похожими. Не придерживаюсь принципа «один ключ — одна группа», иначе управлять кампанией сложно;
      • понимаю механику и вижу какие фразы должны быть в заголовке. Конечно, важно делать полное вхождение ключевого слова. Часто оно не вмещается полностью и я строю заголовок из фраз с бо́льшим весом;
      • это Excel, который всем знаком. Не нужно устанавливать дополнительные программы и платить за сервис. Если разобраться в формулах, то уже немного прокачаешься.

      Из минусов: все формулы я копирую из готового шаблона и переключаться между окнами одной программы неудобно. Я бы хотела иметь формулы под рукой, а может сделать в будущем какой-нибудь шаблон, чтобы сократить количество копирований. Ещё хотелось бы сократить время группировки, но пока не нашла способ.

      В целом, способ мне нравится тем, что механика простая и понятная, её легко внедрить и потом управлять кампаниями.»

      Что дальше

      Если у вас СЯ от 2–3 тысяч ключевых слов, используйте этот алгоритм. Прогоните алгоритм 2–3 раза , чтобы «впитать».

      Если у вас список из 200–300 запросов, переберите руками — так быстрее.

      Если хотите готовое решение — попросите программистов написать скрипт.

      Я постоянно дорабатываю кластеризатор. В следующих итерациях хочу проработать кросс-минусовку групп, добавить справочники минус-слов и максимально автоматизировать кластеризатор на Power Query. Следите за обновлениями!

      Источник:
      http://www.it-agency.ru/academy/excel-clusterer/

      SEO-Excel для кластеризации семантического ядра

      SEO-Excel — это надстройка для Microsoft Excel, которая содержит 22 бесплатных инструмента для SEO-специалиста, позволяющая автоматизировать большую часть процессов при работе с семантическим ядром. Презентовал Андрей Ставский из Rush Analytics летом 2017 года, как альтернативу буйжуйской SeoTools for Excel.
      Основные возможности:

      • Разбор и перегруппировка семантики;
      • Генережка SEO тегов и URL;
      • Работа с морфологией;
      • Парсинг Title и текстов из выдачи Яндекса;
      • Построение MindMap по URL.
      • Windows 10 / 8.1 / 8 / 7 / Vista;
      • Microsoft Excel 2007 / 2010 / 2013 / 2016 / 365.

      Рассмотрим, как SEO-Excel может в помочь в кластеризации семантического ядра на примере запросов для категории Bluetooth наушников крупного интернет магазина. Для этого я собрал запросы из Wordstat по маркерам со стоп-словами, снял частотность, очистил от неявных дублей и брендов.Получили большой список запросов, который в данном виде нам мало чем полезен. Для дальнейшего продвижения по этим запросам, их необходимо сгруппировать по какому-то признаку и закрепить за страницами на сайте. Задачу группировки (кластеризации) запросов как раз и помогает решить надстройка.

      Кластеризация по составу фразы

      Инструмент “Выжимка”, который позволяет удалять определенные слова из запросов, мы будем использовать для кластеризации семантики по составу фразы.

      Копируем запросы в соседний столбец и делаем в нем выжимку, исключая запросы, не влияющие на интент (потребность): купить, цена, интернет, магазин, заказать, стоимость, bluetooth, блютуз, беспроводные, наушник, телефон и т.д. Можно указывать в сокращенном варианте, чтобы исключить также словоформы данных слов.
      Далее сортируем столбец с выжимкой по А до Я, выделяем его и применяем инструмент “Красит” ко всем столбцам. Получаем запросы кластеризованные по составу фразы, где в столбце «Выжимка» содержится интент, т.е. запросы с уже сформированной потребностью.Кто хоть немного понимает в наушниках скажет, что капельки, вакуумные, внутриканальные и затычки — это все об одном типе наушников. С точки зрения потребности, эти запросы логично объединить в одну группу. С точки зрения хитрого сеошника, можно разбить и на разные страницы, чтобы за счет точных вхождений попробовать опередить конкурентов в ТОПе.

      В Техпорте работают последние:

      • www.techport.ru/katalog/products/hi-fi-i-audio/naushniki/tag/vnutrikanalnye
      • www.techport.ru/katalog/products/hi-fi-i-audio/naushniki/tag/vakkumnye
      • www.techport.ru/katalog/products/hi-fi-i-audio/naushniki/tag/zatychki

      Хотя наушники-капельки проигнорировали. Хитрые, но не до конца…
      В МВидео не стали заморачиваться — разместили все на одну страницу

      Оба сайта в ТОПе, вот и не понятно, а как же сгруппировать правильно запросы, чтобы и нам там быть, и трафика по-максимуму собрать.

      Кластеризировать по данному способу — это очень долго, нудно и не точно, ведь нужно пройтись по всем запросам, определить интент и перегруппировать по ТОПу.

      Недостатки кластеризации по составу фразы

      • Синонимы и переформулированные фразы попадают в разные кластера и нужно потратить уйму времени, чтобы их руками перебрать и объединить;
      • Информационные запросы часто попадают вместе с коммерческими в одну группу;
      • Даже после перебора руками, нет уверенности, что группировка правильна. Запросы, которые вы считаете, что нужно продвигать на одну страницу, на самом деле нужно продвигать на разные.
      • Для избежания ошибок приходится дополнительно анализировать ТОП выдачи по каждой группе. При больших ядрах — это задача может растянуться на многие месяцы. Ни у кого нет столько времени ждать вашу семантику.

      Поэтому группировка по составу фразы не используется в чистом виде. Тем не менее, данный метод позволяет значительно сократить время на обработку семантического ядра после сервисов автоматической кластеризации, которые работают на основании анализа ТОПа поисковой выдачи.

      Преимущества кластеризаторов по ТОПу

      • Синонимы и переформулированные фразы при «чистой» выдаче попадают в одну группу;
      • Проверяется совместимость продвижения запросов на одной странице. Несовместивые запросы разбрасываются по разным группам;
      • Существенная экономия времени, особенно на больших ядрах.

      Догруппировка кластеризированной семантики

      Сервисы автоматической кластеризации по ТОПу позволяют значительно сэкономить время и деньги, группируя запросы на основании подобия сайтов из ТОПа, но и они не лишены недостатков.

      Недостатки кластеризации по ТОПу

      • Необходимость поиска баланса между полнотой и точностью кластеризации. При высокой полноте группируется больше фраз, но страдает точность, из-за чего в группы попадает много лишнего. При высокой точности очень низкая полнота — группы маленькие и большой список несгруппированных фраз, которые нужно раскидывать самостоятельно. Оптимальная по полноте кластеризация выбирается каждый раз индивидуально;
      • Если выдача «плохая», то запросы, которые должны продвигаться на разных страницах, при кластеризации могут попасть в одну группу. Наоборот, запросы с одним интентом, попадают в разные группы.
      • Кластеризация запросов без однозначного интента, по которым в выдаче как коммерческие, так и информационные сайты, дает неудовлетворительные результаты. Например, мы бы хотели запрос продвигать например, как коммерческий, но кластеризатор положил его в группу с информационниками.

      Догруппировать имеющийся результат согласно нашим требованиям помогут инструменты «Выжимка» и «Разбор».

      Определяем состав фразы в файле кластеризации от Rush Analytics. Самыми удачными результаты кластеризации мне показались при силе связи 4.
      Запросы «спортивные наушники bluetooth» и «наушники для спорта беспроводные» объединились в одну группу. Вакуумные наушники разбросало 3 по разным кластерам, а вкладыши, мини и капельки — по 2. К тому же попался запрос и без сформированного интента — «наушники для телефона купить». Проходимся таким образом по всем кластерам. Благодаря выжимке это легко читается.

      Кластеризатор не дал нам точного ответа, поэтому здесь нужно дополнительно перебрать запросы вручную. При обнаружении ошибок кластеризации, приходится решать, оставлять ли конкретный запрос в данном кластере, переместить в другой или создать новую группу:

      Если мы решили объединить «внутриканальные» и «вакуумные» можем сразу задать одинаковые названия кластеров для этих запросов. В данном случае мы используем название «беспроводные наушники внутриканальные».

      Если же запросы разбросаны по файлу или мы не знаем, есть ли уже похожий кластер, можно скопировать ключевое слово в соответствующую ячейку «название кластера», например «блютуз наушники капельки купить».

      Нет необходимости искать по всему файлу подходящий кластер или запоминать названия уже существующих.
      Снимаем заливку и сортируем от А-Я по столбцу с названием кластера. Далее красим все столбцы с помощью инструмента “Красит”.
      Произошла группировка запросов по общему названию. В одну группу мы добавили вакуумные и внутриканальные. В тоже время мы не стали «капельки» сводить к общему названию, поэтому они находятся в разных кластерах. Чтобы устранить данный момент, применяем инструмент «Разбор» для быстрого объединения кластеров по названию их вершин.
      Для вершин кластеров в столбце «А» необходимо повторно применить выжимку, по которой будет сразу понятно, кластера с каким названием вершин нужно объединить.
      Переносим кластера, которые хотим объединить начиная со столбца «В» в одну строку. Удаляем пустые строки и завершаем разбор.
      На вкладке “Конечная семантика” получаем объединенные кластера с сортировкой по убыванию суммарной частоты.

      Когда кластеризация не показывает однозначного распределения запросов по кластерам, как например в данном примере, приходится принимать решение на основании того, насколько хорошо мы разбираемся в тематике и никакая автоматизация не поможет.

      Склонение и генерация

      Получив конечную семантику, мы можем сгенерировать теги для SEO продвижения.

      Генерация H1

      Заголовок H1 будем задавать по самой частотной фразе в кластере. Для этого сначала отсортируем итоговую семантику по столбцу с частотностью. Применяем инструмент «Сортировка» и запросы в каждом кластере сортируются по убыванию частоты.
      С помощью инструмента «H1» указываем столбец с запросами и столбец для заголовка.Берется первая закрашенная ячейка столбца «B» и записывается на весь кластер. С помощью данного инструмента можно быстро протянуть любой идентификатор.

      Генерация Title

      Для генерации Title есть 2 шаблона:

        с разделителем. Позволяет вставить дополнительные слова в начало и конец Title, который формируется из первых двух запросов, разделенных вертикальной чертой.

    2. скользящий. Позволяет вставить дополнительные слова в середину и конец Title, который формируется из двух запросов, разделенных дефисом. К преимуществам данного шаблона относятся возможность изменять падеж, использовать название кластера или третий запрос в списке.
    3. Примечание: запросы должны находиться в столбце «B», название кластера — в столбце «A». Title генерируется в первый пустой столбец.

      Генерация Description

      Для генерации мета-описания воспользуемся инструментом «Description», который позволяет задать префикс, постфикс, изменить падеж запроса и добавить UTF-8 символы.
      Примечание: запрос, добавляемый в шаблон, берется из столбца «A». Description генерируется в первый пустой столбец.

      На выходе всех сервисов кластеризации получается файл, который нужно дополнительно обрабатывать: объединять и перегруппировать кластера, чистить от мусора. Специалист тратит много времени и ручного труда на выявление ошибок. С настройкой SEO для Excel получается значительно снизить трудо- и времязатраты на доработку кластеризированного семантического ядра.

      Источник:
      http://kytaichuk.ru/tools/seo-excel-for-keyword-grouping/

      4 техники анализа данных в Microsoft Excel

      Если вам по работе или учёбе приходится погружаться в океан цифр и искать в них подтверждение своих гипотез, вам определённо пригодятся эти техники работы в Microsoft Excel. Как их применять — показываем с помощью гифок.

      Тренер Учебного центра Softline с 2008 года.

      1. Сводные таблицы

      Базовый инструмент для работы с огромным количеством неструктурированных данных, из которых можно быстро сделать выводы и не возиться с фильтрацией и сортировкой вручную. Сводные таблицы можно создать с помощью нескольких действий и быстро настроить в зависимости от того, как именно вы хотите отобразить результаты.

      Полезное дополнение. Вы также можете создавать сводные диаграммы на основе сводных таблиц, которые будут автоматически обновляться при их изменении. Это полезно, если вам, например, нужно регулярно создавать отчёты по одним и тем же параметрам.

      Как работать

      Исходные данные могут быть любыми: данные по продажам, отгрузкам, доставкам и так далее.

      1. Откройте файл с таблицей, данные которой надо проанализировать.
      2. Выделите диапазон данных для анализа.
      3. Перейдите на вкладку «Вставка» → «Таблица» → «Сводная таблица» (для macOS на вкладке «Данные» в группе «Анализ»).
      4. Должно появиться диалоговое окно «Создание сводной таблицы».
      5. Настройте отображение данных, которые есть у вас в таблице.

      Перед нами таблица с неструктурированными данными. Мы можем их систематизировать и настроить отображение тех данных, которые есть у нас в таблице. «Сумму заказов» отправляем в «Значения», а «Продавцов», «Дату продажи» — в «Строки». По данным разных продавцов за разные годы тут же посчитались суммы. При необходимости можно развернуть каждый год, квартал или месяц — получим более детальную информацию за конкретный период.

      Набор опций будет зависеть от количества столбцов. Например, у нас пять столбцов. Их нужно просто правильно расположить и выбрать, что мы хотим показать. Скажем, сумму.

      Можно её детализировать, например, по странам. Переносим «Страны».

      Можно посмотреть результаты по продавцам. Меняем «Страну» на «Продавцов». По продавцам результаты будут такие.

      Этот способ визуализации данных с географической привязкой позволяет анализировать данные, находить закономерности, имеющие региональное происхождение.

      Полезное дополнение. Координаты нигде прописывать не нужно — достаточно лишь корректно указать географическое название в таблице.

      Как работать

      1. Откройте файл с таблицей, данные которой нужно визуализировать. Например, с информацией по разным городам и странам.
      2. Подготовьте данные для отображения на карте: «Главная» → «Форматировать как таблицу».
      3. Выделите диапазон данных для анализа.
      4. На вкладке «Вставка» есть кнопка 3D-карта.

      Точки на карте — это наши города. Но просто города нам не очень интересны — интересно увидеть информацию, привязанную к этим городам. Например, суммы, которые можно отобразить через высоту столбика. При наведении курсора на столбик показывается сумма.

      Также достаточно информативной является круговая диаграмма по годам. Размер круга задаётся суммой.

      3. Лист прогнозов

      Зачастую в бизнес-процессах наблюдаются сезонные закономерности, которые необходимо учитывать при планировании. Лист прогноза — наиболее точный инструмент для прогнозирования в Excel, чем все функции, которые были до этого и есть сейчас. Его можно использовать для планирования деятельности коммерческих, финансовых, маркетинговых и других служб.

      Полезное дополнение. Для расчёта прогноза потребуются данные за более ранние периоды. Точность прогнозирования зависит от количества данных по периодам — лучше не меньше, чем за год. Вам требуются одинаковые интервалы между точками данных (например, месяц или равное количество дней).

      Как работать

      1. Откройте таблицу с данными за период и соответствующими ему показателями, например, от года.
      2. Выделите два ряда данных.
      3. На вкладке «Данные» в группе нажмите кнопку «Лист прогноза».
      4. В окне «Создание листа прогноза» выберите график или гистограмму для визуального представления прогноза.
      5. Выберите дату окончания прогноза.

      В примере ниже у нас есть данные за 2011, 2012 и 2013 годы. Важно указывать не числа, а именно временные периоды (то есть не 5 марта 2013 года, а март 2013-го).

      Для прогноза на 2014 год вам потребуются два ряда данных: даты и соответствующие им значения показателей. Выделяем оба ряда данных.

      На вкладке «Данные» в группе «Прогноз» нажимаем на «Лист прогноза». В появившемся окне «Создание листа прогноза» выбираем формат представления прогноза — график или гистограмму. В поле «Завершение прогноза» выбираем дату окончания, а затем нажимаем кнопку «Создать». Оранжевая линия — это и есть прогноз.

      4. Быстрый анализ

      Эта функциональность, пожалуй, первый шаг к тому, что можно назвать бизнес-анализом. Приятно, что эта функциональность реализована наиболее дружественным по отношению к пользователю способом: желаемый результат достигается буквально в несколько кликов. Ничего не нужно считать, не надо записывать никаких формул. Достаточно выделить нужный диапазон и выбрать, какой результат вы хотите получить.

      Полезное дополнение. Мгновенно можно создавать различные типы диаграмм или спарклайны (микрографики прямо в ячейке).

      Как работать

      1. Откройте таблицу с данными для анализа.
      2. Выделите нужный для анализа диапазон.
      3. При выделении диапазона внизу всегда появляется кнопка «Быстрый анализ». Она сразу предлагает совершить с данными несколько возможных действий. Например, найти итоги. Мы можем узнать суммы, они проставляются внизу.

      В быстром анализе также есть несколько вариантов форматирования. Посмотреть, какие значения больше, а какие меньше, можно в самих ячейках гистограммы.

      Также можно проставить в ячейках разноцветные значки: зелёные — наибольшие значения, красные — наименьшие.

      Надеемся, что эти приёмы помогут ускорить работу с анализом данных в Microsoft Excel и быстрее покорить вершины этого сложного, но такого полезного с точки зрения работы с цифрами приложения.

      Источник:
      http://lifehacker.ru/analiz-dannyx-v-ms-excel/