Гистограмма распределения в EXCEL

Гистограмма распределения в EXCEL

15 ноября 2016 г.

Гистограмма распределения — это инструмент, позволяющий визуально оценить величину и характер разброса данных. Создадим гистограмму для непрерывной случайной величины с помощью встроенных средств MS EXCEL из надстройки Пакет анализа и в ручную с помощью функции ЧАСТОТА() и диаграммы.

Гистограмма (frequency histogram) – это столбиковая диаграмма MS EXCEL , в каждый столбик представляет собой интервал значений (корзину, карман, class interval, bin, cell), а его высота пропорциональна количеству значений в ней (частоте наблюдений).

Гистограмма поможет визуально оценить распределение набора данных, если:

  • в наборе данных как минимум 50 значений;
  • ширина интервалов одинакова.

Построим гистограмму для набора данных, в котором содержатся значения непрерывной случайной величины . Набор данных (50 значений), а также рассмотренные примеры, можно взять на листе Гистограмма AT в файле примера. Данные содержатся в диапазоне А8:А57 .

Примечание : Для удобства написания формул для диапазона А8:А57 создан Именованный диапазон Исходные_данные.

Построение гистограммы с помощью надстройки Пакет анализа

Вызвав диалоговое окно надстройки Пакет анализа , выберите пункт Гистограмма и нажмите ОК.

В появившемся окне необходимо как минимум указать: входной интервал и левую верхнюю ячейку выходного интервала . После нажатия кнопки ОК будут:

  • автоматически рассчитаны интервалы значений (карманы);
  • подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот);
  • если поставлена галочка напротив пункта Вывод графика , то вместе с таблицей частот будет выведена гистограмма.

Перед тем как анализировать полученный результат — отсортируйте исходный массив данных .

Как видно из рисунка, первый интервал включает только одно минимальное значение 113 (точнее, включены все значения меньшие или равные минимальному). Если бы в массиве было 2 или более значения 113, то в первый интервал попало бы соответствующее количество чисел (2 или более).

Второй интервал (отмечен на картинке серым) включает значения больше 113 и меньше или равные 216,428571428571. Можно проверить, что таких значений 11. Предпоследний интервал, от 630,142857142857 (не включая) до 733,571428571429 (включая) содержит 0 значений, т.к. в этом диапазоне значений нет. Последний интервал (со странным названием Еще ) содержит значения больше 733,571428571429 (не включая). Таких значений всего одно — максимальное значение в массиве (837).

Размеры карманов одинаковы и равны 103,428571428571. Это значение можно получить так: =(МАКС( Исходные_данные )-МИН( Исходные_данные ))/7 где Исходные_данные – именованный диапазон , содержащий наши данные.

Почему 7? Дело в том, что количество интервалов гистограммы (карманов) зависит от количества данных и для его определения часто используется формула √n, где n – это количество данных в выборке. В нашем случае √n=√50=7,07 (всего 7 полноценных карманов, т.к. первый карман включает только значения равные минимальному).

Примечание : Похоже, что инструмент Гистограмма для подсчета общего количества интервалов (с учетом первого) использует формулу =ЦЕЛОЕ(КОРЕНЬ(СЧЕТ( Исходные_данные )))+1

Попробуйте, например, сравнить количество интервалов для диапазонов длиной 35 и 36 значений – оно будет отличаться на 1, а у 36 и 48 – будет одинаковым, т.к. функция ЦЕЛОЕ() округляет до ближайшего меньшего целого (ЦЕЛОЕ(КОРЕНЬ(35))=5 , а ЦЕЛОЕ(КОРЕНЬ(36))=6) .

Если установить галочку напротив поля Парето (отсортированная гистограмма) , то к таблице с частотами будет добавлена таблица с отсортированными по убыванию частотами.

Если установить галочку напротив поля Интегральный процент , то к таблице с частотами будет добавлен столбец с нарастающим итогом в % от общего количества значений в массиве.

Если выбор количества интервалов или их диапазонов не устраивает, то можно в диалоговом окне указать нужный массив интервалов (если интервал карманов включает текстовый заголовок, то нужно установить галочку напротив поля Метка ).

Для нашего набора данных установим размер кармана равным 100 и первый карман возьмем равным 150.

В результате получим практически такую же по форме гистограмму , что и раньше, но с более красивыми границами интервалов.

Как видно из рисунков выше, надстройка Пакет анализа не осуществляет никакого дополнительного форматирования диаграммы . Соответственно, вид такой гистограммы оставляет желать лучшего (столбцы диаграммы обычно располагают вплотную для непрерывных величин, кроме того подписи интервалов не информативны). О том, как придать диаграмме более презентабельный вид, покажем в следующем разделе при построении гистограммы с помощью функции ЧАСТОТА() без использовании надстройки Пакет анализа .

Построение гистограммы распределения без использования надстройки Пакет анализа

Порядок действий при построении гистограммы в этом случае следующий:

  • определить количество интервалов у гистограммы;
  • определить ширину интервала (с учетом округления);
  • определить границу первого интервала;
  • сформировать таблицу интервалов и рассчитать количество значений, попадающих в каждый интервал (частоту);
  • построить гистограмму.

СОВЕТ : Часто рекомендуют, чтобы границы интервала были на один порядок точнее самих данных и оканчивались на 5. Например, если данные в массиве определены с точностью до десятых: 1,2; 2,3; 5,0; 6,1; 2,1, …, то границы интервалов должны быть округлены до сотых: 1,25-1,35; 1,35-1,45; … Для небольших наборов данных вид гистограммы сильно зависит количества интервалов и их ширины. Это приводит к тому, что сам метод гистограмм, как инструмент описательной статистики , может быть применен только для наборов данных состоящих, как минимум, из 50, а лучше из 100 значений.

В наших расчетах для определения количества интервалов мы будем пользоваться формулой =ЦЕЛОЕ(КОРЕНЬ(n))+1 .

Примечание : Кроме использованного выше правила (число карманов = √n), используется ряд других эмпирических правил, например, правило Стёрджеса (Sturges): число карманов =1+log2(n). Это обусловлено тем, что например, для n=5000, количество интервалов по формуле √n будет равно 70, а правило Стёрджеса рекомендует более приемлемое количество — 13.

Расчет ширины интервала и таблица интервалов приведены в файле примера на листе Гистограмма . Для вычисления количества значений, попадающих в каждый интервал, использована формула массива на основе функции ЧАСТОТА() . О вводе этой функции см. статью Функция ЧАСТОТА() — Подсчет ЧИСЛОвых значений в MS EXCEL .

В MS EXCEL имеется диаграмма типа Гистограмма с группировкой , которая обычно используется для построения Гистограмм распределения .

В итоге можно добиться вот такого результата.

Примечание : О построении и настройке макета диаграмм см. статью Основы построения диаграмм в MS EXCEL .

Одной из разновидностей гистограмм является график накопленной частоты (cumulative frequency plot).

На этом графике каждый столбец представляет собой число значений исходного массива, меньших или равных правой границе соответствующего интервала. Это очень удобно, т.к., например, из графика сразу видно, что 90% значений (45 из 50) меньше чем 495.

СОВЕТ : О построении двумерной гистограммы см. статью Двумерная гистограмма в MS EXCEL .

Примечание : Альтернативой графику накопленной частоты может служить Кривая процентилей , которая рассмотрена в статье про Процентили .

Примечание : Когда количество значений в выборке недостаточно для построения полноценной гистограммы может быть полезна Блочная диаграмма (иногда она называется Диаграмма размаха или Ящик с усами ).

Источник:
http://excel2.ru/articles/gistogramma-raspredeleniya-v-ms-excel

Динамическая гистограмма или график распределения частот в Excel

В двух словах: Добавляем полосу прокрутки к гистограмме или к графику распределения частот, чтобы сделать её динамической или интерактивной.

Уровень сложности: продвинутый.

На следующем рисунке показано, как выглядит готовая динамическая гистограмма:

Что такое гистограмма или график распределения частот?

Гистограмма распределения разбивает по группам значения из набора данных и показывает количество (частоту) чисел в каждой группе. Такую гистограмму также называют графиком распределения частот, поскольку она показывает, с какой частотой представлены значения.

В нашем примере мы делим людей, которые вызвались принять участие в мероприятии, по возрастным группам. Первым делом, создадим возрастные группы, далее подсчитаем, сколько людей попадает в каждую из групп, и затем покажем все это на гистограмме.

Читайте также  2 простых способа создать раскрывающийся список в Google таблице - Mister-Office

На какие вопросы отвечает гистограмма распределения?

Гистограмма – это один из моих самых любимых типов диаграмм, поскольку она дает огромное количество информации о данных.

В данном случае мы хотим знать, как много участников окажется в возрастных группах 20-ти, 30-ти, 40-ка лет и так далее. Гистограмма наглядно покажет это, поэтому определить закономерности и отклонения будет довольно легко.

«Неужели наше мероприятие не интересно гражданам в возрасте от 20 до 29 лет?»

Возможно, мы захотим немного изменить детализацию картины и разбить население на две возрастные группы. Это покажет нам, что в мероприятии примут участие большей частью молодые люди:

Динамическая гистограмма

После построения гистограммы распределения частот иногда возникает необходимость изменить размер групп, чтобы ответить на различные возникающие вопросы. В динамической гистограмме это возможно сделать благодаря полосе прокрутки (слайдеру) под диаграммой. Пользователь может увеличивать или уменьшать размер групп, нажимая стрелки на полосе прокрутки.

Такой подход делает гистограмму интерактивной и позволяет пользователю масштабировать ее, выбирая, сколько групп должно быть показано. Это отличное дополнение к любому дашборду!

Как это работает?

Краткий ответ: Формулы, динамические именованные диапазоны, элемент управления «Полоса прокрутки» в сочетании с гистограммой.

Чтобы всё работало, первым делом нужно при помощи формул вычислить размер группы и количество элементов в каждой группе.

Чтобы вычислить размер группы, разделим общее количество (80-10) на количество групп. Количество групп устанавливается настройками полосы прокрутки. Чуть позже разъясним это подробнее.

Далее при помощи функции ЧАСТОТА (FREQUENCY) я рассчитываю количество элементов в каждой группе в заданном столбце. В данном случае мы возвращаем частоту из столбца Age таблицы с именем tblData.

Функция ЧАСТОТА (FREQUENCY) вводится, как формула массива, нажатием Ctrl+Shift+Enter.

Динамический именованный диапазон

В качестве источника данных для диаграммы используется именованный диапазон, чтобы извлекать данные только из выбранных в текущий момент групп.

Когда пользователь перемещает ползунок полосы прокрутки, число строк в динамическом диапазоне изменяется так, чтобы отобразить на графике только нужные данные. В нашем примере задано два динамических именованных диапазона: один для данных – rngGroups (столбец Frequency) и второй для подписей горизонтальной оси – rngCount (столбец Bin Name).

Элемент управления «Полоса прокрутки»

Элемент управления Полоса прокрутки (Scroll Bar) может быть вставлен с вкладки Разработчик (Developer).

На рисунке ниже видно, как я настроил параметры элемента управления и привязал его к ячейке C7. Так, изменяя состояние полосы прокрутки, пользователь управляет формулами.

Гистограмма

График – это самая простая часть задачи. Создаём простую гистограмму и в качестве источника данных устанавливаем динамические именованные диапазоны.

Есть вопросы?

Что ж, это был лишь краткий обзор того, как работает динамическая гистограмма.

Да, это не самая простая диаграмма, но, полагаю, пользователям понравится с ней работать. Определённо, такой интерактивной диаграммой можно украсить любой отчёт.

Более простой вариант гистограммы можно создать, используя сводные таблицы.

Пишите в комментариях любые вопросы и предложения. Спасибо!

Источник:
http://office-guru.ru/excel/dinamicheskaja-gistogramma-ili-grafik-raspredelenija-chastot-v-excel-470.html

LiveInternetLiveInternet

Метки

Музыка

Конвертер видеоссылок

Подписка по e-mail

Поиск по дневнику

Интересы

Постоянные читатели

Трансляции

Статистика

Построение гистограмм распределения в Excel

В связи с написанием диплома тема подсчёта статистики для меня крайне актуальна, посему делюсь найденной крайне полезной стаейкой по построению гистограмм распределения. Точнее частью этой статьи с наипростейшим алгоритмом постороения этих гистограмм Excel. Лично я строю этим способом гистограммы распределения значений показателей психологических тестов, ну а там уж каждому по потребностям, распределение чего надо посмотреть.

В современном мире к статистике проявляется большой интерес, поскольку это отличный инструмент для анализа и принятия решений, а также это отличное средство для поиска причин нарушений процесса и их устранения. Статистический анализ применим во многих сферах, где существуют большие массивы данных: естественно, в первую очередь я скажу, что металлургии, а также в экономике, биологии, политике, социологии и. много где еще. Статья эта будет, как несложно догадаться по ее названию, про использование некоторых средств статистического анализа, а именно — гистограммам.
Ну, поехали.

Статистический анализ в Excel можно осуществлять двумя способами:
• С помощью функций
• С помощью средств надстройки «Пакет анализа». Ее, как правило, еще необходимо установить.

Чтобы установить пакет анализа в Excel, выберите вкладку «Файл» (а в Excel 2007 это круглая цветная кнопка слева сверху), далее — «Параметры», затем выберите раздел «Надстройки». Нажмите «Перейти» и поставьте галочку напротив «Пакет анализа».

А теперь — к построению гистограмм распределения по частоте и их анализу.

Речь пойдет именно о частотных гистограммах, где каждый столбец соответствует частоте появления* значения в пределах границ интервалов. Например, мы хотим посмотреть, как у нас выглядит распределение значения предела текучести стали S355J2 в прокате толщиной 20 мм за несколько месяцев. В общем, хотим посмотреть, похоже ли наше распределение на нормальное (а оно должно быть таким).

*Примечание: для металловедческих целей типа оценки размера зерна или оценки объемной доли частиц этот вид гистограмм не пойдет, т.к. там высота столбика соответствует не частоте появления частиц определенного размера, а доле объема (а в плоскости шлифа — площади), которую эти частицы занимают.

График нормального распределения выглядит следующим образом:

График функции Гаусса

Мы знаем, что реально такой график может быть получен только при бесконечно большом количестве измерений. Реально же для конечного числа измерений строят гистограмму, которая внешне похожа на график нормального распределения и при увеличении количества измерений приближается к графику нормального распределения (распределения Гаусса).

Построение гистограмм с помощью программ типа Excel является очень быстрым способом проверки стабильности работы оборудования и добросовестности коллектива: если получим «кривую» гистограмму, значит, либо прибор не исправен или мы данные неверно собрали, либо кто-то где-то преднамеренно мухлюет или же просто неверно использует оборудование.

А теперь — построение гистограмм!

Способ 1-ый. Халявный.


  1. Идем во вкладку «Анализ данных» и выбираем «Гистограмма».
  2. Выбираем входной интервал.
  3. Здесь же предлагается задать интервал карманов, т.е. те диапазоны, в пределах которых будут лежать наши значения. Чем больше значений в интервале — тем выше столбик гистограммы. Если мы оставим поле «Интервалы карманов» пустым, то программа вычислит границы интервалов за нас.
  4. Если хотим сразу же вывести график,то ставим галочку напротив «Вывод графика».
  5. Нажимаем «ОК».
  6. Вот, вроде бы, и все: гистограмма готова. Теперь нужно сделать так, чтобы по вертикальной оси отображалась не абсолютная частота, а относительная.
  7. Под появившейся таблицей со столбцами «Карман» и «Частота» под столбцом «Частота» введем формулу «=СУММ» и сложим все абсолютные частоты.
  8. К появившейся таблице со столбцами «Карман» и «Частота» добавим еще один столбец и назовем его «Относительная частота».
  9. Во всех ячейках нового столбца введем формулу, которая будет рассчитывать относительную частоту: 100 умножить на абсолютную частоту (ячейка из столбца «частота») и разделить на сумму, которую мы вычислил в п. 7.

Источник:
http://www.liveinternet.ru/users/leeshka/post377434277/

Металловедение

Очень давно не писал блог. Расслабился совсем. Ну ничего, исправляюсь.

Продолжаю новую рубрику блога, посвященную анализу данных с помощью всем известного Microsoft Excel.

В современном мире к статистике проявляется большой интерес, поскольку это отличный инструмент для анализа и принятия решений, а также это отличное средство для поиска причин нарушений процесса и их устранения. Статистический анализ применим во многих сферах, где существуют большие массивы данных: естественно, в первую очередь я скажу, что металлургии, а также в экономике, биологии, политике, социологии и. много где еще. Статья эта будет, как несложно догадаться по ее названию, про использование некоторых средств статистического анализа, а именно — гистограммам.
Ну, поехали.

Читайте также  Автоматическая нумерация строк

Статистический анализ в Excel можно осуществлять двумя способами:
• С помощью функций
• С помощью средств надстройки «Пакет анализа». Ее, как правило, еще необходимо установить.

Чтобы установить пакет анализа в Excel, выберите вкладку «Файл» (а в Excel 2007 это круглая цветная кнопка слева сверху), далее — «Параметры», затем выберите раздел «Надстройки». Нажмите «Перейти» и поставьте галочку напротив «Пакет анализа».

А теперь — к построению гистограмм распределения по частоте и их анализу.

Речь пойдет именно о частотных гистограммах, где каждый столбец соответствует частоте появления* значения в пределах границ интервалов. Например, мы хотим посмотреть, как у нас выглядит распределение значения предела текучести стали S355J2 в прокате толщиной 20 мм за несколько месяцев. В общем, хотим посмотреть, похоже ли наше распределение на нормальное (а оно должно быть таким).

*Примечание: для металловедческих целей типа оценки размера зерна или оценки объемной доли частиц этот вид гистограмм не пойдет, т.к. там высота столбика соответствует не частоте появления частиц определенного размера, а доле объема (а в плоскости шлифа — площади), которую эти частицы занимают.

График нормального распределения выглядит следующим образом:

График функции Гаусса

Мы знаем, что реально такой график может быть получен только при бесконечно большом количестве измерений. Реально же для конечного числа измерений строят гистограмму, которая внешне похожа на график нормального распределения и при увеличении количества измерений приближается к графику нормального распределения (распределения Гаусса).

Построение гистограмм с помощью программ типа Excel является очень быстрым способом проверки стабильности работы оборудования и добросовестности коллектива: если получим «кривую» гистограмму, значит, либо прибор не исправен или мы данные неверно собрали, либо кто-то где-то преднамеренно мухлюет или же просто неверно использует оборудование.

style=»display:inline-block;width:468px;height:60px»
data-ad-client=»ca-pub-9341405937949877″
data-ad-slot=»7116308946″>

А теперь — построение гистограмм!

Способ 1-ый. Халявный.

    Идем во вкладку «Анализ данных» и выбираем «Гистограмма».


  • Выбираем входной интервал.
  • Здесь же предлагается задать интервал карманов, т.е. те диапазоны, в пределах которых будут лежать наши значения. Чем больше значений в интервале — тем выше столбик гистограммы. Если мы оставим поле «Интервалы карманов» пустым, то программа вычислит границы интервалов за нас.
  • Если хотим сразу же вывести график,то ставим галочку напротив «Вывод графика».

  • Нажимаем «ОК».
  • Вот, вроде бы, и все: гистограмма готова. Теперь нужно сделать так, чтобы по вертикальной оси отображалась не абсолютная частота, а относительная.

  • Под появившейся таблицей со столбцами «Карман» и «Частота» под столбцом «Частота» введем формулу «=СУММ» и сложим все абсолютные частоты.
  • К появившейся таблице со столбцами «Карман» и «Частота» добавим еще один столбец и назовем его «Относительная частота».
  • Во всех ячейках нового столбца введем формулу, которая будет рассчитывать относительную частоту: 100 умножить на абсолютную частоту (ячейка из столбца «частота») и разделить на сумму, которую мы вычислил в п. 7.
  • Способ 2-ой. Трудный, но интересный.

    Будет полезен тому, кто по каким-либо причинам не смог установить Пакет анализа.

    1. Перво-наперво нужно задать интервалы тех самых карманов, которые мы не стали вычислять в способе, описанном выше.
    2. Интервал карманов вычисляют так: разность максимального значения и минимального значений массива, деленная на количество интервалов: (Xmax-Xmin)/n.
      Для оценки оптимального для нашего массива данных количества интервалов можно воспользоваться формулой Стерджесса: n

    1+3,322lgN, где N — количество всех значений величины. Например для N=100, n=7,6. Естественно, округляем до 8.

  • Для нахождения максимального и минимального значений воспользуемся соответствующими функциями: =МАКС(наш диапазон значений) и =МИН(наш диапазон значений).
  • Найдем разность этих значений и разделим его на количество интервалов, которое нам захочется. Пусть будет 10. Так мы вычислили ширину нашего «кармана».

    Теперь в каждой ячейке шаг за шагом прибавляем полученное значение ширины кармана: сначала к минимальному значению нашего массива (п. 3), затем в следующей ячейке ниже — к полученной сумме и т.д. Так постепенно доходим до максимального значения. Вот мы и построили интервалы карманов в виде столбца значений. Интервалом считается следующий диапазон : (i-1; i] или i >Скачать бесплатно видеокурc по Excel

    Источник:
    http://metallovedeniye.ru/analiz-dannyx-v-excel/postroenie-gistogramm-raspredeleniya-v-excel.html

    Построить график распределения в Excel

    Excel при изученииоснов теории вероятности и математической статистики

    Тампишева С.Б.,

    старший преподаватель Казахского финансово-экономического института, г .С емипалатинск, Республика Казахстан

    Высшее образование и наукастановятся глобальным фактором общественного развития, выдвигаются в числонаиболее важныхнациональных и общемировых приоритетов, выступаютв качестве важнейших компонентовкультурного, социального и экономическиустойчивого развития людей, сообществ, наций[1].

    В докладе ЮНЕСКО « Высшее образование в XXI веке: подходы и практические меры» (1998г.) отмечалось, что «в сфере высшего образования наблюдается теснейшее сближение, если не общность проблем, тенденций, задач и целей, заставляющихзабыватьо национальных и региональныхразличиях и специфике«[2]. Сложившиеся в настоящее время социально-экономическиеи социально-культурные условиятребуют подготовки специалиста, конкурентоспособного на рынке труда.

    Для успешного функционированияспециалиста в высокотехнологическом обществе необходимо постоянное пополнениебагажа знаний, умений и навыков.Непрерывное образование- необходимость и требование современнойнаучно-технической цивилизации.

    Главная задача высшейшкол ы- поднять профессиональную и социальнуюкомпетентность выпускников вузов, научить их ориентироваться в потоке постоянно меняющейся информации, мыслитьсамостоятельно, критически и творчески. Сегодня этоневозможно без овладения студентами знаниями, умениями, навыками использования информационных технологий в сферебудущей профессиональной деятельности.

    К настоящему времени исследователи пришлик единому мнению, что информационные технологии должны разрабатываться с учетом классических дидактических требований: принципа научности, доступности и посильной трудности, систематичности и последовательности, прочности усвоения, наглядности, связи теории с практикой, сознательности и активности (самостоятельности), принципа коллективного характера обучения и учета индивидуальных особенностейобучающихся, однако применительно к новым информационным технологиямониимеют свою специфику [3].

    ПЭВМ наиболее полно удовлетворяет дидактическим требованиям и позволяет управлять процессом обучения, максимально адаптировать его киндивидуальнымособенностям обучаемого. Знания, полученные при компьютерном обучении, выступают в познавательной деятельностив качестве средстварешения профессиональных задачдеятельности специалиста.

    Также исследователи выделяют возможные направлениявключениякомпьютера в процесс учебно-познавательной деятельности обучаемых: диагностика, обучающий режим, отработка умений и навыковпри решении задачпосле изучения темы, моделирование сложных процессов, графическая иллюстрация изучаемого материала, работа с базами данных [4].

    Остановимся наприменениитабличного процессора Microsoft Excel при изучении элементов теории вероятностей и математической статистики вкурсематематики для экономистов. Курс математики в системе подготовки экономистовявляется основой дляизучения таких дисциплин какэконометрика, статистика, микроэкономика, макроэкономика, а математические методы исследуютсяво всех областях знаний. В процессе обучения математике у студентов вырабатываютсянавыки исследовательской работы, формируются приемы умственной деятельности, развивается интеллект, т. е.формируетсяличностьбудущего специалиста с необходимымипрофессионально значимымикачествами.

    Применение математического аппарата теории вероятностей и математической статистики позволяетполучать наиболее вероятныеколичественныезначенияэкономических показателей, устанавливать связьмежду различнымислучайными параметрами и приниматьобоснованные решения в экономике.

    В настоящее время математико-статистические методы широко внедрилисьв жизнь, благодаряперсональным электронно-вычислительным машинам. Статистическиепрограммные пакеты сделали эти методы более доступными и наглядными, так как трудоемкуюпо расчету различныхстатистик, параметров, характеристик, построению таблиц и графиков в основном стал выполнять компьютер, а исследователюостаетсяглавным образом творческая работа: постановка задачи, выбор методов ее решения и интерпретация результатов.

    Существует множество различных пакетов программ по работе со статистическими данными, но наибольшее распространение в деловой сфере получил табличный процессор Microsoft Excel . Он включает в себя программную надстройку «Пакет анализа» и библиотеку из 83 (в среде Microsoft Excel 2000) статистических функций , 50 математических функций,которые позволяют автоматизироватьрасчеты, а такжена их основеполучить графическую интерпретацию.

    При изучении основных понятий и теорем теории вероятностей можно использовать, например,такие функции Excel как: экспонента, степень, факториал, перестановки, число комбинаций, вероятность. Изучаяслучайные величины и их характеристики, можно использовать, например, такие статистические функции как дисперсия, доверительный интервал, медиана, мода , различные виды распределений случайных величин и др. Кроме того,в дальнейшем, при изучении эконометрикии статистики,предоставляется широкийвыбор другихстатистических функций.

    Рассмотрим использование Excel при изученииразличных видовраспределений дискретных и непрерывных случайных величин.

    При работе со случайными величинамина лекционных занятиях студентовзнакомят с понятиемслучайной величины, законами ее распределения, математическим ожиданием, дисперсией. Формируются вероятностные модели биномиального распределения, распределения Пуассона, геометрического и гипергеометрического и других распределений, во время практических занятий эти понятия закрепляются и отрабатываются. Задания, выполненные на компьютере, помогут вывести обучающихсяна более высокий уровень усвоения знаний и умений,и сопровождаться значительной экономией времени.

    При рассмотрениизаконов распределения, например, нужно обратить внимание насферы ихиспользования. При построении графиков функцийсравнивать их кривые, анализировать, делать выводы.

    Рассмотрим задание набиномиальное распределение:

    Задание 1. Построить с помощью программы Excel , многоугольникбиномиального распределения для следующих параметров:

    Используетсястатистическая функция БИНОМРАСПР:

    Рис.1Многоугольникбиномиального распределения ( n =10, p =0,5)

    Изменяя параметры распределения, проследить как изменяетсяконтур многоугольника распределения.

    Задание 2. Работа уличного агента по приглашению потенциальных покупателей тайм-шер считаетсяудовлетворительной, если по его приглашению за день на презентацию придет более 10 покупателей. Считая, что вероятность того, что лицо, к которому агент обратится с предложением, с вероятностью 0,1 придет на презентацию, вычислить вероятность того, что работаагента будет признана удовлетворительной, если агент обратится с предложением к 40 прохожим.

    Для задачи необходимо составление компьютерной модели, выполнение громоздкихрасчетовс помощью функции БИНОМРАСПР.

    Для закрепленияраспределения Пуассона можно предложить задание 3.

    Задание 3. Устройство состоит из 1000 элементов, работающих независимо один от другого. Вероятность отказа любого элемента в течение времени Т равно 0,002. Найти вероятность того, что за время Т откажут ровно k элементов. Построить график распределения вероятности k =0;1;2;3;4;5;6;7.

    Используется функция ПУАССОН:

    Рис.2Многоугольник распределения Пуассона ( l =2)

    После построения графика целесообразно поставить вопрос : от какого параметра зависит распределение Пуассона?

    Задание 4 и 5 на гипергеометрическое распределение, выполнение расчетов и построение графика.

    Задание 4. В лотерее «Спортлото 6 из 45 «денежные призы получают участники, угадавшие 3, 4, 5 и 6 видов спорта из отобранныхслучайно 6 видов из 45. Найти закон распределения случайной величины Х- числа угаданных видов спорта среди случайно отобранных шести. Какова вероятность получения денежного приза? Найти математическое ожидание и дисперсию случайной величины Х.

    В задании 4строитсямодель, через функцию ГИПЕРГЕОМЕТвыполняются громоздкие вычисления длярядаэтого распределения.

    Задание 5. Построить графики гипергеометрического распределения для следующих значений параметров:

    Нормальный закон распределенияприменяется взаданиях 6 и 7.

    З адание 6.Построить кривую Гаусса для:

    а) а=2; s =2; б )а =2; s =1; в)а=2; s =0,5. Сделать выводы по графикам. Найти площадь под каждой кривой Гаусса.

    Эта задача подразумевает несколько этапов решения, процесс построениякривой , анализ полученных результатов, их геометрическую интерпретацию.

    Задание 7. Полагая, что рост мужчин определенной возрастнойгруппы есть нормально распределеннаяслучайная величина Х с параметрами а=173, , найти:

    а) выражение плотности вероятности и функции распределения случайной величины Х;

    b ) доли костюмов 4-го роста (176- ) и 3-го роста (170-176см), которыенужно предусмотреть в общем объеме производства для данной возрастной группы;

    с) квантиль и 10 % -ную точку случайной величины Х.

    В задании 7 необходимо построитьмодель нормального распределения, вероятность попадания в интервал,применить правиланахождения квантиля .

    Задание 8. Непрерывная случайная величина Храспределенапо показательному закону, заданному при плотностьюраспределения ; при x

    Источник:
    http://officeassist.ru/excel/postroit-grafik-raspredeleniya-v-excel/

    Динамическая гистограмма или график распределения частот в Excel

    В двух словах: Добавляем полосу прокрутки к гистограмме или к графику распределения частот, чтобы сделать её динамической или интерактивной.

    Уровень сложности: продвинутый.

    На следующем рисунке показано, как выглядит готовая динамическая гистограмма:

    Что такое гистограмма или график распределения частот?

    Гистограмма распределения разбивает по группам значения из набора данных и показывает количество (частоту) чисел в каждой группе. Такую гистограмму также называют графиком распределения частот, поскольку она показывает, с какой частотой представлены значения.

    В нашем примере мы делим людей, которые вызвались принять участие в мероприятии, по возрастным группам. Первым делом, создадим возрастные группы, далее подсчитаем, сколько людей попадает в каждую из групп, и затем покажем все это на гистограмме.

    На какие вопросы отвечает гистограмма распределения?

    Гистограмма – это один из моих самых любимых типов диаграмм, поскольку она дает огромное количество информации о данных.

    В данном случае мы хотим знать, как много участников окажется в возрастных группах 20-ти, 30-ти, 40-ка лет и так далее. Гистограмма наглядно покажет это, поэтому определить закономерности и отклонения будет довольно легко.

    «Неужели наше мероприятие не интересно гражданам в возрасте от 20 до 29 лет?»

    Возможно, мы захотим немного изменить детализацию картины и разбить население на две возрастные группы. Это покажет нам, что в мероприятии примут участие большей частью молодые люди:

    Динамическая гистограмма

    После построения гистограммы распределения частот иногда возникает необходимость изменить размер групп, чтобы ответить на различные возникающие вопросы. В динамической гистограмме это возможно сделать благодаря полосе прокрутки (слайдеру) под диаграммой. Пользователь может увеличивать или уменьшать размер групп, нажимая стрелки на полосе прокрутки.

    Такой подход делает гистограмму интерактивной и позволяет пользователю масштабировать ее, выбирая, сколько групп должно быть показано. Это отличное дополнение к любому дашборду!

    Как это работает?

    Краткий ответ: Формулы, динамические именованные диапазоны, элемент управления «Полоса прокрутки» в сочетании с гистограммой.

    Чтобы всё работало, первым делом нужно при помощи формул вычислить размер группы и количество элементов в каждой группе.

    Чтобы вычислить размер группы, разделим общее количество (80-10) на количество групп. Количество групп устанавливается настройками полосы прокрутки. Чуть позже разъясним это подробнее.

    Далее при помощи функции ЧАСТОТА (FREQUENCY) я рассчитываю количество элементов в каждой группе в заданном столбце. В данном случае мы возвращаем частоту из столбца Age таблицы с именем tblData.

    Функция ЧАСТОТА (FREQUENCY) вводится, как формула массива, нажатием Ctrl+Shift+Enter.

    Динамический именованный диапазон

    В качестве источника данных для диаграммы используется именованный диапазон, чтобы извлекать данные только из выбранных в текущий момент групп.

    Когда пользователь перемещает ползунок полосы прокрутки, число строк в динамическом диапазоне изменяется так, чтобы отобразить на графике только нужные данные. В нашем примере задано два динамических именованных диапазона: один для данных – rngGroups (столбец Frequency) и второй для подписей горизонтальной оси – rngCount (столбец Bin Name).

    Элемент управления «Полоса прокрутки»

    Элемент управления Полоса прокрутки (Scroll Bar) может быть вставлен с вкладки Разработчик (Developer).

    На рисунке ниже видно, как я настроил параметры элемента управления и привязал его к ячейке C7. Так, изменяя состояние полосы прокрутки, пользователь управляет формулами.

    Гистограмма

    График – это самая простая часть задачи. Создаём простую гистограмму и в качестве источника данных устанавливаем динамические именованные диапазоны.

    Есть вопросы?

    Что ж, это был лишь краткий обзор того, как работает динамическая гистограмма.

    Да, это не самая простая диаграмма, но, полагаю, пользователям понравится с ней работать. Определённо, такой интерактивной диаграммой можно украсить любой отчёт.

    Более простой вариант гистограммы можно создать, используя сводные таблицы.

    Пишите в комментариях любые вопросы и предложения. Спасибо!

    Источник:
    http://office-guru.ru/excel/dinamicheskaja-gistogramma-ili-grafik-raspredelenija-chastot-v-excel-470.html