Читать онлайн Валентин Арьков - Бизнес-аналитика. Сводные таблицы. Часть 2. Учебное пособие



© Валентин Юльевич Арьков, 2020


ISBN 978-5-4498-3195-8 (т. 2)

ISBN 978-5-4498-3196-5

Создано в интеллектуальной издательской системе Ridero

Введение

Задание. Прочитайте в учебнике раздел «Динамика»

В первой части работы [1] по сводным таблицам мы познакомились с «базовыми» функциями этого инструмента – в самых общих чертах, хотя и довольно подробно. С большим количеством примеров, заданий и упражнений.

В данной работе мы продолжаем использовать наш общий подход к практическому освоению программного пакета: моделирование и исследование. Поэтому, кроме освоения сводных таблиц, мы поработаем с генератором случайных чисел и сформируем более-менее реалистичные наборы данных для анализа.

Попутно мы выясним, как связана бизнес-аналитика и статистика. Освежим в памяти некоторые пройденные разделы. А также увидим примеры того, к чему приводит бездумное использование машинного перевода.

Мы будем использовать последнюю версию Microsoft Excel 365, доступную на момент написания данного учебного пособия. Эта версия соответствует выпуску Microsoft Excel 2019. В других версиях программы могут немного различаться названия упоминаемых пунктов меню и кнопок, а также их расположение.

Верхнее меню в последних версиях Excel разработчики назвали лентой (Ribbon). Этот вариант меню включает в себя наиболее часто используемые инструменты. Название красивое, образное, но это по-прежнему многоуровневая система меню. К тому же, диалоговые окна, которые можно вызвать через меню ленты, совсем не изменились за последние лет десять-пятнадцать.

1. Цель и задачи работы

Целью работы является знакомство с продвинутыми функциями сводных таблиц Excel.

В процессе выполнения данной работы мы решим следующие задачи:

1) получим исходные данные путём имитационного моделирования;

2) построим сводные таблицы по смоделированным данным;

3) загрузим реальные данные из интернет;

4) построим сводные таблицы по реальным данным.

2. План работы

В данной работе мы рассмотрим следующие приёмы работы и инструменты сводных таблиц:

1. Мы сгенерируем исходные данные, в которых заложим три компонента динамики: тренд, сезонность и случайность по разным видам товаров.

2. В исходные данные мы также заложим корреляцию между количеством товаров и их ценой (функция регрессии плюс случайность).

3. По смоделированным данным мы построим сводные таблицы – уже знакомый шаг – и добавим условное форматирование для наглядности.

4. Затем проведём анализ динамики с помощью сводных таблиц, в том числе и с помощью миниатюрных графиков – спарклайнов.

5. Наконец, мы проведём анализ взаимосвязи между количеством товаров и ценой с помощью сводки и группировки данных.

6. И конечно же, мы возьмём реальные данные и применим к ним уже рассмотренные и освоенные техники анализа.

3. Отчёт

Отчёт по лабораторной работе оформляется в виде рабочей книги Excel. Вся процедура оформления отчёта подробно описана в предыдущей работе [1].

В отчёте должны быть следующие элементы:

– титульный лист;

– оглавление;

– пронумерованные листы.

Зарисовки вставляем как сфотографированные или отсканированные рисунки.

Название файла должно быть коротким и понятным.

Все эти шаги уже были описаны. Студентам предстоит освежить их в памяти и выполнить.

Задание. Оформите титульный лист и оглавление отчёта и сохраните в файле с коротким информативным названием.

4. Варианты заданий

Номер варианта – это последняя цифра номера зачётки. Если это ноль, выбираем вариант номер 10. Нулевой вариант мы рассмотрим в качестве примера для демонстрации приёмов работы.

Задание. Выясните свой номер варианта и укажите его на титульном листе.


Варианты заданий приводятся в Таблице 4.1. Для каждого варианта имеются свои параметры. Что эти цифры означают, мы скоро узнаем. Но для начала запишем их в отчёт.

Задание. Запишите в отчёте параметры своего варианта задания.



Итак, мы получили параметры задания. Разберёмся, что означают эти многочисленные слова и цифры. Это не так страшно. Кстати, в реальных данных встречается гораздо больше и слов, и цифр. Как мы уже сказали, во всех примерах мы разбираем нулевой вариант.

4.1. Справочник товаров

Вначале посмотрим на товары. У нас должно быть 3 категории по 2 товара. Сразу же придумаем их и запишем. Для этого создадим на новом листе справочник товаров (рис. 4.1). В первом столбце дадим идентификатор товара. Это целое число от 1 и (в нашем случае) до 3*2=6.


Рис. 4.1. Справочник товаров


Задание. Изучите вариант задания и сформируйте свой справочник товаров.


Справочник товаров готов. Почти готов. Чтобы нам было удобнее на него ссылаться, оформим его как таблицу Excel. Выделяем диапазон ячеек вместе с заголовками столбцов и нажимаем

Insert —Table.

Появляется диалоговое окно Create Table (рис. 4.2).

Чтобы задействовать наши заголовки, отмечаем пункт

My table has headers.

Нажимаем ОК.


Рис. 4.2. Вставка таблицы


Теперь наш справочник превращается в полноценный объект – «таблицу Excel» (рис. 4.3). Для удобства работы временно озаглавим вкладку «Тов». Затем можно будет указать только порядковый номер страницы отчёта.


Рис. 4.3. Таблица-справочник товаров


Задание. Выделите справочник товаров и сделайте из него таблицу Excel.


Дадим нашему объекту короткое понятное название, чтобы к нему было легко обращаться. Назовем его просто: «Товары». Для этого щёлкаем по любой ячейке таблицы и выбираем в верхнем меню

Table Tools – Design – Properties – Table Name.

Вводим название таблицы и нажимаем клавишу Enter (рис. 4.4).


Рис. 4.4. Название таблицы


Задание. Установите название для таблицы-справочника товаров.

4.2. Справочник городов

Переходим к географии и создадим второй справочник. В нулевом варианте у нас будет 3 федеральных округа (ФО) по 2 региона в каждом округе, по 2 города в каждом регионе.

Пользуясь случаем, познакомимся картой страны и территориально-административным делением.

Задание. Изучите карту России в Википедии в статье «Федеральные округа Российской Федерации».


Карту мы успешно посмотрели, теперь можно подготовить справочник городов. Выбираем три округа и выясняем, какие в них входят республики и области. А в этих регионах какие есть города. Попутно узнаем, административные центры этих ФО:

– Центральный (ЦФО) – Москва;

– Северо-Западный (СЗФО) – Санкт-Петербург;

– Южный (ЮФО) – Ростов-на-Дону.

Наша задача очень условная и не строгая. Мы просто попытаемся смоделировать федеральную сеть продовольственных магазинов.

Чтобы узнать состав каждого ФО, перейдем по ссылкам и ознакомимся с описанием соответствующего ФО (рис. 4.5). Точно так же можно узнать состав каждой области, перейдя по ссылкам.


Рис. 4.5. Состав ФО


Задание. Выберите ФО и ознакомьтесь с их составом.

Задание. Выберите регионы в составе ФО и ознакомьтесь с их административно-территориальным делением.


Мы посмотрели на карту местности и теперь можем переходить к творчеству. Сформируем справочник регионов и городов (рис. 4.6). Назначим простое и понятное название нашему справочнику – для дальнейшей работы.

Мы получили 3 ФО по 2 региона по 2 города, то есть общее количество городов равно

3*2*2=12.

Всего 12 городов. Это совсем немного для федеральной сети. Можно представить, с каким количеством данных приходится работать на реальном предприятии.

В первой части работы мы генерировали названия магазинов. По несколько штук в каждом городе. В данной работе мы остановимся на городах – для знакомства с функциями сводных таблиц. Дальнейшую детализацию пока не будем рассматривать.


Рис. 4.6. Справочник городов


Задание. Сформируйте справочник городов для своего варианта.

4.3. Модели динамики

ДИНАМИКА – это изменение чего-то во времени. Какого-то статистического признака. Отдельные значения прявязаны к моментам времени. В нашем случае сведения о каждой покупке привязаны к конкретным датам.

В динамике выделяют три компонента, три составные части:

– тренд;

– сезонные колебания;

– случайная составляющая.

Компоненты динамики – это составные части. Это «кирпичики», из которых строится конкретная модель. Компоненты – это разные части. Очень разные. Они не похожи друг на друга. Ихтрудно перепутать. Только если очень постараться.

Для анализа, пронозирования и имитационного моделирования динамики используют два вида моделей:

Аддитивная модель – сумма компонентов.

Мультипликативная модель – произведение компонентов.

Задание. Прочитайте в учебнике «Теория статистики» раздел «Динамика» и выясните, как выглядят компоненты динамики и модели динамики.

Задание. Сделайте зарисовки графиков трёх компонентов динамики и двух видов моделей динамики.

4.4. Тренд

Далее сформируем ТРЕНД. Это долгосрочная тенденция. Общее направление изменений. В нашей модели тренд – это количество товара в одном чеке, в одной покупке. Будем моделировать постепенный рост покупок в течение нескольких лет.

Для нашей модели тренда нам понадобится два значения из параметров задания:

– Начало – начальное значение на линии тренда;

– Конец – последнее значение на линии тренда;

– Период – интервал времени в годах.

В нулевом варианте мы получили такие параметры:

– Начало = 2;

– Конец = 4;

– Период = 2.

Мы будем моделировать данные за два последних года. На момент написания пособия текущий год 2020. Так что возьмём данные за 2018—2019 годы. То есть наш интервал времени такой:

01.01.2018 – 31.12.2019.

Задание. Определите интервал дат для моделирования.


Напомним, что дата в пакете Excel хранится как порядковый номер дня. Мы будем моделировать даты как целые случайные числа. Но для этого нам нужно определить, какие номера дней соответствуют нашим датам.

Запишем даты начала и конца интервала моделирования. Будем вводить даты так, что Excel догадался, что это даты, а не просто какой-то текст:

2018-01-01

2019-12-31.

Даты распознали как даты, и они выводятся в формате даты.

Скопируем даты в соседние ячейки и установим общий формат (рис. 4.7):

Format Cells – Number – Category – General.

Получаем номера дней:

– начало интервала = 43101

– конец интервала = 43830.


Рис. 4.7. Даты интервала моделирования


Задание. Определите номера дней для своего интервала.


Сделаем зарисовку —как должен выглядеть график. Как должна проходить линия тренда. Рисуем от руки на бумаге, фотографируем и вставляем в наш отчёт (рис. 4.8).

Работу с зарисовками мы уже обсуждали в предыдущих работах. Главное – нужно мысленно представлять себе, что мы ожидаем получить. Тогда можно будет обнаружить грубые ошибки.


Рис. 4.8. Зарисовка линии тренда


Задание. Сделайте зарисовку линии тренда и вставьте в отчёт.


Далее нам понадобится построить уравнение тренда для моделирования. Добавим в нашу табличку новую колонку – значения на линии тренда:

Начальное значение = 2

Конечное значение = 4.

Выделяем колонки дней и значений и строим график:

Insert – Charts – Insert Scatter (X, Y) or Bubble Chart – Scatter – Scatter with Straight Lines.

Всплывающая подсказка сообщает, что такой график используют, когда есть два набора данных (рис. 4.9). У нас как раз два набора – дни и значения.


Рис. 4.9. Вставка диаграммы


Задание. Постройте график тренда.


Появляется график (рис. 4.10). Рассмотрим его поподробней. Вид довольно странный. Это не совсем то, что мы хотели и что мы ожидали. Даже совсем не то. Мы хотели увидеть номера дней по оси «иксов», а значения по оси «игреков».

Вот для чего нужна зарисовка! И просто мысленное представление будущих результатов. Мы сразу заметили отличие от того, что должно быть.