sonyps4.ru

Процедуры минимизации. Схемотехника

  • Суть и виды статистических группировок.
  • Выполнение группировки по количественному признаку.
  • Ряды распределения, их виды и графическое изображение.

Суть и виды статистических группировок

В результате первой стадии статистических исследований (статистического наблюдения) получают статистическую информацию , представляющую собой большое количество первичных, разрозненных сведений об отдельных единицах объекта исследования (например, записи о каждом гражданине страны при переписи населения: пол, национальность, возраст, образование и др.).

Дальнейшая задача статистики заключается в этом, чтобы привести эти материалы в определенный порядок, систематизировать и на этой основе дать сводную характеристику всей совокупности фактов для того, чтобы изучить характерные черты и отличительные особенности изучаемого явления и выявить закономерности его развития. Это достигается на второй стадии статистического исследования, первой ступенью которой является статистическая сводка.

Статистическая сводка – это научно организованная обработка первичных данных в целях получения обобщающих характеристик изучаемого явления по ряду существенных для него признаков.

Если производится только подсчет общих итогов по изучаемой совокупности единиц наблюдения, то сводка называется простой. Например: чтобы узнать общую численность студентов высших учебных заведений Украины достаточно сложить количество студентов всех ВУЗов на определенную дату.
Статистическая сводка включает в себя такие составляющие элементы:

  • выбор группировочных признаков (например, после переписи население можно делить на группы по признакам: пол, возраст, национальность);
  • распределение данных на части (группы и подгруппы);
  • расчет итоговых групповых данных с помощью системы статистических показателей.
  • систематизация полученных результатов в виде статистических таблиц.

Объединение отдельных единиц статистической совокупности в группы осуществляется при помощи метода группировок.

Статистическая группировка – это процесс образования однородных групп по ряду существенных признаков. Осуществляется группировка либо путем деления совокупности на отдельные части, которые характеризуются внутренней однородностью и отличаются рядом признаков, либо путем объединения отдельных единиц в группы по типовым признакам (например, группировка промышленных предприятий по форме собственности, группировка населения по размеру среднедушевого дохода, группировка коммерческих банков по сумме актива баланса и т.д.).

Признаки, по которым производится распределение единиц изучаемой совокупности на группы, называются группировочными признаками или основанием группировки . Если группировка получена по количественному признаку, она называется количественной, по качественному – атрибутивной или качественной.
На группировку в статистическом анализе возлагаются следующие функции:

  • выделение социально-экономических типов явлений;
  • изучение структуры и структурных сдвигов;
  • анализ взаимосвязей между явлениями.

В соответствии с этими функциями различают типологические, структурные и аналитические (факторные) группировки.
Типологическая группировка – это распределение качественно разнородной совокупности на классы, социально-экономические однородные типы. К этому виду относятся группировки стран по социально-политическому устройству, предприятий – по форме собственности, населения – по месту проживания (городское и сельское).

Разделение однородной совокупности на группы с целью выявления ее внутренней структуры называется структурной группировкой. Она характеризует состав совокупности, объем (весомость) ее отдельных групп.
Таблица 1 – Группировка потребителей йогурта по возрасту

Анализ структурных группировок, взятых за ряд периодов или моментов времени, показывает изменение структуры изучаемых явлений, т.е. структурные сдвиги , что отражает закономерности их развития.

Аналитические группировки используются для исследования наличия зависимости между изучаемыми явлениями. Для этого следует данные сгруппировать по одному из признаков, вычислить в каждой группе среднее значение второго признака, а затем сопоставить изменения изучаемых признаков. Если с увеличением или уменьшением группировочного признака увеличиваются значения второго признака, то связь (прямая или обратная) между ними существует.
Таблица 2 – Группировка магазинов по численности работников (данные условные)


Численность работников, чел.

Количество магазинов

Средняя фактическая продолжительность рабочей недели, ч.

100 и более

Данные показывают, что между размером предприятия и занятостью его работников существует связь: чем больше по количеству работающих магазин, тем короче рабочая неделя.

Если группы, образованные по одному признаку, делятся затем на группы по второму и т.д. признакам, то такая группировка называется комбинированной . Например, распределив группы потребителей йогурта по полу, получим комбинированную группировку.
Таблица 3 – Группировка потребителей йогурта по возрасту и полу

Группы потребителей по возрасту, лет

Число потребителей, чел.

мужского пола

женского пола

Менее 20
20-30
30-40
40-50
50-60
Старше 60

10
40
30
10
6
4

4
17
12
6
3
1

6
23
18
4
3
3

Выполнение группировки по количественному признаку

При составлении структурных группировок на основе количественных признаков определяют количество групп и интервалы группировки .

Интервал – количественное значение, определяющее и отделяющее одну группу от другой, т.е. он очерчивает количественные границы групп.
Интервалы могут быть равные и неравные. Например: по численности работающих предприятия могут быть разбиты на группы: до 100, 100-200, 200-500, 500-1000, 1000 и более. Это объясняется тем, что изменение признака на 50-100 чел. имеет существенное значение для мелких предприятий, а для крупных – не имеет.
Для группировок с равными интервалами величина (длина, шаг) интервала определяется по формуле:

,
где ,– наибольшее и наименьшее значение признака;
к – число групп (интервалов), определяемое по формуле Стерджесса:

,

где N – число единиц совокупности.
Округление полученных в расчетах нецелых чисел производится в большую сторону.
Например: необходимо произвести группировку с равными интервалами 20 рабочих цеха по производительности их труда. Наибольшая производительность 180 деталей за смену, наименьшая – 60.
Количество групп:
Длина интервала: дет.
Нижняя граница 1-ой группы 60 деталей, верхняя 60+20=80 деталей. Вторая группа: нижняя граница 80, верхняя 80+20=100 и т.д. В результате получаем такой интервальный ряд (или такие группы рабочих), деталей:

1 группа: 60-80
2 группа: 80-100
3 группа: 100-120
4 группа: 120-140
5 группа: 140-160
6 группа: 160-180

В этом распределении имеется неопределенность, к какой группе отнести единицу совокупности, значение признака которой равно граничному значению интервала (рабочих с производительностью 80, 100, 200 и т. д. дет/см). Для устранения неопределенности используют принцип единообразия: левая, нижняя граница интервала включает в себя указанное значение, а верхняя – нет. Значит, рабочего, производящего 100 дет/см, относят к 3 группе.

Интервалы групп могут быть закрытыми , когда указаны верхняя и нижняя границы (как в примере), и открытыми , когда указана лишь одна из границ. Например, интервалы «менее 60» или «180 и выше» - открытые интервалы. Для расчета показателей статистической совокупности открытые интервалы необходимо «закрыть». Для этого используют величину интервала, соседнего с «открытым». В примере получим: 40-60 и 180-200.

Сказанное выше относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но довольно часто приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, группировки могут быть не сопоставимы из-за различного числа групп или неодинаковых границ интервалов. Для приведения группировок к сопоставимому виду используется метод вторичной группировки , который заключается в образовании новых групп на основе ранее осуществленной группировки. Эта перегруппировка возможна двумя способами: 1) объединением первоначальных интервалов (т.е. их укрупнением); 2) долевой перегруппировкой.
Рассмотрим пример, данные условные.

Таблица 3 – Группировка акционеров по размеру дивидендов на одну акцию.


1-й район

№ груп-пы

Количество акционеров, %

№ груп-пы

Группы акционеров по размеру диви-дендов, грн.

Количество акционеров, %

1
2
3
4
5

1 – 4
4 – 8
8–12
12–16
16–20

18
12
40
25
5

1
2
3
4

1– 6
6–12
12–20
20–30

10
20
40
30

Приведенные данные не позволяют сравнить распределение акционеров двух районов по размеру дивидендов из-за различного числа групп (5 и 4) и различной длины интервала. Взяв за основу группировку 2-го района (как более крупную), произведем вторичную группировку акционеров 1-го района.

Таблица 4 – Вторичная группировка акционеров по размеру дивидендов на 1 акцию


№ груп-пы

Группы акционеров по размеру дивидендов, %

Количество акционеров, %

1
2
3
4

1 – 6
6–12
12–20
20–30

10
20
40
30

24
46
30

18+0,5*12=24
0,5*12+40=46
25+5=30

Анализ сопоставимых данных вторичной группировки позволяет сделать вывод: акционеры второго района имеют более высокие дивиденды: (12 и выше грн. получают 40+30=70 % акционеров, а в первой – только 30 %).

Ряды распределения, их виды и графическое изображение

Статистический ряд распределения – это упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку (предыдущий пример – это ряд распределения). Он, являясь разновидностью структурной группировки, характеризует состав (или структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Ряды распределения, построенные по атрибутивному признаку, называются атрибутивными (распределение населения по полу, занятости, профессии и т.д.).
Ряды, построенные по количественному признаку, - вариационными (распределение населения по стажу работы, з/п, возрасту.).

Конструктивно вариационный ряд распределения представляет собой таблицу, в первом столбце которой расположены варианты или их интервалы, во второй – частоты или (и) частости (третий столбец) . Принято варианты обозначать, частоты - , частости - .
Варианты, т.е. числовые значения количественного признака в вариационном ряду распределения, могут быть положительными или отрицательными. Так, при группировке предприятий по результатам деятельности варианты положительные (прибыль) или отрицательные (убыток).

Частоты это числа, показывающие, как часто встречаются те или варианты в данной совокупности. Сумма всех частот называется объемом совокупности и показывает число единиц совокупности, обозначается N.

Частости это частоты, выраженные в виде относительных величин: долях единицы или в процентах, рассчитываются как отношение частоты к объему совокупности. Сумма частостей всегда равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.
Для анализа совокупности вариационный ряд дополняют такими элементами, как накопленная частота, накопленная частость и плотность распределения.

Накопленная частота (Sf)показывает число единиц совокупности, у которых значение варианты не больше данной, определяется суммированием частот всех предшествующих интервалов, включая данный:

, , и т.д.

Если вместо частот использовать частости, то аналогично получим накопленные частости (Sw):

, , и т.д.

Абсолютная плотность распределения – это частота, приходящаяся на единицу длины интервала, т. е. , а относительная плотность распределения – частость, приходящаяся на единицу длины интервала, т. е. . Плотность распределения используется в рядах с неравными интервалами для приведения частот и частостей к сопоставимому виду.
Вариационные ряды в зависимости от характера вариации делят на дискретные и интервальные.
Дискретные вариационные ряды строятся на основе дискретных (прерывных) признаков. Дискретные – это признаки, варианты которых имеют только целые значения и количество их невелико. Интервальные вариационные ряды основаны на непрерывных признаках (т.е. принимающих любые значения, в том числе и дробные) или дискретных, варьирующих в широком диапазоне.

Пример построения дискретного ряда распределения . Стаж работы в годах 10 рабочих бригады характеризуются следующими данными: 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.
Первым шагом в упорядочении первичного ряда является его ранжирование , т.е. расположение всех вариант в возрастающем или убывающем порядке.
Ранжированный ряд: 2, 3, 3, 4, 4, 4, 4, 5, 5, 5.

Таблица 5 – Дискретный вариационный ряд распределения рабочих по стажу работы


Стаж
работы (варианты хi)

Количество рабочих определенного стажа (частота fi)

Частости

Накопленные частоты

Накопленные частости

2
3
4
5

1
2
4
3

(1:10)*100=10
(2:10)*100=20
40
30

1
1+2=3
3+4=7
7+3=10

10
30
70
100

Пример построения интервального ряда . Имеются данные о среднемесячной з/п 30 работников, которая варьируется от 600 до 1200 грн. Построить интервальный ряд распределения.

Таблица 6 – Интервальный вариационный ряд распределения рабочих по размеру среднемесячной заработной платы

Группы рабочих по размеру з/п (интервалы вариант хi)

Количество рабочих (частоты fi)

Частости

Накопленные частоты

Накопленные частости

1) 600-700
2) 700-800
3) 800-900
4) 900-1000
5) 1000-1100
6) 1100-1200

3
6
8
9
3
1

26,7
30
10
3,3

3
3+6=9
9+8=17
26
29
30

10,0
30,0
56,7
86,7
96,7
100,0

Графически ряды распределения можно представить в виде гистограммы, кумуляты, полигона.
Интервальный вариационный ряд изображают в виде гистограммы . Для ее построения в прямоугольной системе координат по оси абсцисс откладывают отрезки, равные длине интервала. Затем на этих отрезках, как на основаниях, строят прямоугольники, высота которых пропорциональна частоте или частости. Для интервального ряда с неравными интервалами по оси ординат откладывают плотность распределения, так как в этом случае именно она дает представление о заполненности интервала. Площадь всей гистограммы численно равна сумме частот.
Пример построения гистограммы.

Если соединить середины каждого интервала отрезками прямой, то получим замкнутую фигуру в виде многоугольника, которая называется полигоном .
Полигон чаще используется для дискретных рядов. Для этого в прямоугольной системе координат строят точки с координатами (x1, f1), (x2, f2), …, (xN, fN), затем последовательно соединяют их отрезками, а из первой и последней точек опускают перпендикуляры на ось х. Полученный многоугольник является полигоном дискретного вариационного ряда.

Кумулята строится по накопленным частотам (или частостям), которые откладывают по оси у, а по оси х – варианты или верхние границы интервалов.

Вторичная группировка

Вторичная группировка - это образование новых групп на ос­нове ранее произведенной группировки. Применяют два способа об­разования новых групп на основе ранее произведенной группировки.

Первый способ состоит в укрупнении первоначальных интерва­лов. Это наиболее простой и распространенный способ.

Второй способ принято называть методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определœенная до­ля единиц совокупности. Рассмотрим два способа на примере.

Имеется группировка сотрудников двух управлений одного из московских банков по размеру месячной заработной платы (цифры условные).

Таблица 3.6

Кредитное управление Валютное управление
№ груп­пы Число работ­ников, чел. № группы Размер зарплаты, руб. в мес. Число работ­ников, чел.
2000 - 2500 2000 - 3000
2500 - 3000 3000 - 5000
3000 - 4000 5000 - 7000
4000 - 5000 7000 и более
5000 и более - -
Итого Итого

Приведенные данные не позволяют сравнить распределœение работников по размеру месячной заработной платы, так как величины интервалов различны, в связи с этим крайне важно привести эти ряды распределœения к сопоставимому виду.

Произведем вторичную группировку, образовав группы с новыми укрупненными интервалами.

Таблица 3.7

При вторичной группировке методом долевой перегруппировки устанавливаем новые интервалы распределœения работников по размеру месячной заработной платы, при этом за каждым интервалов закрепляем определœенную долю единиц совокупности. В нашем примере одну из группировок (по кредитному управлению) оставляем без изменений. А по валютному управлению производим перегруппировку следующим образом. В первой группе с интервалом от 2000 до 3000 руб. частота равна 2. Применительно к группировке по кредитному управлению данный интервал крайне важно разбить на два равных интервала: от 2000 до 2500 руб. и от 2500 до 3000 руб., при этом исходная частота делится поровну. Следующий интервал от 3000 до 5000 руб. соответственно нужно разделить на два равных интервала: от 3000 до 4000 руб. и от 4000 до 5000 руб., при этом исходная частота делит­ся поровну (6:2 = 3). Последние две группы крайне важно объединить в одну с интервалом 5000 руб. и выше.

Таблица 3.8

№ группы Размер зарплаты, руб. в мес. Кредитное число управления работников Валютное число управления работников
чел. в % к ито­гу чел. в % к итогу
2000 - 2500 8,33 3,33
2500 - 3000 16,67 3,33
3000 - 4000 25,00 10,00
4000 - 5000 33,33 10,00
5000 и выше 16,67 73,34
Итого 100,00 100,00

Контрольные вопросы

(выберите правильный ответ)

1. Статистическая сводка включает в себя:

а) только подсчет итогов в данных;

б) группировку данных и подсчет итогов;

в) группировку данных, подсчет итогов и расчет обобщаю­щих показателœей.

2. Группировка, в которой изучается структура совокупности, принято называть:

а) типологической; б) структурной; в) аналитической.

3. Группировочный признак может быть:

а) количественный;

б) качественный;

в) и количественный, и качественный.

4. Величина интервала определяется:

а) верхней границей интервала;

б) нижней границей интервала;

в) разностью верхней и нижней границ.

5. Вариационный ряд распределœения строится:

а) по качественному признаку;

б) по количественному признаку.

6. Частоты - это:

а) абсолютные числа;

б) относительные числа.

7. Частости - это:

а) абсолютные числа;

б) относительные числа.

8. В дискретном вариационном ряду значения признака выражены:

а) в виде чисел;

б) в виде интервалов.

9. Интервальный вариационный ряд графически изображается в виде:

а) полигона распределœения;

б) гистограммы;

в) кумуляты.

10. Вторичная группировка осуществляется методом:

а) уменьшения интервалов;

б) укрупнения интервалов;

в) и уменьшения, и укрупнения интервалов;

г) долевой перегруппировки.

Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА ДАННЫХ.

Задачи сводки и ее содержание

Статистическая сводка - это научно организованная обработка материалов статистического наблюдения. Цель сводки - получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально-экономических явлений.

Статистические сводки различаются по ряду признаков:

    По сложности построения сводка может быть простая и сложная. Если представлять общие итоги по изучаемой совокупности в целом без какой-либо предварительной систематизации собранного материала - это простая сводка .Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему и представление результатов группировки и сводки в виде статистических таблиц.

    По способу разработки сводки делятся нацентрализованные , когда все данные сосредотачиваются в одной организации и сводятся по разработанной методике (используется для обработки материалов единовременных статистических наблюдений). Придецентрализованной обобщение материала осуществляется снизу доверху по иерархической лестнице управления, подвергаясь на каждом из них соответствующей обработке (используется для обработки статистической отчетности).

    По технике выполнения сводка подразделяется на механизированную и ручную.

Таким образом, статистическая сводка это систематизация и группировка цифровых данных, характеристику образованных групп, системой показателей, подсчет соответствующих итогов и представление результатов сводки в виде таблиц, графиков.

Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической печати.

Метод группировки

Исходная информация на стадии сводки систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется статистическая группировка.

Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку.

Особым видом группировки является классификация . Она основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов).

Отличительные черты классификации:

    В основу кладется качественный признак.

    Они стандартны.

    Они устойчивы.

То есть классификация это узаконенная, общепризнанная, нормативная группировка. Классификация является основой группировок.

    Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Они бывают атрибутивные - по качественному признаку и количественные.

Классификация группировочных признаков

По форме выражения

атрибутивные , не имеющие количественного выражения (профессия, образование);

количественные : 1)дискретные (прерывные), значения которых выражаются только целыми числами (количество комнат, детей); 2)непрерывные, значения, которые могут быть как целые, так и дробные.

По характеру колеблемости

альтернативные , которыми одни единицы обладают, а другие нет (качество);

имеющие множество количественных значений

По роли признака во взаимосвязи изучаемых явлений

факторные, воздействуют на другие признаки;

результативные, испытывающие на себе влияние других

Для нахождения числа групп служит формула Стерджесса

п = 1 + 3,322 lgN,

где N-количество элементов совокупности.

Согласно этой формуле, выбор числа групп зависит от объема совокупности.

Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основу группировки, близко к нормальному.

Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (). Он рассчитывается

где - среднее значение признака по совокупности, которое определяется по формуле;

    Е значение варьирующего признака;

    среднее квадратическое отклонение.

Если величина интервала равна 0,5 , то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3 и, то совокупность делится соответственно на 9 и 6 групп.

Если делится на 6 групп, то получаются следующие интервалы:

Эти методы не дают гарантии в том, что не будут сформированы «пустые» или малочисленные группы. «Пустыми» считаются группы, в которые не попала ни одна единица совокупности. Наличие таких интервалов свидетельствует о том, что группировка построена неправильно.

После определения числа групп следует определить интервалы группировки.

Интервал - представляет собой промежуток между максимальным и минимальным значениями признака в группе.

Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами .

Хмах - Хmin

h= ---------------- ;

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения.

Полученную по формуле величину округляют. Она является шагом интервала.

Существуют следующие правила определения шага интервала.

Если величина интервала представляет собой величину, имеющую один знак до запятой (н-р, 0,66; 1,372; 5,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. (0,7; 1,4; 5,8).

Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до

Например, Х max = 180, Х min= 80, п= 5.

h= (Хмах - Хmin) / п;

h= (180 - 80) / 5 = 20;

Следовательно получили следующие интервалы

80-100; 100-120; 120-140; 140-160; 160-180.

б) неравные, когда ширина интервала постепенно увеличивается, а верхний интервал часто незакрыт вовсе. Неравные интервалы в экономической практике используются чаще.

в) открытые, когда имеется только либо верхняя, либо нижняя граница. Необходимость в открытых интервалах обусловлена, разбросом его количественных значений, требующих образования множества групп, если отделять их обеими границами.

г) закрытые , когда есть и нижняя и верхняя граница. Если неделимые единицы, чел., то 1-3, 4-7, 8-11. При непрерывном изменении признака одно и то же число служит верхней и нижней границами двух смежных групп (90-120, 120-150, 150-180).

При таком построении интервалов вопрос об отнесении единиц объекта наблюдения по группам в практике решается двояко: по принципу «включительно» и «исключительно».

Применение зависит от формы написания интервалов, особенно первой и последней групп.

    180 и более - исключительно - 180 входит в последний

    свыше 180 - включительно - 180 входит в предыдущий.

В практике встречаются оба, но предпочтение отдается принципу «исключительно».

Серединное значение интервалов определяется несколькими приемами.

    Суммируем верхнюю и нижнюю границу интервала и делим на 2.

    Середина 2-го интервала плюс величина интервала.

    Середина 2-го интервала минус величина интервала (для открытого).

    К середине предпоследнего интервала прибавляем величину интервала (для открытых).

Виды статистических группировок

    Типологическая группировка. Суть: Выделение из множества признаков, характеризующих изучаемые явления, основных типов в качественно однородные. Еслиатрибутивный признак , то число групп определяется свойствами изучаемого явления. Например, группировка населения по половозрастному признаку, численность по годам, ППП, в том числе рабочие, ученики, ИТР, служащие, МОП. Выделение типов на основеколичественного признака состоит в определении групп с учетом значений изучаемых признаков. Пример: ясельный 0-2; дошкольный 3-6; школьный 7-17; трудоспособный 16-54 для женщин и 16-59 для мужчин.

Типологические группировки широко применяются в исследовании социально-экономических явлений и процессов.

Группировка по формам собственности в 1998 г.

    Структурная группировка. Это группировки, используемые для изучения строения изучаемой совокупности. В большинстве своем структурные группировки производятся на основе образования качественно однородных групп. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания, состав предприятий по численности занятых, стоимости основных фондов.

Группировка населения России по месту проживания

за 1959-1994 гг.

    Аналитическая группировка(факторная). Она используется для изучения связи между отдельными признаками. Например, между стажем работы и квалификацией, разрядом рабочего и образованием. Особенности аналитической группировки: во-первых, в основу кладется факторный признак; во-вторых, каждая выделенная группа характеризуется средними значениями результативного признака.

Группировка коммерческих банков России по сумме активов баланса

Группа банков по сумме активов баланса, млн. руб.

Количество банков, единиц

В среднем на один банк

численность занятых, чел.

Балансовая прибыль, млрд.руб.

50000 и более

    Комбинированная группировка. Это образование групп по двум и более признакам, взятым в определенном сочетании. При этом атрибутивные признаки располагаются вначале в определенной последовательности, исходя из логики взаимосвязи показателей. Пример, образованы группы по формам хозяйствования они разделены на подгруппы по уровню рентабельности или по производительности труда, фондоотдачи.

В зависимости от числа положенных в их основание признаков делят на:

Простая - это группировка, выполненная по одному признаку.

Сложная группировка производится по двум и более признакам

Вторичная группировка

Вторичной группировкой называется перегруппировка уже сгруппированного материала.

К ней прибегают:

    Когда из большого числа первоначально образованных групп надо получить меньшее число более крупных.

    Когда в целях сравнения нужно привести в сопоставимый вид по-разному сгруппированный материал.

Статистические ряды распределения

Среди простых группировок особо выделяют ряды распределения.

Ряды распределения представляют собой упорядочное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Ряды распределения, образованные по качественным признакам называют атрибутивными.

При группировке ряда по количественному признаку получаются вариационные ряды.

Вариационные ряды бывают дискретные (прерывные) и интервальные (непрерывные).

Вариационные ряды состоят из двух элементов: варианты и частоты.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота это численность отдельных вариант или каждой группы вариационного ряда.

Частоты, выраженные в долях единицы или в % к итогу, называютсячастостями. Сумма частот составляет объем ряда распределения.

Например, по атрибутивному признаку.

Например, дискретный ряд.

Количество студентов

В % к итогу

Характер распределения в дискретных рядах изображается графически в виде полигона распределения.

Пример интервального ряда.

Распределение рабочих по выработке

Выработка, т.р.

Число рабочих

Кумулятивная(накопленная) численность

Интервальный ряд распределения графически изображается в виде гистограммы.

В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.

Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат - нарастающие итоги частот (кумулята) или частостей (огива), соответствующих этим значениям признака.

Одним из важнейших требований, предъявляемых к статистическим рядам распределения, является обеспечение сравнимости их во времени и пространстве . Вариационные ряды с равными интервалами обеспечивают это условие.

Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения , т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.

Группы магазинов по размеру товарооборота, т.р.

Число магазинов

Величина интервала, т.р.

Плотность распределения, ед. (1:2)

Сравнение частот отдельных групп показывает, что чаще всего встречаются магазины с интервалом 250-450 т.р.

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

Статистические таблицы

Результаты сводки и группировки материалов наблюдений представляют в виде статистических таблиц. Они позволяют изложить материал наиболее удобно, компактно, наглядно и рационально.

В статистических таблицах различают подлежащее и сказуемое. Подлежащим -является тот объект, о котором идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым в таблице называют показатели, с помощью которых изучается объект, т.е. подлежащее.

Статистические таблицы могут быть простыми и сложными.

К простым относятся перечневые таблицы, в которых подлежащим служит перечень отдельных объектов.

В сложных таблицах подлежащее представляет собой совокупность, расчлененную на группы по одному или нескольким признакам.

Таблицы, в подлежащем которых имеет место группировка по одному признаку, именуют групповыми.

При наличии в подлежащем группировки по двум и более признакам таблица именуется комбинационной.

К числу сложных таблиц относят и корреляционные и балансовые таблицы.

Деление таблиц на простые, групповые и комбинационные основано на степени расчленения подлежащего. Однако и сказуемое может быть представлено по-разному.

Если все показатели сказуемого характеризуют подлежащее отдельно, независимо друг от друга, то такая разработка сказуемого называется простой. Если же в сказуемом один признак комбинируется с другим, то такая разработка сказуемого называетсясложной.

Впервые статистические таблицы были применены при изложении статистических данных в 1727 г. в России И.К. Кириловым в работе «Цветущее состояние Всероссийского государства»

Применение комбинационных таблиц относятся к более позднему периоду (1882).

К техническим моментам при составлении таблиц относятся:

    Четкость заголовков.

    Указываются единицы измерения в отдельных графах.

    Повторяющиеся термины выносятся в общие заголовки.

    Графы и строки необходимо нумеровать.

    В групповых и комбинационных таблицах всегда надо давать итоговые графы и строки.

    Округление чисел проводится с одинаковой точностью. Когда одна величина превосходит другую многократно, то полученные показатели динамики лучше выражать не в % , а в разах. Например, вместо 586%, следует в 5,9 раз больше.

    В аналитических таблицах значимость абсолютных цифр должна быть наименьшей. Когда интересами исследования предусмотрены многозначные числа, то начиная справа следует выделять миллионы, тыс.ед. Например, 1458946 р., 1 458 946 р. или можно округлять до 2-3 знаков 1,46 млн.р.

    Когда в таблице наряду с отчетными данными приводятся сведения расчетного порядка, то делаются оговорки в виде сносок.

    При неполном объеме изучаемой совокупности или отсутствии исходных данных все слагаемые сначала показывают в строке « общие итоги», а потом после пояснения в строке «в том числе» перечисляются наиболее важные их составные части.

    Отдельные клетки могут быть не заполнены по следующим причинам:

а) «х» - клетка вообще не подлежит заполнению;

б) «...» - отсутствуют сведения;

в) «-» - отсутствует само явление;

г) 0,0 - то при округлении с большей точностью может появиться значащая цифра.

Статистические графики

Статистический график - это чертеж, на котором при помощи условных геометрических фигур (линий, точек, символов) изображаются статистические данные.

Основоположником графического метода в статистике считают английского экономиста У.Плейфейра (1731-1798 г.) . В его работе «Коммерческий и политический атлас» (1786г.) впервые были применены способы графического изображения статистических данных (линейные, столбиковые, секторные и др.диаграммы).

Основные элементы графика включают в себя:

    Поле графика - это место, на котором он выполняется. Принято считать, что наиболее оптимальным для зрительного восприятия является график, выполненный на поле прямоугольной формы с соотношением сторон от 1:1,3 до 1:1,5 (правило «золотого сечения»). Иногда используется и поле в виде квадрата.

    Графический образ - это символические знаки, с помощью которых изображаются статистические данные.

    Пространственные и масштабные ориентиры. Пространственные ориентиры определяют размещение графических образов на поле графика. Они задаются координатной сеткой или контурными линиями. Масштабные ориентиры - придают графическим образам количественную значимость, которая передается с помощью системы масштабных шкал.

    Экспликация графика - это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа.

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения. Рассмотрим приемы вторичной группировки на примере.

Пример 1.

Произвести укрупнение интервалов на основе данных таблицы 2.7.:

Таблица 2.7.

Число магазинов

Приведенная группировка недостаточно наглядна, потому что не показывает четкой и строгой закономерности в изменении товарооборота по группам.

Уплотним ряды распределения, образовав шесть групп. Новые группы образованы путем суммирования первоначальных групп (табл. 2.8.).

Таблица 2.8.

Группы магазинов по размеру товарооборота за IV квартал, тыс.руб.

Число магазинов

Товарооборот за IV квартал, тыс.руб.

Товарооборот в среднем на 1 магазин, тыс.руб.

Совершенно четко видно, чем крупнее магазины, тем выше уровень товарооборота.

Пример 2.

Имеются следующие данные о распределении колхозов по числу дворов (табл. 2.9.).

Таблица 2.9.

Удельный вес колхозов группы в процентах к итогу

Группы колхозов по числу дворов

Эти данные не позволяют провести сравнение распределения колхозов в 2-х районах по числу дворов, так как в этих районах имеется различное число групп колхозов. Необходимо ряды распределения привести к сопоставимому виду.

За основу сравнения необходимо взять распределение колхозов 1 района. Следовательно, по второму району надо произвести вторичную группировку, чтобы образовать такое же число групп и с теми же интервалами, как и в первом районе. Получим следующие данные (табл.2.10.).

Таблица 2.10.

Группы колхозов по числу дворов

Удельный вес колхозов группы в % к итогу

21-7=14, 14+23=37

Для определения числа колхозов, которые надо взять из пятой группы во вновь образованную, условно примем, что это число колхозов должно быть пропорционально удельному весу отобранных дворов в группе.

Определяем удельный вес 50 дворов в пятой группе.

(50 * 18) / (250 - 150) = 9

Определяем удельный вес 50 дворов в шестой группе.

(50 * 21) / (400 - 250) = 7 и т.д.

Распределение совокупности на группы, однородные в том или ином отношении, связано с такими действиями, как систематиза­ция, типология, классификация, группировка. Традиционно такое распределение выполняют по следующей схеме: из множества признаков, описывающих явление, выбирают группировочные, а затем совокупность делят на группы и подгруппы в соответствии со значениями этих признаков.

В каждом конкретном исследовании решаются три вопроса:

1) что взять за основу группировки;

2) сколько групп, позиций необходимо выделить;

3) как разделить группы.

Основой группировки может быть любой атрибутивный или ко­личественный признак, имеющий градации.

Промежуток изменений (область существования) признака статистической совокупности

(R=хmах - xmin)

принято называть размахом вариации. Совокупность значений признака статисти­ческой совокупности, принадлежащих отдельному промежутку, принято называть группой Ориентировочно оптимальное коли­чество групп определяется формулой, рекомендованной амери­канским статистиком Стерджессом:

K=1+3.322LgN

где К - число групп (интервалов); N - объем статистической со­вокупности.

Формула Стерджесса пригодна при условии, что рас­пределение единиц совокупности по данному признаку приближа­ется к нормальному, и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления (процесса).

Интервалы представляют собой каркас группировки. На прак­тике их образовывают, придерживаясь трех формальных при­нципов: равности интервалов, кратности интервалов, равности частот. Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше ин­тервал, и наоборот. Количество групп зависит от числа единиц обследуемого объекта и степени колеблемости группировочного признака.

Интервалы могут быть равные и неравные . Неравные интер­валы используются, если диапазон вариации признака слишком широкий и распределение значений неравномерно. Формируются они на основе принципа кратности, когда ширина каждого последу­ющего интервала в к раз больше (меньше) предыдущего. Равные интервалы целесообразно применять в тех случаях, когда вариа­ция проявляется в сравнительно узких границах и распределение является практически равномерным. Для группировок с равными интервалами величина интервала

Сравнимость статистических группировок. Вторичная группировка

Иногда возникает необходимость проведения вторичных группировок - образования новых групп на основе ранее осу­ществленной группировки. Такая необходимость может возник­нуть, если имеющиеся группировки не удовлетворяют требова­ниям проводимого анализа (несопоставимы из-за разного числа выделенных групп или неодинаковых границ интервалов). Полу­чение новых групп на основе имеющихся возможно двумя спосо­бами перегруппировки: объединением первоначальных интерва­лов (путем их укрупнения) и долевой перегруппировки (на основе закрепления за каждой группой определенной доли единиц сово­купности).

Пример:

Таблица 2 – Распределение сотрудников предприятия ив уровню дохода

Произведем перегруппировку данных, образовав новые труппы с интервалами до5, 5-10,10-20,20-30, свыше 30 тыс. руб. В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 5 тыс. руб., необходимо от интервала группы взять 1,0 тыс. руб. Величина интервала этой группы составляет 6,0 тыс. руб. Следовательно, необходимо взять от нее 1/6 (1,0:6,0) часть. Аналогичную же часть надо взять от числа работников, т.е. . В первой группе число работающих: 16+3=20 человек. Вторую новую группу образуют работающие второй группы за вычетом отнесенных к первой, то есть 20-3=17-чел. Во вновь образованную третью группу войдут все со­трудники третьей группы и часть сотрудников, четвертой. Для определения этой части от интервала 18-30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 2,0 тыс. руб.). Следовательно, необходимо, взять часть интервала, равную . В этой группе 74 человека, значит надо взять 74х(1:6)=12 чел. В новую третью группу войдут 44+12 = 56 чел. Во вновь образованную четвертую группу войдут 74-12= 62 чел., оставшихся от прежней четвертой группы. Пятую вновь образованную группу составят работающие пятой и шестой прежних групп: 37+9 = 46 чел. В результате получим следующие новые группы:

Таблица 3 – Новая группировка

4 Закрепление знаний _______

1 В чем заключается процесс группировки

2 Перечислите и охарактеризуйте основные виды группировок

3 Интервал. Виды и формула

4 Формула Стерджесса

5 Перегруппировка

5 Выдача домашнего задания ______

Повторить пройденный материал

Подведение итогов занятия


План занятия №(7) 4

по учебной дисциплине «Статистика»

Группа Дата
Э2-1
Зм2-5

Тема занятия Проведение сводки статистических данных. Группировка и перегруппировка данных

Метод группировок.

Тип занятия урок совершенствования знаний

Вид занятия урок-практическая работа №1

Дидактические цели

Образовательные

знают понятие группировки, виды, цели и задачи, порядок проведения группировки, умеют проводить группировку, перегруппировку статистических данных

Развивающие

классифицируют различные виды группировок, формулируют выводы по результатам проведенной группировки

Воспитывающие

содействуют формированию профессиональной культуры.

Межпредметные связи:

Обеспечивающие дисциплины: АФХД

Обеспечиваемые дисциплины: математика

Методы обучения: практического обучения

Методическое обеспечение занятия: раздаточный материал

Литература:

1 Н.В. Толстик Статистика

2 Е.М. Ефимова Статистика

ХОД УЧЕБНОГО ЗАНЯТИЯ

Организационный момент

Работа с журналом, рапортичкой, проверка готовности группы к уроку

Изучение нового материала

1 Группировка - это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединения изучаемых единиц в частные совокупности по существенным для них признакам.

Признаки, по которым производится распределение единиц наблюдаемой совокупности на группы, называютсягруппировочными признаками.

Классификация группировок:

Структурная группировка характеризует состав однород­ной совокупности по определенным признакам. Например, состав населения региона по месту проживания, по размеру среднедушевого дохода, группировка хозяйств по объему выпущенной продук­ции, структура депозитов по срокам их привлечения.

Типологическая группировка - это распределение качес­твенно неоднородных совокупностей на классы, социально-эко­номические типы, однородные группы. Примером может служить группировка сек­торов экономики, хозяйствующих субъектов по формам собственности: государственная, федеральная, муниципальная, частная, смешанная.

Аналитические группировки предназначены для выявления зависимости между признаками.

Основой группировки может быть любой атрибутивный или ко­личественный признак.

Совокупность значений признака статисти­ческой совокупности, принадлежащих отдельному промежутку, принято называть группой. Ориентировочно оптимальное коли­чество групп определяется формулой, рекомендованной амери­канским статистиком Стерджессом:

K=1+3.322LgN (1)

где К - число групп (интервалов);

N - объем статистической со­вокупности.

Интервалы представляют собой каркас группировки. Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше ин­тервал, и наоборот. Количество групп зависит от числа единиц обследуемого объекта и степени колеблемости группировочного признака.

Интервалы групп могут быть закрытыми (когда указана ниж­няя и верхняя границы) и открытыми (когда указана только одна граница - верхняя или нижняя).

где х min , max – минимальное и максимальное значение признака

n – число групп

h – щаг интервала

Задача 1

Произведите группировку 30 магазинов одного из регионов РФ на 1.01.05, применяя метод группировок.

Таблица 1 – Исходные данные

Среднесписочная численность, чел. Товарооборот, млн. руб.

Решение :

Вкачестве группировочного признака выбираем товарооборот.

Теперь необходимо образовать 4 группы с равными интервалами. Величина интервала определяется по формуле:

где h - шаг интервала

n - число групп

Обозначим границы групп:

2100-7350 – 1-ая группа (2100+5250)

7350-12600 – 2-я группа (7350+5250)

12600-17850 – 3-ая группа (17850+5250)

17850-23100 – 4-ая группа (17850+5250)

После того, как определено число групп и группировочный признак, необходимо определить показатели, которые характеризуют группы и их величины. Показатели разноситься по группам и подсчитываются итоги.

Таблица 2 – Группировка магазинов по величине товарооборота

Таблица 3 – Группировка магазинов по величине товарооборота (% к итогу)

Вывод : из таблицы 3 видно, что преобладает группа с товарооборотом в интервале 2100-7350 – 60%.

Провести группировку коммерческих банков одного из регионов РФ на 1.01.06

Таблица 4 – Исходные данные

Номер банка Капитал Рабочие активы Уставный капитал
207,7 2,48 1,14
200,3 2,40 1,10
190,2 2,28 1,05
323,0 3,88 1,88
247,1 2,96 1,36
177,7 2,12 0,97
242,5 2,90 1,33
182,9 2,18 0,99
315,6 3,78 1,73
183,2 2,20 1,01
320,2 3,84 1,76
207,3 2,48 1,14
181,0 2,17 0,99
172,4 2,06 0,94
234,3 2,81 1,29
189,5 2,27 1,04
187,7 2,24 1,03
166,9 1,99 0,91
157,7 1,88 0,86
168,3 2,02 0,93
224,4 2,69 1,23
166,5 1,99 0,91
198,5 2,38 1,09
240,4 2,88 1,32
229,3 2,75 1,26
175,2 2,10 0,96
156,8 1,87 0,86
160,1 1,92 0,88
178,7 2,14 0,98
171,6 2,05 0,94

Решение:

В качестве группировочного признака возьмем капитал банка.

Образуем четыре группы банков с разными интервалами. Величину интервала определяем по формуле:

где h - шаг интервала

х max , x min – минимальное и максимальное значение группировочного признака

n - число групп

Теперь обозначим границы групп:

1 – я группа 156,0-197,8
2 – я группа 1297,8-239,6
3 – я группа 239,6-281,4
4 – я группа 281,4-323,2

После того, как определен группировочный признак – капитал, шаг интервала и образованы группы, мы определим показатели, которые характеризуют группы и их величины по каждой группе.

Таблица 5 –– Группировка коммерческих банков по величине капитала

Группы банков по величине капитала Число банков Капитал Активы Работающие активы
156,0-197,8 2699,5 35,48 16,25
197,8-239,6 1501,8 17,99 8,25
239,6-281,4 730,0 8,74 4,01
281,4-323,2 958,8 11,5 5,37
Итого 6157,1 73,71 33,88

Структурная группировка коммерческих банков будет иметь вид:

Таблица 6 – Группировка коммерческих банков по величине каритала (% к итогу)

Группы банков по величине капитала Число банков, % к итогу Капитал,% к итогу Активы, % к итогу Работающие активы, % к итогу
156,0-197,8 56,7 48,2 48,1 48,0
197,8-239,6 23,3 24,4 24,4 24,3
239,6-281,4 10,0 11,9 11,9 11,8
281,4-323,2 10,0 15,5 15,6 15,9
Итого

Вывод:

Из таблицы 6 видно, что в основном преобладают мелкие банки – 56,7 %, на их долю приходится 48,2% капитала. Крупные и средние банки занимают по 10%, доля их капитала составила 15,5 и 11,9 % соответственно.

Закрепление знаний

1 В чем состоит значение метода группировок в анализе статистических данных?

2 Что представляет собой группировка?

3 Виды группировок

4 Охарактеризуйте каждый вид группировки

5 Понятие интервала

6 Виды интервалов

7 Формула интервала

4 Выдача домашнего задания

Записать в тетрадь примеры количественных и качественных признаков, которые могут быть положены в основание группировки для предприятия (3-5 примеров)

Доделать практическую работу



Загрузка...