Практическое занятие 1
ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛЕНИЯ
Вариационным рядом или рядом распределения называют упорядоченное распределение единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.
Существует 3 вида ряда распределения:
1) ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака; если численность единиц совокупности достаточно велика ранжированный ряд становится громоздким, и в таких случаях ряд распределения строится с помощью группировки единиц совокупности по значениям изучаемого признака (если признак принимает небольшое число значений, то строится дискретный ряд, а в противном случае – интервальный ряд);
2) дискретный ряд – это таблица, состоящая из двух столбцов (строк) – конкретных значений варьирующего признака X i и числа единиц совокупности с данным значением признака f i – частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака;
3) интервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака X i и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).
Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой латинского алфавита f . Общая сумма частот вариационного ряда равна объему данной совокупности, т. е.
где k – число групп, n – общее число наблюдений, или объем совокупности.
Частоты (веса) выражают не только абсолютными, но и относительными числами – в долях единицы или в процентах от общей численности вариант, составляющих данную совокупность. В таких случаях веса называют относительными частотами или частостями. Общая сумма частностей равна единице
или
,
если частоты выражены в процентах от общего числа наблюдений п. Замена частот частостями не обязательна, но иногда оказывается полезной и даже необходимой в тех случаях, когда приходится сопоставлять друг с другом вариационные ряды, сильно отличающиеся по их объемам.
В зависимости от того, как варьирует признак – дискретно или непрерывно, в широком или узком диапазоне, – статистическая совокупность распределяется в безынтервальный или интервальный вариационные ряды. В первом случае частоты относятся непосредственно к ранжированным значениям признака, которые приобретают положение отдельных групп или классов вариационного ряда, во втором – подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам (от – до), на которые разбивается общая вариация признака в пределах от минимальной до максимальной варианты данной совокупности. Эти промежутки, или классовые интервалы, могут быть равными и не равными по ширине. Отсюда различают равно- и неравноинтервальные вариационные ряды. В неравноинтервальных рядах характер распределения частот меняется по мере изменения ширины классовых интервалов. Неравноинтервальную группировку в биологии применяют сравнительно редко. Как правило, биометрические данные распределяются в равноинтервальные ряды, что позволяет не только выявлять закономерность варьирования, но и облегчает вычисление сводных числовых характеристик вариационного ряда, сопоставление рядов распределения друг с другом.
Приступая к построению равноинтервального вариационного ряда, важно правильно наметить ширину классового интервала. Дело в том, что грубая группировка (когда устанавливают очень широкие классовые интервалы) искажает типичные черты варьирования и ведет к снижению точности числовых характеристик ряда. При выборе чрезмерно узких интервалов точность обобщающих числовых характеристик повышается, но ряд получается слишком растянутым и не дает четкой картины варьирования.
Для получения хорошо обозримого вариационного ряда и обеспечения достаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака (в пределах от минимальной до максимальной варианты) на такое число групп или классов, которое удовлетворяло бы обоим требованиям. Эту задачу решают делением размаха варьирования признака на число групп или классов, намечаемых при построении вариационного ряда:
,
где h – величина интервала; X м a x и X min – максимальное и минимальное значения в совокупности; k – число групп.
При построении
интервального ряда распределения
необходимо выбирать оптимальное число
групп (интервалов признака) и установливать
длину (размах) интервала. Поскольку при
анализе ряда распределения сравнивают
частоты в разных интервалах, необходимо,
чтобы длина интервалов была постоянной.
Если приходится иметь дело с интервальным
рядом распределения с неравными
интервалами, то для сопоставимости
нужно частоты или частости привести к
единице интервала, полученное значение
называется плотностью
ρ
,
то есть
.
Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.
Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:
где n – численность совокупности.
Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс, – это интервалы значений варьирующего признака, а высоты столбиков – частоты, соответствующие масштабу по оси ординат. Диаграмма такого типа называется гистограммой.
Если имеется дискретный ряд распределения или используются середины интервалов, то графическое изображение такого ряда называется полигоном , которое получается соединением прямыми точек с координатами X i и f i .
Если по оси абсцисс откладывать значения классов, а по оси ординат – накопленные частоты с последующим соединением точек прямыми линиями, получается график, называемый кумулятой. Накопленные частоты находят последовательным суммированием, или кумуляцией частот в направлении от первого класса до конца вариационного ряда.
Пример . Имеются данные о яйценоскости 50 кур-несушек за 1 год, содержащихся на птицеферме (табл. 1.1).
Т а б л и ц а 1.1
Яйценоскость кур-несушек
№ курицы-несушки |
Яйценоскость, шт. |
№ курицы-несушки |
Яйценоскость, шт. |
№ курицы-несушки |
Яйценоскость, шт. |
№ курицы-несушки |
Яйценоскость, шт. |
№ курицы-несушки |
Яйценоскость, шт. |
Требуется построить интервальный ряд распределения и отобразить его графически в виде гистограммы, полигона и кумуляты.
Видно, что признак варьирует от 212 до 245 яиц, полученных от несушки за 1 год.
В нашем примере по формуле Стерждесса определим число групп:
k = 1 + 3,322lg 50 = 6,643 ≈ 7.
Рассчитаем длину (размах) интервала по формуле:
.
Построим интервальный ряд с 7 группами и интервалом 5 шт. яиц (табл. 1.2). Для построения графиков в таблице рассчитаем середину интервалов и накопленную частоту.
Т а б л и ц а 1.2
Интервальный ряд распределения яйценоскости
Группа кур-несушек по величине яйценоскости X i |
Число кур-несушек f i |
Середина интервала Х i ’ |
Накопленная частота f i ’ |
|
Построим гистограмму распределения яйценоскости (рис. 1.1).
Р и с. 1.1. Гистограмма распределения яйценоскости
Данные гистограммы показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже – крайние (малые и большие) значения признака. Форма этого распределения близка к нормальному закону распределения, которое образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего значения.
Полигон и кумулята распределения яйценоскости имеют вид (рис. 1.2 и 1.3).
Р и с. 1.2. Полигон распределения яйценоскости
Р и с. 1.3. Кумулята распределения яйценоскости
Технология решения задачи в табличном процессоре Microsoft Excel следующая.
1. Введите исходные данные в соответствии с рис. 1.4.
2. Ранжируйте ряд.
2.1. Выделите ячейки А2:А51.
2.2. Щелкните левой кнопкой мыши на панели инструментов на кнопке <Сортировка по возрастанию > .
3. Определите величину интервала для построения интервального ряд распределения.
3.1. Скопируйте ячейку А2 в ячейку Е53.
3.2. Скопируйте ячейку А51 в ячейку Е54.
3.3. Рассчитайте размах вариации. Для этого введите в ячейку Е55 формулу =E54-E53 .
3.4. Рассчитайте число групп вариации. Для этого введите в ячейку Е56 формулу =1+3,322*LOG10(50) .
3.5. Введите в ячейку Е57 округленное число групп.
3.6. Рассчитайте длину интервала. Для этого введите в ячейку Е58 формулу =E55/E57 .
3.7. Введите в ячейку Е59 округленную длину интервала.
4. Постройте интервальный ряд.
4.1. Скопируйте ячейку Е53 в ячейку В64.
4.2. Введите в ячейку В65 формулу =B64+$E$59 .
4.3. Скопируйте ячейку В65 в ячейки В66:В70.
4.4. Введите в ячейку С64 формулу =B65 .
4.5. Введите в ячейку С65 формулу =C64+$E$59 .
4.6. Скопируйте ячейку С65 в ячейки С66:С70.
Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.5).
5. Рассчитайте частоту интервалов.
5.1. Выполните команду Сервис , Анализ данных , щелкнув поочередно левой кнопкой мыши.
5.2. В диалоговом окне Анализ данных с помощью левой кнопки мыши установите: Инструменты анализа <Гистограмма> (рис. 1.6).
5.3. Щелкните левой кнопкой мыши на кнопке <ОК>.
5.4. На вкладке Гистограмма установите параметры в соответствии с рис. 1.7.
5.5. Щелкните левой кнопкой мыши на кнопке <ОК>.
Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.8).
6. Заполните таблицу «Интервальный ряд распределения».
6.1. Скопируйте ячейки В74:В80 в ячейки D64:D70.
6.2. Рассчитайте сумму частот. Для этого выделите ячейки D64:D70 и щелкните левой кнопкой мыши на панели инструментов на кнопке <Автосумма > .
6.3. Рассчитайте середину интервалов. Для этого введете в ячейку Е64 формулу =(B64+C64)/2 и скопируйте в ячейки Е65:Е70.
6.4. Рассчитайте накопленные частоты. Для этого скопируйте ячейку D64 в ячейку F64. В ячейку F65 введите формулу =F64+D65 и скопируйте в ячейки F66:F70.
Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.9).
7. Отредактируйте гистограмму.
7.1. Щелкните правой кнопкой мыши на диаграмме на названии «карман» и на появившейся вкладке нажмите кнопку <Очистить>.
7.2. Щелкните правой кнопкой мыши на диаграмме и на появившейся вкладке нажмите кнопку <Исходные данные>.
7.3. В диалоговом окне Исходные данные измените подписи оси Х. Для этого выделите ячейки В64:С70 (рис. 1.10).
7.5.
Нажмите
клавишу
Результаты выводятся на экран дисплея в следующем виде (рис. 1.11).
8. Постройте полигон распределения яйценоскости.
8.1. Щелкните левой кнопкой мыши на панели инструментов на кнопке <Мастер диаграмм > .
8.2. В диалоговом окне Мастер диаграмм (шаг 1 из 4) с помощью левой кнопки мыши установите: Стандартные <График> (рис. 1.12).
8.3. Щелкните левой кнопкой мыши на кнопке <Далее>.
8.4. В диалоговом окне Мастер диаграмм (шаг 2 из 4) установите параметры в соответствии с рис. 1.13.
8.5. Щелкните левой кнопкой мыши на кнопке <Далее>.
8.6. В диалоговом окне Мастер диаграмм (шаг 3 из 4) введите названия диаграммы и ос Y (рис. 1.14).
8.7. Щелкните левой кнопкой мыши на кнопке <Далее>.
8.8. В диалоговом окне Мастер диаграмм (шаг 4 из 4) установите параметры в соответствии с рис. 1.15.
8.9. Щелкните левой кнопкой мыши на кнопке <Готово>.
Результаты выводятся на экран дисплея в следующем виде (рис. 1.16).
9. Вставьте на графике подписи данных.
9.1. Щелкните правой кнопкой мыши на диаграмме и на появившейся вкладке нажмите кнопку <Исходные данные>.
9.2. В диалоговом окне Исходные данные измените подписи оси Х. Для этого выделите ячейки Е64:Е70 (рис. 1.17).
9.3.
Нажмите
клавишу
Результаты выводятся на экран дисплея в следующем виде (рис. 1.18).
Кумулята распределения строится аналогично полигону распределения на основе накопленных частот.
Абсолютный уровень ряда-величины (уровни), из которых состоит динамический ряд(отражают
явления на определенный момент или интервал времени))
Абсолютный прирост представляет собой разность между последующим и предыдущим уровнем.
Темп роста - это отношение последующего уровня к предыдущему, умноженное на 100%.
Темп прироста является отношением абсолютного прироста (снижения) к предыдущему уровню, умноженным на 100%.
Значение 1% прироста определяется отношением абсолютного прироста к темпу прироста.
Показатель наглядности (показывает отношение каждого уровня ряда к одному из них, чаще начальному, принятому за 100%).
Вариационный ряд - ряд однородных статистических величин, характеризующих один и тот же количественный учетный признак, отличающихся друг от друга по своей величине и расположенных в определенном порядке (убывания или возрастания).
Элементы вариационного ряда:
а) варианта - v - числовое значение изучаемого меняющегося количественного признака.
б) частота - p или f - повторяемость вариант в вариационном ряду, показывающая, как часто встречается та или иная варианта в составе данного ряда.
в) общее число наблюдений- n - сумма всех частот: n=ΣΡ. Если общее число наблюдений более 30,статистическая выборка считается большой , если n меньше или равно 30 - малой .
Вариационные ряды бывают:
в зависимости от частоты встречаемости признака:
а) простой - ряд - каждая варианта встречается один раз, т.е. частоты равны единице.
б) обычный - ряд, в котором варианты встречаются более одного раза.
в) сгруппированный - ряд, в котором варианты объединены в группы по их величине в пределах определенного интервала с указанием частоты повторяемости всех вариант, входящих в группу.
Сгруппированный вариационный ряд используют при большом числе наблюдений и большом размахе крайних значений вариант.
Обработка вариационного ряда заключается в получении параметров вариационного ряда (средней величины, среднего квадратического отклонения и средней ошибки средней величины).
3. в зависимости от числа наблюдений:
а) четные и нечетные
б) большой (при числе наблюдений больше 30) и малый (если число наблюдений меньше или равно 30)
Средние величины дают обобщающую характеристику статистической совокупности по определенному изменяющемуся количественному признаку. Средняя величина характеризует весь ряд наблюдений одним числом , выражающим общую меру изучаемого признака. Она нивелирует случайные отклонения отдельных наблюдений и дает типичную характеристику количественного признака.
Требования к средним величинам:
1) качественная однородность совокупности, для которой рассчитывается средняя величина - только тогда она будет объективно отображать характерные особенности изучаемого явления.
2) средняя величина должна основываться на массовом обобщении изучаемого признака, т.к. только тогда она выражает типичные размеры признака
Средние величины получаются из рядов распределения (вариационных рядов).
Виды средних величин:
а) мода (Мо) - величина признака, чаще других встречающаяся в совокупности. За моду принимают варианту, которой соответствует наибольшее количество частот вариационного ряда.
б) Медиана (Me) - величина признака, занимающая срединное значение в вариационном ряду. Она делит вариационный ряд на две равные части.
На величину моды и медианы не оказывают влияния числовые значения крайних вариант, имеющихся в вариационном ряду. Они не всегда могут точно характеризовать вариационный ряд и применяются в медицинской статистике относительно редко. Более точно характеризует вариационный ряд средняя арифметическая величина.
в) Средняя арифметическая (М, или ) - рассчитывается на основе всех числовых значений изучаемого признака.
Реже применяются другие средние величины: средняя геометрическая (при обработке результатов титрования антител, токсинов, вакцин); средняя квадратическая (при определении среднего диаметра среза клеток, результатов накожных иммунологических проб); средняя кубическая (для определения среднего объема опухолей) и другие.
В простом вариационном
ряду, где варианты встречаются только
по одному разу, вычисляется средняя
арифметическая простая по формуле:
где
V
- числовые значения вариант, n - число
наблюдений,
В обычном вариационном
ряду вычисляется средняя арифметическая
взвешенная по формуле:
Где V - числовые значения вариант, р - частота встречаемости вариант, n - число наблюдений.
Одинаковые по величине средние могут быть получены из рядов с различной степенью рассеяния, поэтому для характеристики вариационного ряда, помимо средней величины, необходима другая характеристика, позволяющая оценить степень его колеблемости.
Простыми показателями, характеризующими разнообразие признака в изучаемой совокупности, являются
а) лимит - минимальное и максимальное значение количественного признака
б) амплитуда - разность между наибольшим и наименьшим значением вариант.
Применение средних величин:
а) для характеристики физического развития (рост, вес, окружность груди, динамометрия)
б) для оценки состояния здоровья человека путем анализа физиологических, биохимических параметров организма (уровня АД, ЧСС, температуры тела)
в) для анализа деятельности медицинских организаций (среднее число дней работы койки в году и т.д.)
г) для оценки работы врачей (среднее число посещений на одного врача, среднее число хирургических операций, среднечасовая нагрузка врача на приеме в поликлинике)
Наличие общего признака является основой для образования статистической совокупности, которая представляет собой результаты описания или измерения общих признаков объектов исследования.
Предметом изучения в статистике являются изменяющиеся (варьирующие) признаки или статистические признаками.
Виды статистических признаков .
Атрибутивными называют ряды распределения
, построенные по качественным признакам. Атрибутивный
– это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).
Ряд распределения принято оформлять в виде таблиц. В табл. 2.8 приведён атрибутивный ряд распределения.
Таблица 2.8 - Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды
.
Пример дискретного вариационного ряда приведен в табл. 2.9.
Таблица 2.9 - Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ.
Таблица 1. Общий вид дискретного вариационного ряда частот
Значения признака | x i | x 1 | x 2 | … | x n |
Частоты | m i | m 1 | m 2 | … | m n |
Таблица 2. Общий вид интервального вариационного ряда частот
Таблица 3. Графические изображения вариационного ряда
Ряд | Полигон или гистограмма | Эмпирическая функция распределения | |
Дискретный | |||
Интервальный |
В табл. 2.3 (Группировка населения России по размеру среднедушевого дохода в апреле 1994г.) представлен интервальный вариационный ряд
.
Удобно ряды распределения анализировать при помощи графического изображения, позволяющего судить и о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма
.
Полигон используется при изображении дискретных вариационных рядов
.
Изобразим, например графически распределение жилого фонда по типу квартир, (табл. 2.10).
Таблица 2.10 - Распределение жилого фонда городского района по типу квартир (цифры условные).
Рис. Полигон распределения жилого фонда
N п/п | Группы семей по размеру жилой площади, приходящейся на одного человека | Число семей с данным размером жилой площади | Накопленное число семей |
1 | 3 – 5 | 10 | 10 |
2 | 5 – 7 | 20 | 30 |
3 | 7 – 9 | 40 | 70 |
4 | 9 – 11 | 30 | 100 |
5 | 11 – 13 | 15 | 115 |
ВСЕГО | 115 | ---- |
Рис. 2.2. Гистограмма распределения семей по размеру жилой площади, приходящейся на одного человека
Рис. 2.3. Кумулята распределения семей по размеру жилой площади, приходящейся на одного человека
N п/п | Группы предприятий по числу занятых, чел. | Число предприятий | Величина интервала, чел. | Плотность распределения |
А | 1 | 2 | 3=1/2 | |
1 | До 20 | 15 | 20 | 0,75 |
2 | 20 – 80 | 27 | 60 | 0,25 |
3 | 80 – 150 | 35 | 70 | 0,5 |
4 | 150 – 300 | 60 | 150 | 0,4 |
5 | 300 – 500 | 10 | 200 | 0,05 |
ВСЕГО | 147 | ---- | ---- |
Для графического изображения вариационных рядов может также использоваться кумулятивная кривая . При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путём последовательно суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.
Рис. 2.4. Огива распределения семей по размеру жилой площади, приходящейся на одного человека
При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты.
Статистические ряды распределения представляют собой простейший вид группировки.
Статистический ряд распределения - это упорядоченное количественное распределение единиц совокупности на однородные группы по варьирующему (атрибутивному или количественному) признаку.
В зависимости от признака, положенного в основу образования групп, различают атрибутивные и вариационные ряды распределения.
Атрибутивными называют ряды распределения, построенные по качественным признакам, т.е. признакам, не имеющим числового выражения. Примером атрибутивного ряда распределения является распределение экономически активного населения РФ по полу в 2010 г. (табл. 3.10).
Таблица 3.10. Распределение экономически активного населения РФ по полу в 2010 г.
Вариационными называются ряды распределения, построенные по количественному признаку, т.е. признаку, имеющему числовое выражение.
Вариационный ряд распределения состоит из двух элементов: вариантов и частот.
Вариантами называют отдельные значения признака, которые он принимает в вариационном ряду.
Частотами являются численности отдельных вариантов или каждой группы вариационного ряда. Частоты показывают, как часто встречаются те или иные значения признака в изучаемой совокупности. Сумма всех частот определяет численность всей совокупности, ее объем.
Частостями называют частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1, или 100%.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения.
Дискретный вариационный ряд распределения - это ряд распределения, в котором группы составлены по признаку, изменяющемуся прерывно, т.е. через определенное число единиц, и принимающему только целые значения. Например, распределение числа построенных квартир в Российской Федерации по числу комнат в них I! 2010 г. (табл. 3.11).
Таблица 3.11. Распределение числа построенных квартир в Российской Федерации по числу комнат в них в 2010 г.
Интервальный вариационный ряд распределения - это ряд распределения, в котором группировочный признак, составляющий основание группировки, может принимать в интервале любые значения, отличающиеся друг от друга на сколь угодно малую величину.
Построение интервальных вариационных рядов целесообразно прежде всего при непрерывной вариации признака (табл. 3.12), а также если дискретная вариация признака проявляется в широких пределах (табл. 3.13), т.е. число вариантов дискретного признака достаточно велико.
Таблица 3.12. Распределение субъектов Южного федерального округа РФ по площади территории на 1 января 2011 г.
Таблица 3.13. Распределение субъектов Центрального федерального округа РФ по числу муниципальных учреждений образования на 1 января 2011 г.
Правила построения рядов распределения аналогичны правилам построения группировки.
Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, распределения.
Полигон используют при изображении дискретных вариационных рядов распределения. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладывают ранжированные значения варьирующего признака, а по оси ординат наносят шкалу для выражения величины частот. Полученные на пересечении оси абсцисс (X) и оси ординат (У) точки соединяют прямыми линиями, в результате чего получают ломаную линию, называемую полигоном частот.
Гистограмму применяют для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладывают величины интервалов, а частоты изображают прямоугольниками, построенными на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам.
Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить прямыми линиями.
При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Плотность распределения - это частота, рассчитанная на единицу ширины интервала,
т.е. сколько единиц в каждой группе приходится па единицу величины интервала.
Для графического изображения вариационных рядов распределения может использоваться кумулятивная кривая. С помощью кумуляты изображают ряд накопленных частот. Накопленные частоты определяют путем последовательного суммирования частот по группам.
При построении кумуляты интервального вариационного ряда по оси абсцисс (X) откладывают варианты ряда, а по оси ординат (У) накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, т.е. кумуляту.
Если при графическом изображении вариационного ряда распределения в виде кумуляты оси X и У поменять местами, то получается огива.
Все значения изучаемого свойства, которые встречаются в изучаемой совокупности, называет значением признака (вариантом, вариантой), а изменение этого значения варьированием . Варианты обозначают малыми буквами латинского алфавита с соответствующими порядковому номеру группы индексами - x i .
Число, которое показывает, сколько раз встречается каждое значение признака в изучаемой совокупности частотой и обозначают f i . Сумма всех частот ряда равна объему изучаемой совокупности.
Очень часто нужно подсчитать накопленную частоту (S ). Накопленная частота для каждого значения признака показывают, сколько единиц совокупности имеют значение признака не больше, чем данное значение. Накопленная частота исчисляются путем последовательного прибавления к частоте первого значения признака частот следующих значений признака:
Накопленную частоту начинают рассчитывать с самого первого значения признака
Сумма частостей всегда равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.
Частоты ряда (f i) в некоторых случаях могут быть заменены частостями (ω i).
Если вариационный ряд дан с неравными интервалами, то для правильного представления о характере распределения необходимо произвести расчет абсолютной или относительной плотности распределения.
Абсолютная плотность распределения (р f ) представляет собой величину частоты, приходящейся на единицу размера интервала отдельной группы ряда:
р f = f / i.
Относительная плотность распределения (р ω ) представляет собой величину частости, приходящейся на единицу размера интервала отдельной группы ряда:
р ω = ω / i.
Для рядов с неравными интервалами только эти характеристики дает более правильное представление о характере распределения, чем частота и частость.
Статистическим распределением выборки называют перечень вариантов (значений признака) и соответствующих им частот или плотностей распределения, относительных частот или относительных плотностей распределения.
Разные ряды распределения характеризуются разным набором частотных характеристик:
минимальным – атрибутивные ряды (частота, частость),
для дискретных используются четыре характеристики (частота, частость, накопленная частота, накопленная частость),
для интервальных – все пять (частота, частость, накопленная частота, накопленная частость, абсолютная и относительная плотности распределения).
Первым этапом изучения вариационного ряда является построение его графического изображения. Графическое изображение вариационных рядов облегчает их анализ и позволяет судить о форме распределения. Для графического изображения вариационного ряда в статистике строят гистограмму, полигон и кумуляту распределения.
Дискретный вариационный ряд изображается в виде так называемого полигона частот.
Для изображения интервального ряда применяются полигон распределения частот и гистограмма частот.
Строятся графики в прямоугольной системе координат.