Наибольшее значение (100 перцентиль).

Что такое перцентиль

Перцентили — это свойства набора данных, которые выражают ранги частей в виде процентов от 0 до 100%, а не в виде чисел, от 1 до n, таким макаром, что меньшему значению соответствует нулевой перцентиль большему — 100-й перцентиль, медиане — 50-й перцентиль и т.д. Перцентили можно рассматривать как характеристики, разбивающие наборы количественных и порядковых Наибольшее значение (100 перцентиль). данных на определенные части.

Направьте внимание, что перцентиль представляет собой имеющий определенный ранг элемент данных и выражен в тех же единицах, что и единицы набора данных. К примеру, 60-й перцентиль эффективности продаж может быть равен $385 062 (измерен не в процентах, а в баксах, как и элементы набора данных). Если этот 60-й Наибольшее значение (100 перцентиль). перцентиль, равный $385 062, охарактеризовывает деятельность определенного агента по продажам (к примеру, Мари), то это значит, что примерно 60% других агентов имеют результаты ниже, чем у Мари, а 40% агентов имеют более высочайшие результаты.

Перцентили употребляют для 2-ух целей.

1. Чтоб показать значение элемента в данных при данном перцентильном ранге (к примеру, “10-й перцентиль Наибольшее значение (100 перцентиль). равен $156 293”).

2. Чтоб показать перцентильный ранг значения данного элемента в наборе данных (к примеру, “эффективность продаж агента по сбыту (Джона) составляет $296 994, что соответствует 55-му перцентилю”).

Экстремумы, квартили и блочные диаграммы

Перцентили играют важную роль в качестве опорных черт. Чтоб обобщить главные черты рассредотачивания, довольно нескольких значений перцентилей. Так, 50-й перцентиль Наибольшее значение (100 перцентиль). — это медиана, так как 50-й перцентиль находится в центре меж большим и минимальным значениями ряда. Энтузиазм представляют экстремумы - наибольшее и меньшее значения данных, т.е. 0-й и 100-й перцентили соответственно. Дополняют набор базисных черт квартили, определяемые как 25-й и 75-й перцентили.

Умопомрачительно, но статистики до сего времени спорят относительно четкого определения квартилей, так как Наибольшее значение (100 перцентиль). их можно вычислять различными методами. Мысль квартилей понятна. Квартили — это значения ранжированного ряда, которые находятся на расстоянии одной четвертой на пути от меньшего либо большего значений. Но эта формулировка не показывает точно, как вычислять квартили. Джон Тьюки, один из создателей практического анализа данных, определяет квартили таким макаром.

1. Вычисляем Наибольшее значение (100 перцентиль). ранг медианы по формуле (1 + n)/2 и отбрасываем дробную часть. К примеру, при n=13 получаем (1 + 13)/2 = 7. При n=24отбрасываем дробную часть (1 + 24)/2 = 12,5 и получаем 12.

2. Добавляем к приобретенному значению 1 и делим на 2. Приобретенное значение представляет собой ранг нижнего квартиля. К примеру; при n = 13 ранг нижнего квартиля равен (1 + 7)/2=4. При n=24 ранг нижнего квартиля Наибольшее значение (100 перцентиль). равен (1 + 12)/2 = 6,5, что свидетельствует о необходимости усреднить значения с рангами 6 и 7.

3. Отнимаем приобретенное значение от (n +1). Результатом будет ранг верхнего

квартиля. К примеру, при n = 13 получим. (13 + 1)-4 = 10. При n = 24 получаем (1 + 24) - 6,5=18,5, что свидетельствует о необходимости усреднить значения с рангами 18 и 19.

5 базисных характеристик включают:

Меньшее значение данных (0-й перцентиль),

Нижний квартиль (25 перцентиль),

Медиана (50 перцентиль),

Верхний Наибольшее значение (100 перцентиль). квартиль (75 перцентиль),

наибольшее значение (100 перцентиль).

Совместно эти свойства дают довольно четкое понятие об особенностях еще необработанного набора данных. Два экстремума охарактеризовывают размах (спектр) данных, медиана указывает центр, два квартиля определяют границы, “расположенной в центре половины данных”, а положение медианы относительно квартилей дает грубое представление о наличии либо отсутствии Наибольшее значение (100 перцентиль). асимметрии.

Блочная диаграмма — это изображение всех 5 обозначенных характеристик (рис. 1).

Min значение
Нижний квартиль
Верхний квартиль
Медиана
Наибольшее значение


Рис. 1. Блочная диаграмма содержит 5 базисных характеристик одномерного набора данных и позволяет стремительно найти нрав рассредотачивания.

Блочная диаграмма, как и гистограмма, дает зрительное представление о рассредотачивании, но употребляет другой метод графического отображения. Блочная диаграмма Наибольшее значение (100 перцентиль). не содержит маленьких деталей, что позволяет окутать всю картину в целом и ассоциировать несколько групп чисел, не вдаваясь в детали каждой из групп. По мере надобности тщательно разглядеть форму рассредотачивания лучше использовать гистограмму.

Подробная блочная диаграмма — это блочная диаграмма, которая также содержит помеченные метками выбросы (метки также Наибольшее значение (100 перцентиль). употребляют для показа экстремальных наблюдений, не являющихся выбросами). Метки выделяют те наблюдения, которые требуют особенного внимания. При разработке подробной блочной диаграммы выбросыопределяют как те значения данных (если они есть), которые размещены далековато от центра рассредотачивания. А именно, огромное значение в наборе данных рассматривается как выброс, если оно превосходит:

верхний квартиль + 1,5 (верхний квартиль Наибольшее значение (100 перцентиль). - нижний квартиль).

Маленькое значение в наборе данных рассматривается как выброс, если оно меньше, чем:

нижний квартиль - 1,5 (верхний квартиль - нижний квартиль).

Так выбросы определяет Тьюки. В дополнение к нанесению на диаграмму выбросов с надлежащими метками можно также отметить экстремальные значения, которые выбросами не являются (по одному с Наибольшее значение (100 перцентиль). каждой стороны), так как нередко они также заслуживают особенного внимания.

На рис. 4.2.2 для сопоставления показаны блочная и подробная блочная диаграммы.

Пример. Выплаты руководителям

Разглядим выплаты (зарплата и премии) руководителям денежных компаний в 1994 году. Табл. 1 содержит упорядоченный перечень размеров выплат, их ранги и надлежащие 5 черт рассредотачивания.

Таблица 1. Выплаты руководителям денежных компаний Наибольшее значение (100 перцентиль)..

Компания Зарплата и премии, $ Ранг
Equitable * Bear Steams * First Financial Mgmt * Merrill Lynch * Travelers * American Intl. Group Schwab (Charles) Dean Witter Discover American Express Marsh & McLennan Progressive American General Loews Torchmark Household International Aflac Cigna Great Western Financial Transamerica General RE Chubb AON St. Paul CAN Financial Providian Jefferson-Pilot Aetna Наибольшее значение (100 перцентиль). life & Casualty First USA Salomon Golden West Financial Cincinnati Financial Allstate Block (H&R) Franklin Resources Safeco Equifax Unintrin Berkshire Hathaway 38-Наиб. значение = 7730000 29-Верхний квартиль=2101000 Медиана=1497500, ранг 19,5 10-Нижний квартиль=1000000 1-Наим. значение = 100000

*- это выброс.

Таблица содержит данные о n=38 фирмах, как следует, медиана (1 497 500) имеет ранг (1+38)/2 = 19,5 и представляет собой среднее Наибольшее значение (100 перцентиль). значение выплат руководителям компаний Transamerica (ранг 19) и General RE (ранг 20). Нижний квартиль (1 000 000) имеет ранг (1 + 19)/2 = 10 и представляет собой выплаты, приобретенные в фирме Salomon. Верхний квартиль (2 101 000) имеет ранг (38+1)-10 = 29и представляет собой выплаты в фирме Marsh & McLennan.

Есть ли посреди значений выбросы? Если высчитать выбросы с внедрением квартилей, то выплаты, размер которых Наибольшее значение (100 перцентиль). превосходит 2 101 000+1,5 * (2 101 000 - 1 000 000) =3 752 000, будут выбросами. Таким макаром, 5 самых больших выплат (выплаченные фирмами Equitable, Bear Steams, First Financial Mgmt, Merrill Lynch, Travelers) являются выбросами в высшей части. С другой стороны, любые выплат, размер которых меньше, чем 1 000 000 - 1,5 * (2 101 000-1 000000) =- 651 500, также будут выбросами. Так как размер меньшей выплаты равен 100 000, то в нижней части рассредотачивания выбросов нет. Блочные Наибольшее значение (100 перцентиль). диаграммы для этих 38 компаний приведены на рис. 4.2.2. Хотя обычно употребляют одну диаграмму (возможно, с огромным количеством подробностей), мы для сопоставления приводим тут обе диаграммы.

Одно из преимуществ блочных диаграмм состоит в том, что они позволяют сконцентрировать внимание на главных особенностях нескольких наборов данных сразу, не отвлекаясь на детали. Разглядим Наибольшее значение (100 перцентиль). выплаты, приобретенные в 1994 году руководителями больших банков, компаний лекарственной отрасли, коммунальных компаний и денежных кампаний). Сейчас мы имеем четыре самостоятельных набора данных: по одному одномерному набору данных (набору значений) для каждой из 4 отраслей. Это значит, что для каждой из отраслей можно вычислить 5 главных характеристик и выстроить блочную диаграмму Наибольшее значение (100 перцентиль).. Расположив построенные в одном масштабе блочные диаграммы на одном рисунке (рис.4.2.3), можно просто сопоставить обычные размеры выплат руководителям в различных отраслях.

Направьте внимание, как информативнее верхний набросок, содержащий помеченные исключительные значения выплат руководителям отдельных компаний, по сопоставлению с нижним рисунком, на котором показано только 5 базисных характеристик. Хотя выше Наибольшее значение (100 перцентиль). всего оплачиваются руководители неких денежных компаний (выбросы), в целом размеры выплат в этой отрасли, не очень отличаются от выплат руководителям в банковской сфере и в лекарственной отрасли. Из рисунка также видно, что руководители коммунальных служб, за некими исключениями, оплачиваются ниже, чем в других отраслях.

Какая из диаграмм лучше? Есть смысл Наибольшее значение (100 перцентиль). растрачивать время и энергию на построение подробной блочной диаграммы (с показом отдельных выбросов), только если это дает вправду нужную дополнительную информацию. Стратегически уместно поначалу стремительно нанести на диаграмму 5 базисных характеристик, а потом уже решать, стоит растрачивать время и усилия на дополнительные подробности. Естественно, если построение диаграммы производится при помощи компьютера, всегда Наибольшее значение (100 перцентиль). (либо практически всегда) следует отдавать предпочтение подробной блочной диаграмме.


najden-sposob-ne-zaryazhat-gadzhet-izvlekayushij-energiyu-iz-prostranstva-vokrug-sebya.html
najdennaya-na-naberezhnoj-irkuta-aviacionnaya-bomba-unichtozhena-internet-resurs-irkru-01092011.html
najdeno-na-sajte-goroda-kurtamisha-kurganskoj-oblasti.html