Statystyka - Miary średnie

Dzielą się na dwie grupy: średnie klasyczne i pozycyjne. Do średnich klasycznych należą: średnia arytmetyczna, średnia harmoniczna oraz średnia geometryczna. Najczęściej wykorzystywanymi średnimi pozycyjnymi są: dominanta (wartość najczęstsza) oraz kwantyle. Wśród kwantyli wyróżniamy - kwartyle (dzielące zbiorowość na cztery części), kwintyle (pięć części), decyle (dziesięć części) oraz centyle [percentyle] (sto części).

Średnie klasyczne są obliczane na podstawie wszystkich wartości szeregu. Średnie pozycyjne są wartościami konkretnych wyrazów szeregu (pozycji) wyróżniających się pod pewnym względem. Obie grupy wzajemnie się uzupełniają, każda opisuje poziom wartości zmiennej z innego punktu widzenia.

Średnia arytmetyczna Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek badanej zbiorowości podzieloną przez liczbę tych jednostek.



- symbol średniej arytmetycznej;
xi - warianty cechy mierzalnej;
N - liczebność badanej zbirowości.

Średnią określoną powyższym wzorem nazywa się średnią arytmetyczną nieważoną.

Jeżeli warianty średniej występują z różną częstotliwością, to oblicza się średnią arytmetyczną ważoną. Wagami są liczebności odpowiadające poszczególnym wariantom. Z tego typu sytuacją mamy do czynienia w szeregach rozdzielczych i przedziałowych.

Średnią arytmetyczną z szeregów przedziałowych oblicza się następująco:

(n=1,2,...,k) - liczebność jednostek odpowiadająca poszczególnym wariantom zmiennej;
N - suma tych liczebności
(? - suma) W szeregach rozdzielczych przedziałowych wartości zmiennej w każdej klasie nie są jednoznacznie określone, ale mieszczą się w pewnym przedziale. Dlatego też w celu obliczenia średniej arytmetycznej w przypadku tego typu szeregów należy wcześniej wyznaczyć środki przedziałów. Środki przedziałów otrzymuje się jako średnią arytmetyczną dolnej i górnej granicy każdej klasy. Oznacza się ją symbolem . Wzór na średnią arytmetyczną z szeregu rozdzielczego przedziałowego:Jeżeli w obliczeniach możemy wykorzystać wyłącznie procentowe wskaźniki struktury (odsetki całości) to wzór wygląda następująco:gdzie Ćwiczenie 1 Tab. 1 Wyniki badań testowych dotyczących wiedzy teoretycznej ze statystyki Wiedza ze statystyki
(w punktach)
Liczba studentów
Obliczenia pomocnicze






20-30
30-40
40-50
50-60
60-70
70-80
2
10
7
9
12
10
25
35
45
55
65
75
50
350
315
495
780
750
4,0
20,0
14,0
18,0
24,0
20,0
100,0
700,0
630,0
990,0
1560,0
1500,0
Razem
50
x
2740
100,0
5480,0
- środek klasy
- odsetek ogółu Oblicz średnią arytmetyczną. Metoda 1:
"Za pomocą szeregu rozdzielczego przedziałowego"Metoda 2:
"Za pomocą procentowych wskaźników struktury"Wyniki są równoważne, ponieważ wartość średniej arytmetycznej nie zależy od liczebności poszczególnych klas, ale od proporcji między nimi. Jeżeli znamy średnie arytmetyczne dla pewnych grup, a chcemy obliczyć średnią arytmetyczną dla wszystkich grup łącznie korzystamy ze wzoru:gdzie: - średnia ze średnich;
- średnia arytmetyczna i-tej grupy;
- suma liczebności grupy; Średnia arytmetyczna jest miarą prawidłową tylko w odniesieniu do zbiorowości jednorodnych, o niewielkim stopniu zróżnicowania wartości zmiennej. W miarę wzrostu asymetrii i zróżnicowania rozkładu, a także w rozkładach bimodalnych i wielomodalnych średnia arytmetyczna traci swoje znaczenie. Nie można jej obliczyć dla szeregu o otwartych przedziałach, jeżeli przedziały te mają duże liczebności. (Przyjmuje się, że otwarte przedziały klasowe przedziały można zamykać, jeżeli liczba jednostek w tych przedziałach nie przekracza 5% liczebności zbiorowości.)
Jeżeli wartości zmiennej podane są w jednostkach względnych, np. km/godz, kg/osobę, wagi zaś w jednostkach liczników tych jednostek względnych (prędkość pojazdu - zmienna: km/godz.; waga: w km; gęstość zaludnienia - zmienna: w osobach/km2, waga: w osobach; spożycie artykułu X na 1 osobę - zmienna: w litrach, waga: na osobę), to stosuje się średnią harmoniczną.

Średnia harmoniczna jest odwrotnością średniej arytmetycznej z odwrotności wartości zmiennych. W przypadku szeregów wyliczających oblicza się ją ze wzoru:gdzie:
H - symbol średniej harmonicznej. Dla obliczenia średniej harmonicznej z szeregów rozdzielczych (punktowych lub przedziałowych) zachodzi konieczność zastosowania wag (uwzględnienia liczebności). Stosuje się wzór:Dla szeregów rozdzielczych przedziałowych średnią harmoniczną obliczamy według powyższego wzoru, z tym, że konkretne warianty cechy (xi) zastępujemy środkami przedziałów (). Ćwiczenie 2
Gęstość zaludnienia w dwu 100-tysięcznych miastach wynosi odpowiednio 300 osób/km2 i 900 osób km2. Oblicz przeciętną gęstość zaludnienia.Stosując średnią arytmetyczną dla obliczenia powyższego zadania otrzymalibyśmy:
CO NIE JEST PRAWDĄ! Każde z miast zajmuje odpowiednio: 100 000 : 300 osób km2 = 333,33 km2
100 000 : 900 osób km2 = 111,11 km2 Z czego wynika, że oba miasta zajmują powierzchnię - 444,44 km2.
Wobec tego średnia gęstość zaludnienia w tych miastach wynosi: 200 000 osób : 444,44 km2 = 450 osób/km2. Ten sam rezultat uzyskamy wzór na średnią harmoniczną dla szeregów rozdzielczych punktowych:
Jeżeli zachodzi konieczność zbadania średniego tempa zmian zjawiska, stosuje się średnią geometryczną. (Więcej na ten temat przy analizie dynamiki zjawisk).gdzie:
- symbol średniej geometrycznej;
- znak iloczynu ŚREDNIE POZYCYJNE Dominantą (modalna, wartość najczęstsza) nazywamy taką wartość zmiennej, która w danym rozkładzie empirycznym występuje najczęściej. (Wynika z tego, że dominantę można wyznaczyć tylko w rozkładach jednomodalnych). W szeregach wyliczających i rozdzielczych punktowych dominanta jest wartością cechy, której odpowiada największa liczebność. W szeregach rozdzielczych przedziałowych bezpośrednio można określić tylko przedział, w którym znajduje się dominanta - jest to przedział o największej liczebności. Konkretną wartość liczbową należącą do tego przedziału, która jest dominantą wyznacza się w następujący sposób:gdzie: - symbol dominanty;
- dolna granica klasy, w której znajduje się dominanta;
- liczebność przedziału dominanty;
- liczebność przedziału poprzedzającego przedział dominanty;
- liczebność przedziału następującego po przedziale dominanty;
- interwał, czyli rozpiętość przedziału dominanty. Z szeregów rozdzielczych przedziałowych dominantę można wyznaczyć metodą rachunkową (patrz wyżej) lub graficzną. Ćwiczenie 3.
Na podstawie tabeli wyznacz dominantę danego szeregu. Tab. Rozwody w Polsce w 1977 r. wg wieku kobiet w momencie wniesienia powództwa.
Wiek kobiet
(w latach)
Liczba kobiet
Odsetek kobiet
Do 19
20-24
25-29
30-34
35-39
40-49
50 i więcej
314
6979
11440
6391
5412
8450
4200
0,7
16,2
26,2
14,8
12,5
19,6
9,7

Wartość będzie identyczna, jeżeli do obliczeń wykorzystamy odsetki zamiast liczebności absolutnych.Metoda graficzna sprowadza się do wykonania wykresu z trzech przedziałów klasowych: przedziału, w którym znajduje się dominanta oraz dwóch sąsiednich. Z górnej podstawy najwyższego prostokąta wyznaczamy dwie przekątne łączące najbliżej położone punkty górnych podstaw sąsiednich prostokątów. Następnie z punkty ich przecięcia wyznaczamy prostopadłą do osi odciętych (x). Jeżeli liczebności przedziałów sąsiednich są jednakowe, to dominanta jest równa środkowi klasy dominującej. Wyznaczanie dominanty jest możliwe wówczas, gdy szereg spełnia następujące warunki:
- rozkład empiryczny ma jeden ośrodek dominujący (rozkład jednomodalny);
- asymetria układu jest umiarkowana;
- przedział w którym występuje dominanta oraz dwa sąsiednie z nim przedziały mają jednakowe rozpiętości. Kwantyle, są to najogólniej rzecz ujmując wartości cechy badanej jednostki, które definiują ją na określone części - pod względem liczby jednostek. Części te mogą być równe lub pozostawać do siebie w określonych proporcjach. Szeregi, w których wyznacza się kwartyle musza być uporządkowane według malejących lub rosnących wartości cechy. Do najczęściej używanych kwantyli zaliczamy: kwartyle, a w przypadku badania struktury zbiorowości o dużej liczbie jednostek - decyle i centyle. Wśród kwartyli wyróżniamy: kwartyl pierwszy (dolny), drugi (mediana lub wartość środkowa) oraz trzeci (górny). Każdy z kwartyli dzieli zbiorowość na dwie części pod względem liczebności.
1. kwartyl pierwszy - dzieli zbiorowość uporządkowaną na dwie części w ten sposób, że 25% jednostek na wartości cechy niższe i 75% wyższe od kwartyla pierwszego;
2. kwartyl drugi - dzieli zbiorowość uporządkowaną na dwie części w ten sposób, że 50% jednostek na wartości cechy niższe i 50% wyższe od mediany;
3. kwartyl trzeci - dzieli zbiorowość uporządkowaną na dwie części w ten sposób, że 75% jednostek na wartości cechy niższe i 25% wyższe od kwartyla trzeciego. W przypadku szeregów wyliczających składających się z reguły z niewielkiej liczby jednostek medianę oblicza się najczęściej ze wzoru: gdy N jest nieparzyste gdy N jest parzyste gdzie: - symbol mediany. Obliczanie mediany z szeregu rozdzielczego punktowego sprowadza się do wskazania jednostki środkowej i odczytania wariantu cechy odpowiadającego tej jednostce. Odnalezienie środkowej jednostki ułatwia skumulowanie liczebności. Kumulacja polega na kolejnym narastającym sumowaniu liczebności dotyczących poszczególnych wariantów cechy.

W przypadku szeregów rozdzielczych przedziałowych kwartyle wyznacza się metodą graficzną lub rachunkową. W metodzie rachunkowej stosuje się następujące wzory:

Kwartyl pierwszy:
;

Kwartyl drugi:
;

Kwartyl trzeci:


gdzie:
- symbole kwartyli;
- granice przedziałów, w których znajdują się odpowiednio: kwartyl pierwszy, drugi (mediana) i trzeci;
N - ogólna liczebność danej zbiorowości;
- suma liczebności od klasy pierwszej do tej, w której znajdują się odpowiednio: kwartyl pierwszy, drugi (mediana) i trzeci;
- liczebności przedziałów, w których, w których znajdują się odpowiednio: kwartyl pierwszy, drugi (mediana) i trzeci;
- interwały (rozpiętość) przedziałów, w których znajdują się odpowiednio: kwartyl pierwszy, drugi (mediana) i trzeci;
Ćwiczenie 4
Na podstawie tabeli wyznacz kwartyle szeregu. Tab. Wiek kobiet zawierających związek małżeński w Polsce w 1977 r.
Wiek kobiet
(w latach)
Liczba kobiet
Odsetek kobiet
Skumulowane częstości względne
do 19
20-24
25-29
30-34
35-39
40-49
50-59
60 i więcej
68 694
184 088
43 239
10 127
4 925
7 251
4 586
3 277
21,1
56,4
13,3
3,1
1,5
2,2
1,4
1,0
21,1
77,5
90,8
93,9
95,4
97,6
99,0
100,0
Ogółem
326 277
100,0
x
Źródło: M. Sobczyk, Statystyka, PWN, W-wa 1991, s.41 Pierwszą czynnością jest kumulacja liczebności (absolutnych bądź odsetków). Następnie wyznaczamy pozycję poszczególnych kwartyli w szeregu, tzn. . Wykorzystując skumulowane częstości względne otrzymujemy:Na tej podstawie obliczamy wartości kwartyli:(21,1 - jest to suma liczebności od klasy pierwszej do tej, w której znajdują się odpowiednie kwartyle) Kwartyle są dogodnymi parametrami w analizie struktury. Mogą być wykorzystane w przypadkach, w których nie jest możliwe obliczenie z danego szeregu średniej arytmetycznej (otwarte przedziały klasowe, ekstremalne wartości), a także dominanty (nierówne rozpiętości przedziałów, silna asymetria rozkładu.
Decyle i centyle (percentyle) wyznacza się podobnie jak kwartyle. Decyle dzielą zbiorowość na 10 części - 5 decyl to mediana. Centyle zaś na 100 części - 50 centyl jest medianą.
Średnia arytmetyczna, dominanta i mediana, jako miary tendencji centralnej, są powiązane ze sobą odpowiednimi zależnościami - równość lub nierówność (w zależności od typu rozkładu) [więcej na ten temat w dziale miary asymetrii ;-)] W przypadku rozkładu umiarkowanie niesymetrycznego zachodzi między nimi następujący związek: ; (wzór Pearsona) Na postawie tego wzoru można wyznaczyć średnią znając dwie pozostałe zmienne. Po przekształceniach możemy na jego podstawie obliczyć dominantę - znając średnią arytmetyczną i medianę.



Dane autora:




wiedza.diaboli.pl / Statystyka

190 IP banned