Witaj, dzisiaj rozwiązujemy następujące zadanie dotyczące analizy struktury oraz szeregu wyliczającego (szczegółowego):
Odległość miejsca zamieszkania 7 losowo wybranych studentów od uczelni wynosi: 30; 20; 10; 15; 45; 10; 5 km. Dokonaj wszechstronnej analizy rozkładu odległości miejsca zamieszkania studentów od uczelni.
Wypisujemy na kartce/ w Excelu obserwacje (czyli wartości odległości studentów od uczelni), a także ustalamy ich liczbę, czyli n.
Następnie możemy przejść do obliczenia pierwszej miary, czyli średniej arytmetycznej.
W tym celu obliczamy sumę wszystkich obserwacji, czyli 30+20+10+15+45+10+5=135.
Następnie sumę obserwacji, czyli 135 dzielimy przez liczbę obserwacji, czyli 7, W ten sposób uzyskujemy obliczoną średnią arytmetyczną.
Interpretacja średniej arytmetycznej jest następująca: w badanej grupie studentów średnia odległość miejsca zamieszkania od uczelni wynosi 19,29 km.
DOMINANTA
Przyjrzyjmy się teraz analizowanym danym. Czy któraś z obserwacji powtarza się? Odpowiedź brzmi tak. Wartością powtarzającą się jest 10.
Gdyby któraś wartość powtarzała się np. 2 razy, a inna 3, to dominantą jest wartość powtarzająca się więcej razy.
Interpretacja dominanty jest następująca: W badanej grupie studentów najczęściej występującą odległością miejsca zamieszkania od uczelni jest 10 km.
MEDIANA
Przystępujemy do obliczania mediany :).
W tym celu sortujemy sobie obserwacje w kolejności od najmniejszej do największej.
Kopiuję sobie wszystkie obserwacje parę kolumn dalej, a następnie sortuję je.
Przy obliczaniu mediany korzystamy z tego uporządkowanego szeregu obserwacji.
W naszym przypadku liczba obserwacji n=7 jest liczbą nieparzystą. Oznacza to, że mamy ułatwioną sytuację.
Przechodzimy teraz do ustalenia, ile jest równa mediana.
W przypadku, gdy n jest liczbą nieparzystą dzielimy liczbę obserwacji przez 2. Uzyskaną liczbę zaokrąglamy w górę i w ten sposób dowiadujemy się, na którym miejscu w uporządkowanym szeregu znalazła się mediana.
W naszym przypadku n/2=7/2=3,5, czyli mediana znajduje się na 4 miejscu. Teraz pozostaje tylko ustalić, ile ona wynosi oraz zinterpretować ją.
W uporządkowanym szeregu numeruję sobie obserwację tak, żeby łatwiej było znaleźć mi medianę.
Na koniec pozostaje mi interpretacja mediany: w badanej grupie studentów połowa osób mieszka w odległości mniejszej, bądź równej 15 km od uczelni, a pozostała połowa mieszka w odległości większej, bądź równej 15 km od uczelni.
WARIANCJA
Obliczając wariancję, najpierw obliczamy odległość poszczególnych obserwacji od średniej. Pamiętajcie o zablokowaniu komórki z wartością średniej, jeśli wykonujecie obliczenia na kartce.
Wartości obliczone dla wszystkich obserwacji są następujące:
Tworzymy trzecią kolumnę, w której różnicę poszczególnych obserwacji i wartości średniej podnosimy do kwadratu.
Kolejnym krokiem jest obliczenie sumy wartości podnoszonych do drugiej potęgi.
Wreszcie obliczamy wariancję, czyli obliczoną sumę dzielimy przez liczbę obserwacji.

Wariancja wynosi 60,74. Ważne jest to, że wariancji nie interpretujemy.
ODCHYLENIE STANDARDOWE
Poprzednią obliczoną miarą była wariancja. Jak już wiecie nie interpretujemy jej. Możemy natomiast zinterpretować pierwiastek z wariancji, czyli odchylenie standardowe.
A zatem korzystając z obliczonej wariancji obliczamy odchylenie standardowe:
Interpretacja jest następująca: w badanej grupie studentów odległości miejsca zamieszkania od uczelni odchylają się przeciętnie od średniej o około 7,79 km.
WSPÓŁCZYNNIK ZMIENNOŚCI
Współczynnik zmienności to iloraz odchylenia standardowego i średniej wyrażony w procentach.
W naszym zadaniu współczynnik zmienności wynosi 40,41%, czyli odchylenie standardowe miejsca zamieszkania badanych studentów od uczelni stanowi 40,41% średniej arytmetycznej. Zróżnicowanie studentów pod względem odległości miejsca zamieszkania od uczelni jest umiarkowane.
Zróżnicowanie jest umiarkowane, gdy znajduje się w przedziale 33,3%-66,66%. Gdy zróżnicowanie jest mniejsze od 33,3% mówimy, że jest słabe. Gdy z kolei jest większe od 66,6, to jest silne.
ROZSTĘP
Kolejną obliczaną miarą jest rozstęp, czyli różnica między wartością maksymalną i minimalną.
Możecie najpierw ustalić, jaka jest wartość maksymalna w zbiorze obserwacji, następnie, jaka jest wartość minimalna i odjąć minimum od maksimum. Ja wykonałam to w jednej komórce.
Maksimum dla obserwacji z zadania wyniosło 45, a minimum 5. Rozstęp zatem wyniósł R(x)=45-5=40.
Interpretacja: w badanej grupie studentów różnica między największą, a najmniejszą odległością miejsca zamieszkania od uczelni wynosi 40 km.
ODCHYLENIE PRZECIĘTNE
Oprócz obliczonego wcześniej odchylenia standardowego można jeszcze obliczyć odchylenie przeciętne.
Żeby obliczyć odchylenie przeciętne, musimy obliczyć wartość bezwzględną z różnicy między obserwacją, a wartością średnią dla obserwacji. Jeżeli wykonujecie obliczenia w Excelu, pamiętajcie o zablokowaniu komórki ze średnią.
Następnie obliczamy sumę obliczonych modułów :)
Uzyskaną sumę dzielimy przez liczbę obserwacji i uzyskujemy w ten sposób odchylenie przeciętne.
d(x)=74,29/7=10,61.
Odległości miejsca zamieszkania studentów od uczelni odchylają się przeciętne od średniej o plus/minus 10,61 km.
TRZECI MOMENT CENTRALNY
W ostatniej części naszej analizy chcemy ustalić, czy rozkład obserwacji jest asymetryczny lewostronnie, prawostronnie, czy może jest symetryczny.
W tym celu na początek obliczymy trzeci moment centralny.
Aby obliczyć trzeci moment centralny będzie potrzebna nam kolumna, w której obliczymy różnicę wartości obserwacji i wartości średniej podniesioną do potęgi trzeciej. Po raz kolejny przypominam Wam o zablokowaniu średniej, jeśli korzystacie z Excela.
Potrzebna jest nam także suma obliczonych wartości.
Tę sumę dzielimy przez liczbę obserwacji uzyskując w ten sposób wartość trzeciego momentu centralnego.
Wartość trzeciego momentu centralnego jest większa od 0 i wynosi 1948,25.
Na koniec pozostaje nam jeszcze interpretacja: rozkład odległości miejsca zamieszkania losowo wybranych studentów od uczelni jest rozkładem asymetrycznym prawostronnie. Gdyby asymetria była lewostronna trzeci moment centralny byłby mniejszy od zera. Dla rozkładu symetrycznego z kolei byłby równy 0.
TRZECI MOMENT CENTRALNY ZESTANDARYZOWANY
Wykorzystując odchylenie standardowe i trzeci moment centralny zestandaryzowany możemy obliczyć trzeci moment centralny zestandaryzowany.
Trzeci moment centralny zestandaryzowany to trzeci moment centralny podzielony przez odchylenie standardowe podniesione do trzeciej potęgi. Poniżej możecie zobaczyć, jak to obliczyć w Excelu. Uwaga na nawiasy :)
Interpretacja jest taka sama, jak w przypadku trzeciego momentu centralnego :).
WSPÓŁCZYNNIK ASYMETRII PEARSONA
Ostatnią miarą, którą dzisiaj obliczymy jest współczynnik asymetrii Pearsona.
W liczniku tej miary znajduje się różnica średniej i dominanty, a w mianowniku odchylenie standardowe.
Zanim obliczyłam współczynnik, dopisałam sobie, ile wynosi wartość dominanty, gdyż wcześniej nie zamieściłam jej w zestawieniu wyników. Na rysunku poniżej macie to zaznaczone na żółto.
Następnie obliczyłam współczynnik.
Współczynnik asymetrii Pearsona należy do przedziału od -3 do 3. Dla asymetrii lewostronnej wartości są ujemne, dla prawostronnej dodatnie. Dodatkowo współczynnik informuje nas o sile asymetrii. Jeśli znajduje się w przedziale od -1 do 0 lub od 0-1 to asymetria jest słaba. Jeśli znajduje się w przedziale -1 do -2 lub 1 do 2, to mamy asymetrię umiarkowaną. Dla wartości z przedziału -2 do -3 i 2-3 asymetria jest silna.
Dla naszych danych interpretacja brzmi następująco:
W badanej grupie studentów występuje umiarkowana asymetria prawostronna.
Jeśli macie pytania, to piszcie śmiało :).