poniedziałek, 16 lutego 2015

Analiza struktury- zadanie 3

Witaj,
dzisiaj zajmujemy się następującym zadaniem:

Kupiono trzy gatunki owoców, po 4 kg z każdego gatunku. Pierwszy gatunek kosztował 5 zł/ kg, drugi był w cenie 7,5 zł/ kg, a trzeci kosztował 12 zł. Jaka była średnia cena za kg zakupionych owoców?


Przystępujemy do rozwiązywania zadania:
Najpierw ustalamy, ile kg owoców kupiono.
Z treści zadania wiemy, że kupiono 3 gatunki, po 4 kg z każdego, czyli:
Teraz ustalamy, ile zapłacono za każdy gatunek owoców:

Wartości wpisane na czerwono musicie sami obliczyć :) 
W kolejnym kroku ustalamy, ile zapłaciliśmy za wszystkie owoce. 
W ostatnim kroku ustalamy, ile średnio kosztował kg kupionych owoców. 
Kwotę, którą zapłaciliśmy za wszystkie owoce dzielimy przez liczbę kupionych kg.
Za kg kupionych owoców zapłacono średnio 8,17 zł. 

niedziela, 15 lutego 2015

Analiza struktury- zadanie 2

Witaj,
dzisiaj rozwiązujemy kolejne zadanie z analizy struktury.

W Firmie A i B przeprowadzono badanie pracowników ze względu na dotychczasowy staż pracy. Otrzymano następujące wyniki:
Firma A:
średnia: 10 lat
współczynnik zmienności: 60%
Firma B:
średnia: 12 lat
odchylenie standardowe: 4,25
Porównaj wyniki badania w Firmie A i B.

Zaczynamy od przypomnienia sobie wzoru na klasyczny współczynnik zmienności:

Dla Firmy A możemy korzystając z tego wzoru obliczyć odchylenie standardowe. 
Przekształcamy wzór na klasyczny współczynnik zmienności tak, aby móc z niego obliczyć odchylenie standardowe. 
Podstawiając dane do wzoru otrzymujemy następujący wynik:
Dla Firmy A mamy już znane następujące miary: średnia, odchylenie standardowe oraz współczynnik zmienności. 

Przystępujemy do wykonania niezbędnych obliczeń dla Firmy B.
Mamy informację na temat średniej i odchylenia standardowego, czyli możemy policzyć klasyczny współczynnik zmienności. Podstawiając dane do wzoru uzyskujemy następujący wynik:
Dla Firmy B również znamy już wartość średniej, odchylenia standardowego oraz klasycznego współczynnika zmienności. 

Dane zbieramy teraz do jednej tabelki, żeby łatwiej było na nie patrzeć :). Na czerwono zaznaczyłam wartości obliczone. 

I przystępujemy teraz do interpretacji tych wartości. 
Średni staż pracy w Firmie A wynosi 10 lat i jest o 2 (12-10) lata krótszy, niż w Firmie B. 
Staż pracy w Firmie A odchyla się przeciętnie od średniej o 6 lat, a w Firmie B staż pracy odchyla się przeciętnie od średniej o 4,25 roku. W Firmie A staż pracy odchyla się przeciętnie od średniej o 1,75 (6-4,25) roku więcej, niż w Firmie B. 
W Firmie A odchylenie standardowe stażu pracy stanowi 60%  średniej arytmetycznej staży pracy. Zróżnicowanie pracowników pod względem stażu pracy jest umiarkowane. W Firmie B odchylenie standardowe stażu pracy stanowi 35,42% średniej arytmetycznej. Zróżnicowanie pracowników pod względem stażu pracy również jest umiarkowane. 
W obydwu Firmach zróżnicowanie pracowników ze względu na staż pracy jest umiarkowane, jednak w Firmie A jest ono o 24,58% (60%-35,42%) wyższe, niż w Firmie B. 

Jeśli macie pytania, to piszcie śmiało :) 


sobota, 14 lutego 2015

Ceny paliw spadają?

Witaj, 
jak myślisz, jak zmieniają się ceny paliw? Zastanawiałaś/eś się kiedyś nad tym? 
Dziś pokażę Ci na wykresie, jak w okresie od stycznia 2006 do grudnia 2014 zmieniały się ceny paliw w Polsce. Dane wykorzystane do dzisiejszej analizy pochodzą z Banku Danych Lokalnych z kategorii ceny, z grupy przeciętne ceny detaliczne towarów i usług konsumpcyjnych z podgrupy ceny detaliczne wybranych towarów i usług konsumpcyjnych (dane miesięczne).

Wykres, który pokazuje, jak zmieniała się cena benzyny:
















W analizowanym okresie cena paliwa była najniższa w styczniu 2009 roku i wynosiła wtedy 3,46 zł. Najwyższa z kolei była w kwietniu 2012 roku, kiedy to wyniosła 5,88 zł. Być może te liczby nic Ci nie mówią. A jeśli powiem, że w kwietniu 2012 roku litr paliwa był droższy o 69% w porównaniu ze styczniem 2009 roku? Wiem, teraz to daje Ci już do myślenia. Pewnie zastanawiasz się o ile procent wzrosła Twoja pensja? Nie musisz liczyć. To z pewnością mniej, niż wyliczone 69%. 

W grudniu 2014 roku pierwszy raz od marca 2011 średnia cena za litr paliwa w Polsce była niższa od 5 zł i wyniosła 4,82. Jako statystyk powiem Ci, że jest się z czego cieszyć, że wykres wskazuje, że będzie taniej. Z niecierpliwością czekam na dane na temat cen w styczniu 2015, z jeszcze większą niecierpliwością będę czekać na dane za luty i kolejne miesiące. I obawiam się, że statystyka i prognozy będą musiały się zmierzyć z tzw. opłatą zapasową wprowadzoną od 1 stycznia 2015. Czas pokaże jak będzie i ile musimy zapłacić za ten luksus, jakim jest jazda samochodem :).

piątek, 13 lutego 2015

Analiza struktury- podział miar

Witaj, 
dzisiaj zapoznam Cię z podziałem miar w analizie struktury.

Miary obliczane i interpretowane w analizie struktury dzielimy na 3 grupy: miary średnie, miary zróżnicowania oraz miary asymetrii.

W obrębie każdej grupy miar wyróżniamy miary klasyczne i pozycyjne. 

MIARY ŚREDNIE dzielą się następująco:
Do klasycznych miar poziomu przeciętnego należą średnia arytmetyczna, harmoniczna oraz średnia geometryczna. 
Z kolei do miar pozycyjnych należą dominanta (inaczej moda, wartość najczęstsza) oraz kwantyle. 
Wśród kwantyli można wydzielić ogólnie kwantyle rzędu p oraz kwartyle, czyli kwantyl rzędu 0,25; 0,5 lub 0,75. Kwantyl rzędu 0,5 nazywamy medianą (wartością środkową). 

MIARY ZRÓŻNICOWANIA również dzielą się na klasyczne i pozycyjne. Wśród miar klasycznych mamy 5 miar. Miary pozycyjne są z kolei 3. 
MIARY ASYMETRII stanowią trzecią grupę miar w analizie struktury. 
Również dzielą się na miary klasyczne i pozycyjne. Warto zwrócić uwagę na współczynnik skośności Pearsona. Został on zakwalifikowany do miar pozycyjnych ale równie dobrze mógłby znaleźć się w grupie miar mieszanych, która nie została tutaj wyróżniona. W liczniku tego współczynnika znajduje się różnica średniej i dominanty. W mianowniku z kolei mamy odchylenie standardowe. Dominanta jest miarą pozycyjną. Dwie pozostałe to z kolei miary klasyczne. To sprawia, że współczynnik mógłby znaleźć się w jednej i drugiej grupie. Zakwalifikowałam go miar pozycyjnych, ponieważ miary klasyczne możemy policzyć zawsze, a pozycyjne tylko czasami. 
Jeśli macie pytania, to piszcie śmiało :).

czwartek, 12 lutego 2015

Analiza struktury- zadanie 1

Witaj, dzisiaj rozwiązujemy następujące zadanie dotyczące analizy struktury oraz szeregu wyliczającego (szczegółowego):

Odległość miejsca zamieszkania 7 losowo wybranych studentów od uczelni wynosi: 30; 20; 10; 15; 45; 10; 5 km. Dokonaj wszechstronnej analizy rozkładu odległości miejsca zamieszkania studentów od uczelni. 

Co obliczamy i interpretujemy, jeśli oczywiście się da? 

  1. Średnia arytmetyczna
  2. Dominanta
  3. Mediana
  4. Wariancja
  5. Odchylenie standardowe
  6. Współczynnik zmienności
  7. Rozstęp
  8. Odchylenie przeciętne
  9. Trzeci moment centralny
  10. Trzeci moment centralny zestandaryzowan
  11. Współczynnik asymetrii Pearsona. 
Jak się zabrać za to zadanie?

Wypisujemy na kartce/ w Excelu obserwacje (czyli wartości odległości studentów od uczelni), a także ustalamy ich liczbę, czyli n.

ŚREDNIA ARYTMETYCZNA
Następnie możemy przejść do obliczenia pierwszej miary, czyli średniej arytmetycznej. 
W tym celu obliczamy sumę wszystkich obserwacji, czyli 30+20+10+15+45+10+5=135.

Następnie sumę obserwacji, czyli 135 dzielimy przez liczbę obserwacji, czyli 7, W ten sposób uzyskujemy obliczoną średnią arytmetyczną.

Interpretacja średniej arytmetycznej jest następująca: w badanej grupie studentów średnia odległość miejsca zamieszkania od uczelni wynosi 19,29 km. 

DOMINANTA
Przyjrzyjmy się teraz analizowanym danym. Czy któraś z obserwacji powtarza się? Odpowiedź brzmi tak. Wartością powtarzającą się jest 10. 

Gdyby któraś wartość powtarzała się np. 2 razy, a inna 3, to dominantą jest wartość powtarzająca się więcej razy. 
Interpretacja dominanty jest następująca: W badanej grupie studentów najczęściej występującą odległością miejsca zamieszkania od uczelni jest 10 km. 

MEDIANA
Przystępujemy do obliczania mediany :). 
W tym celu sortujemy sobie obserwacje w kolejności od najmniejszej do największej. 
Kopiuję sobie wszystkie obserwacje parę kolumn dalej, a następnie sortuję je. 

Przy obliczaniu mediany korzystamy z tego uporządkowanego szeregu obserwacji.
W naszym przypadku liczba obserwacji n=7 jest liczbą nieparzystą. Oznacza to, że mamy ułatwioną sytuację. 
Przechodzimy teraz do ustalenia, ile jest równa mediana. 
W przypadku, gdy n jest liczbą nieparzystą dzielimy liczbę obserwacji przez 2. Uzyskaną liczbę zaokrąglamy w górę i w ten sposób dowiadujemy się, na którym miejscu w uporządkowanym szeregu znalazła się mediana. 
W naszym przypadku n/2=7/2=3,5, czyli mediana znajduje się na 4 miejscu. Teraz pozostaje tylko ustalić, ile ona wynosi oraz zinterpretować ją. 
W uporządkowanym szeregu numeruję sobie obserwację tak, żeby łatwiej było znaleźć mi medianę. 


Na koniec pozostaje mi interpretacja mediany: w badanej grupie studentów połowa osób mieszka w odległości mniejszej, bądź równej 15 km od uczelni, a pozostała połowa mieszka w odległości większej, bądź równej 15 km od uczelni. 

WARIANCJA
Obliczając wariancję, najpierw obliczamy odległość poszczególnych obserwacji od średniej. Pamiętajcie o zablokowaniu komórki z wartością średniej, jeśli wykonujecie obliczenia na kartce.
Wartości obliczone dla wszystkich obserwacji są następujące:

Tworzymy trzecią kolumnę, w której różnicę poszczególnych obserwacji i wartości średniej podnosimy do kwadratu.
Kolejnym krokiem jest obliczenie sumy wartości podnoszonych do drugiej potęgi.
Wreszcie obliczamy wariancję, czyli obliczoną sumę dzielimy przez liczbę obserwacji.

Wariancja wynosi 60,74. Ważne jest to, że wariancji nie interpretujemy.

ODCHYLENIE STANDARDOWE
Poprzednią obliczoną miarą była wariancja. Jak już wiecie nie interpretujemy jej. Możemy natomiast zinterpretować pierwiastek z wariancji, czyli odchylenie standardowe.
A zatem korzystając z obliczonej wariancji obliczamy odchylenie standardowe:
Interpretacja jest następująca: w badanej grupie studentów odległości miejsca zamieszkania od uczelni odchylają się przeciętnie od średniej o około 7,79 km.

WSPÓŁCZYNNIK ZMIENNOŚCI
Współczynnik zmienności to iloraz odchylenia standardowego i średniej wyrażony w procentach.
W naszym zadaniu współczynnik zmienności wynosi 40,41%, czyli odchylenie standardowe miejsca zamieszkania badanych studentów od uczelni stanowi 40,41% średniej arytmetycznej. Zróżnicowanie studentów pod względem odległości miejsca zamieszkania od uczelni jest umiarkowane. 
Zróżnicowanie jest umiarkowane, gdy znajduje się w przedziale 33,3%-66,66%. Gdy zróżnicowanie jest mniejsze od 33,3% mówimy, że jest słabe. Gdy z kolei jest większe od 66,6, to jest silne.

ROZSTĘP
Kolejną obliczaną miarą jest rozstęp, czyli różnica między wartością maksymalną i minimalną.
Możecie najpierw ustalić, jaka jest wartość maksymalna w zbiorze obserwacji, następnie, jaka jest wartość minimalna i odjąć minimum od maksimum. Ja wykonałam to w jednej komórce.
Maksimum dla obserwacji z zadania wyniosło 45, a minimum 5. Rozstęp zatem wyniósł R(x)=45-5=40.
Interpretacja: w badanej grupie studentów różnica między największą, a najmniejszą odległością miejsca zamieszkania od uczelni wynosi 40 km. 

ODCHYLENIE PRZECIĘTNE
Oprócz obliczonego wcześniej odchylenia standardowego można jeszcze obliczyć odchylenie przeciętne.

Żeby obliczyć odchylenie przeciętne, musimy obliczyć wartość bezwzględną z różnicy między obserwacją, a wartością średnią dla obserwacji. Jeżeli wykonujecie obliczenia w Excelu, pamiętajcie o zablokowaniu komórki ze średnią. 
Następnie obliczamy sumę obliczonych modułów :) 

Uzyskaną sumę dzielimy przez liczbę obserwacji i uzyskujemy w ten sposób odchylenie przeciętne.

d(x)=74,29/7=10,61. 
Odległości miejsca zamieszkania studentów od uczelni odchylają się przeciętne od średniej o plus/minus 10,61 km.

TRZECI MOMENT CENTRALNY
W ostatniej części naszej analizy chcemy ustalić, czy rozkład obserwacji jest asymetryczny lewostronnie, prawostronnie, czy może jest symetryczny.
W tym celu na początek obliczymy trzeci moment centralny. 
Aby obliczyć trzeci moment centralny będzie potrzebna nam kolumna, w której obliczymy różnicę wartości obserwacji i wartości średniej podniesioną do potęgi trzeciej. Po raz kolejny przypominam Wam o zablokowaniu średniej, jeśli korzystacie z Excela.
Potrzebna jest nam także suma obliczonych wartości.

Tę sumę dzielimy przez liczbę obserwacji uzyskując w ten sposób wartość trzeciego momentu centralnego.
Wartość trzeciego momentu centralnego jest większa od 0 i wynosi 1948,25.
Na koniec pozostaje nam jeszcze interpretacja: rozkład odległości miejsca zamieszkania losowo wybranych studentów od uczelni jest rozkładem asymetrycznym prawostronnie. Gdyby asymetria była lewostronna trzeci moment centralny byłby mniejszy od zera. Dla rozkładu symetrycznego z kolei byłby równy 0. 

TRZECI MOMENT CENTRALNY ZESTANDARYZOWANY
Wykorzystując odchylenie standardowe i trzeci moment centralny zestandaryzowany możemy obliczyć trzeci moment centralny zestandaryzowany. 
Trzeci moment centralny zestandaryzowany to trzeci moment centralny podzielony przez odchylenie standardowe podniesione do trzeciej potęgi. Poniżej możecie zobaczyć, jak to obliczyć w Excelu. Uwaga na nawiasy :) 
Interpretacja jest taka sama, jak w przypadku trzeciego momentu centralnego :).

WSPÓŁCZYNNIK ASYMETRII PEARSONA
Ostatnią miarą, którą dzisiaj obliczymy jest współczynnik asymetrii Pearsona. 
W liczniku tej miary znajduje się różnica średniej i dominanty, a w mianowniku odchylenie standardowe.
Zanim obliczyłam współczynnik, dopisałam sobie, ile wynosi wartość dominanty, gdyż wcześniej nie zamieściłam jej w zestawieniu wyników. Na rysunku poniżej macie to zaznaczone na żółto.
Następnie obliczyłam współczynnik.

Współczynnik asymetrii Pearsona należy do przedziału od -3 do 3. Dla asymetrii lewostronnej wartości są ujemne, dla prawostronnej dodatnie. Dodatkowo współczynnik informuje nas o sile asymetrii. Jeśli znajduje się w przedziale od -1 do 0 lub od 0-1 to asymetria jest słaba. Jeśli znajduje się w przedziale -1 do -2 lub 1 do 2, to mamy asymetrię umiarkowaną. Dla wartości z przedziału -2 do -3 i 2-3 asymetria jest silna. 
Dla naszych danych interpretacja brzmi następująco: 
W badanej grupie studentów występuje umiarkowana asymetria prawostronna. 

Jeśli macie pytania, to piszcie śmiało :).