Success is the ability to go from one failure to another with no loss of enthusiasm. – Winston Churchill

lauantai 5. tammikuuta 2013

Videopostaus: Näin teet tilastollisen testin

Tässä siis luvattu postaus siitä, miten itse lasken testiä vaativan laskun. Muilla on varmasti parempia ja toimivampia tapoja kuin mulla, ja jakakaa ihmeessä niitä, jos huomasitte, että jotain oleellista jäi puuttumaan! Toivottavasti joku edes sai jotain irti tästä, vähän jänskätti tehdä tätä. :D Saatiin kuitenkin koko homma kerralla purkkiin ja halusin, että video on luonnollinen eikä ulkoa opeteltu robottimössö.




Laitan tähän vielä kirjallisesti, missä järjestyksessä lasken testin, jos(kun) joku ei saa mun höpötyksestä tolkkua:

1. Satunnaismuuttujan määrittely

- Mikä X on? Mitä kysytään?

(2. Satunnaismuuttujan jakauma)

- Mitä jakaumaa X noudattaa?
  - mitta-asteikko?
  - otoskoko?
- PERUSTELE!
  - esim. miksi normaalijakaumaoletus voimassa?

3. Parametrit ja estimaatit

- Mitä tiedetään jo perusjoukosta/otoksesta?
- Mitä halutaan tietää?

4. Hypoteesit

- Asetetaan nolla- ja vaihtoehtoinen hypoteesi

5. Testin valinta

- Tee valinta em. tietojen perusteella (otoskoko, mitta-asteikko...)
- PERUSTELE (miksi juuri tämä testi?)
- yksi- vai kaksisuuntainen?

6. Kaava

- Kirjoita kaava aina ensin!
  - löytyykö tehtävänannosta jokaisen kirjaimen/symbolin kohdalle numero?

7. Laskeminen

- Kaikki välivaiheet näkyviin
- Tarkat arvot mukana laskun läpi, lopuksi pyöristys
- ÄLÄ KÄYTÄ OMAN LASKIMEN HIENOUKSIA!! Laske palikanomaisesti

8. Johtopäätökset

- Kirjallisesti
- Mainitse myös merkitsevyystaso (väh. 5%)



Tässä oli nyt joitakin asioita, joita kannattaisi pohdiskella laskua tehdessä. Kuinka teillä hommat etenee? :) Mulla on tarkoitus ens keskiviikkoon mennessä saada HoloPulkin testit laskettua ja sitten katsella Nummenmaan vastaavia. Matikkakin alkaa taas silloin. On muuten ihan kivaakin laskea iltaisin ja mässäillä suklaan kanssa, suosittelen!


Päättäväisyydellä,
Embe

19 kommenttia:

  1. Kirjoittaja on poistanut tämän kommentin.

    VastaaPoista
  2. Jee, tää selvens jo paljon, vaikken ookaan vielä tehtävissä :) Mut sain lisää pontta siihen, että kunhan tajuan noi, ni ehkä mulla ei oo niin paljon hätää...

    Tää voi olla turha, tyhmä ja vaikea vastata-kysymys, mutta miten toi "hylkäämisalue" määrittyy? Miksei se ookaan esim. tehtävässä sen -3,08 oikealla puolella? Tähän on varmaan tosi iisi vastaus, mutta kysynpä vaan. Hirveän vaikea koskaan lukea/laskea, jos en tiedä miksi joku asia on niin kuin

    VastaaPoista
    Vastaukset
    1. Se on tavallaan vaan siellä normaalijakauman toisessa hännässä sillon, kun on yksisuuntainen testi. :) Molempien häntien jämät otetaan mukaan, kun on kaksisuuntainen. Eli jos kaksisuuntaisessa testissä olisi ollut kriittisenä arvona toi 3,08 niin silloin sitä suuremmat ja vastaavasti -3,08 pienemmät arvot sijaitsevat hylkäämisalueella. :) Selvensikö yhtään? :D

      Poista
    2. Aa aivan joo! kyllä mä nyt tajusin :D hämmentävää, en oo tajunnu viel kertaakaa ajatella noita tolleen kuvana! tässä sen huomaa, miten tärkee tää vertaistuki on :D Tähän videoon palataan vielä.....

      Poista
    3. Mua kanssa kuva autto oivaltamaan yksi- ja kaksisuuntaisen eron. Ja kyllä noita on käännelty ja väännelty ja vatvottu ennen kuin asia on menny perille. :D

      Poista
    4. Nojoo, nyt pääsin noihin jakaumasta riippumattomiin ja... noh, tässä on vielä aikaa :)

      Tuli muuten mullekin mieleen, että käytkö koskaan Helsingissä? En oikein tunne ketään, joka hakisi psykalle, ois tosi kiva jos vois jo ennen sitä huhtikuuta ku mul alkaa valmennuskurssi, ni päästä pähkäilemään näitä... Mä en oikein käy missään muualla, eli mulle tuo Tampere on melko mahdoton :( Toisaalta, onhan myös skype olemassa... HMM! ;)

      Poista
    5. Mä ravaan siellä suorastaan säännöllisesti, kun urokseni asuu Espoossa. :) Seuraavan kerran oon siellä pe-ma!

      Poista
    6. Voih mikä sattuma! Saiskohan sua tänne mun osotteeseen joksikin hetkeksi, raaskitko irrottaa? :D Mä voisin ottaa facebookissa suhun yhteyttä, mikäli löydän sut! jatkoa seuraa ;)

      Poista
    7. Yhteydenotto ja ajan varastaminen hyväksytty! Faboon vain ystävyyspyyntöstä

      Poista
  3. Kiva video! Oot mukavannäköinen ja sulla on tosi selkeät metodit. Ite katon noi normaalijakaumaan liittyvät kriittiset arvot t-jakaumaan liittyvistä kriittisista arvoista kun vapausasteita on ääretön määrä. Tuntuu kuitenkin et toi sun tapa vois selventää omaa ajattelua paremmin kun en vielä ole selkäytimeen saanut merkitsevyystason ideaa... Asuttaispa vähän lähempänä toisiamme olis kiva nähdä ja laskea ja pähkäillä yhdessä näitä!

    Noora

    p.s. Sä näytät jo ihan psykologilta esim. joku tutkija tms.

    VastaaPoista
    Vastaukset
    1. Missäs päin sit ite majailet? :) Tykkäisin myös pohdiskella jonkun muun kuin kuivan HoloPulkin kanssa, joka ei halua tehdä yhteistyötä. :( Ja voi kiitos, sun kommentti pelasti mun supertylsän illan, kun etin Mann-Whitneyn testiä SPSS:stä..

      Poista
  4. Mä asun Turussa. Toisinaan käyn Tampereella mun siskoa moikkaamassa. Ja jos nyt keväällä lähden taas sinnepäin reissaamaan niin mielelläni moikkaisin suakin!Laitoin sulle muuten fb-kaverikutsun, toivottavasti on ok, aina voit kieltäytyä :)

    VastaaPoista
  5. No en ois kyllä enää tunnistanu sua pelkän äänen perusteella :D + En tajunnu yhtään mitään!! :D

    VastaaPoista
  6. Hei! Testin valinta tuottaa vielä päänvaivaa. :) Eli ymmärtääkseni välimatka- tai suhdeasteikolliset muuttujat liittyvät parametrisiin testeihin ja luokittelu- tai järjestysasteikolliset muuttujat epäparametrisiin testeihin. Ja että t-testi koskee pieniä (<30) otoksia, ja Z-testi isoja (>30) otoksia. Mieleeni on jäänyt myös jako diskreetteihin ja jatkuviin muuttujiin: jatkuvat muuttuvat noudattavat normaalijakaumaa isoilla otoksilla (>30), Studentin t-jakaumaa pienillä otoksilla (<30) tai sitten khii toiseen -jakaumaa ja diskreetit muuttujat binomia tai Poissonia. Mäkin aloitan tehtävän niin, että nimeän satunnaismuuttujan, mutta sen jälkeen tahtoo mennä lankaan, kun pitäisi päättää testistä: en osaa päättää, valitsenko testin asteikon mukaan vai sen mukaan, onko kyseessä jatkuva vai diskreetti muuttuja :) Ylläolevassa tehtävässä pitäisin tulitikkujen määrää diskreettinä muuttujana, joka voi saada vain kokonaisia arvoja (tyyliin on 1 tai 2 tulitikkua, mutta tuskin 1,2 tulitikkua), minkä perusteella muuttuja ei noudattaisi normaalijakaumaa eikä voida tehdä Z-testiä. Taas kun mietin tulitikkujen määrää muuttujana asteikon kannalta, se noudattaa kaiketi suhdeasteikkoa, minkä (plus otoskoon) perusteella voisi tehdä Z-testin. Missä kohti menen vikaan? :) Normaalijakaumaoletus on siis vielä hieman hakusessa. :)

    VastaaPoista
    Vastaukset
    1. Moips! Oot aivan oikeilla jäljillä testien valinnan suhteen. Kyseisessä tulitikkutehtävässä kerrotaan populaation keskiarvo ja keskihajonta, joiden perusteella voidaan käyttää z-testiä, vaikka otoskoko olisi pieni. Tämä on mainittu HoloPulkissa kappaleen 7 lopussa, tosin vain yhdessä lauseessa. Kannattaa mielummin valita testi mitta-asteikon mukaan, kuten pk-kirjassa opetetaan, koska silloin ei mene solmuun muuttujien kanssa. :) Oot kyllä ihan oikeessa tossa, että tulitikkuhomma on sinänsä diskreetti, koska se voi saada vain tiettyjä ja kokonaisia arvoja. Tehtävässä kyllä muistaakseni sanotaan, että tulitikkujen määrä noudattaa normaalijakaumaa ja n>30, niin z-testi tehdään sen perusteella. :) Lyhyesti siis mitta-asteikon perusteella tehtävä valinta on parempi (ja selkeämpi) vaihtoehto pääsykokeiden kannalta.

      Poista
    2. Hienoa, kiitos paljon! Minulla meni testitehtävät hyvin siihen saakka, kun käytin perusteena mittta-asteikkoa, mutta sitten jossain vaiheessa mieleeni pulpahti diskreetti/jatkuva muuttuja -kysymys, ja sen jälkeen alkoi mennä vaikeaksi. :)

      Poista
  7. Miten suosittelisit tämän tehtävän tekoa s.222teht.25? Siinä pitää laskea tuo keskihajonta,niin itsellä ainaki tulee virheitä koska kuitenkin suht suuri aineisto.Kannattaako tuossa tehdä jotain taulukkoa vai onko helpompi laskea kaikki yhteen pötköön ja olla vain tarkkana?:D

    VastaaPoista
    Vastaukset
    1. Moips! Keskihajonnasta tulee tosiaan aika hirviömäinen. Jos haluaa tehdä taulukon, niin kannattaa laittaa sarakkeisiin: x | keskiarvo | x - keskiarvo | (x - keskiarvo)^2. Näin pääsee ehkä vähän helpommalla ja sitten viimeisen sarakkeen vain summaa alas. :) Voit tehdä taulukon myös vaikka kymmenen sarjoissa tms. Muistat vai sitten jakaa loppusumman n-1:llä ja ottaa koko hommasta neliöjuuren! Vaihtoehtoisesti jos koet osaavasi keskihajonnas silmät kiinni unissasi väärinpäin, niin voi tuollaisen ison aineiston hajonnan laskea myös esim. excelillä. :)

      Poista

Kommentit ja muu keskustelu tervetullutta! Ehdotuksia, ideoita, risuja, ruusuja, mitä tahansa. :)