Onko datassasi tilastollisesti merkitseviä eroja?
Kuka tahansa voi nähdä kahden luvun välisen eron, mutta sen selvittäminen, onko kyseinen ero tilastollisesti merkitsevä, vaatii joskus hieman vaivaa.
Sanotaan vaikka, että olet toteuttanut yrityksesi puolesta asiakastyytyväisyyttä mittaavan kyselytutkimuksen ja olet saanut runsaasti analysoitavia tuloksia. Kysyt esimieheltäsi, mitä sinun pitäisi analysoida ensimmäiseksi, ja hän sanoo haluavansa tietää, vastaavatko miehet ja naiset eri tavoilla. Antavatko miehet esimerkiksi yrityksellesi keskimäärin alhaisemman Net Promoter Score℠ (NPS) ‑tuloksen kuin naiset?
Kun sukellat syvemmälle dataan, näet että miespuolisten vastaajien antama arvio oli keskimäärin 9, kun taas naispuolisten vastaajien antama pistemäärä oli keskimäärin 12. Miten tiedät onko ero 9:n ja 12:n välillä tilastollisesti merkitsevä? Tässä vaiheessa kuvaan astuu t-testi.
T-testi on keino määrittää, onko kahden luvun välinen ero tilastollisesti merkitsevä. T-testejä on erityyppisiä, ja kunkin tulos lasketaan eri kaavalla.
1. Yhden otoksen t-testi: tämän testin avulla tarkastellaan sitä, eroaako yhden joukon datan (tässä tapauksessa kokonais-NPS) keskiarvo (eli keskiluku) määrittämästäsi arvosta.
Esimerkki: yrityksesi tavoite on saada tulokseksi NPS-pistemäärä, joka on merkittävästi korkeampi kuin toimialan standardi 5. Yrityksesi viimeisimmässä kyselytutkimuksessa NPS-pistemääräksi saatiin 10. Jos NPS on 10, onko se merkittävästi korkeampi kuin toimialan standardi eli 5?
2. Kahden otoksen t-testi: tämän testin avulla selvitetään, eroavatko kahden itsenäisen joukon keskiarvot merkitsevästi toisistaan.
Esimerkki: hypoteesisi on, että miesten yrityksellesi antama NPS-pistemäärä on alhaisempi kuin naisten antama. Miespuolisten vastaajien antamien NPS-pisteiden keskiarvo on 9, kun taas vastaava luku naisten suhteen on 12. Eroaako 9 merkittävästi luvusta 12?
3. T-testi parivertailuille: tämä testi on tarkoitettu tilanteisiin, joissa pyydät yhtä vastaajajoukkoa vastaamaan samaan kyselytutkimukseen kaksi kertaa. T-testi parivertailuille kertoo, muuttuiko keskiarvo ensimmäisen ja toisen vastauskerran välillä.
Esimerkki: pyysit samaa asiakasjoukkoa vastaamaan kyselytutkimukseen kaksi kertaa, ensimmäisen kerran huhtikuussa ja toisen kerran toukokuussa sen jälkeen, kun he olivat nähneet yritystäsi koskevan mainoksen. Muuttuiko yrityksesi NPS sen jälkeen, kun asiakkaat olivat nähneet mainoksen?
Huomaa, että vaikka t-testit voivat kertoa, onko jokin ero tilastollisesti merkitsevä, sinun itsesi on määritettävä onko kyseisellä erolla merkitystä. Pienet erot voivat olla tilastollisesti erilaisia, jos otoskoko on tarpeeksi suuri.
T-testi suoritetaan neljässä vaiheessa:
1. Laske t-tunnusluku:
kunkin erityyppisen t-testin t-tunnusluku lasketaan erilaisen kaavan mukaan (löydät kaikki kolme kaavaa, kun vierität sivun alalaitaan).
2. Laske vapausasteet:
Vapausasteet tarkoittavat niiden tapojen määrää, jolla keskiarvo voi vaihdella. Tässä tapauksessa vapausasteet ovat NPS-pisteiden lukumäärä, joka voi esiintyä jossakin tietyssä vastaajajoukossa. T-tunnusluvun tavoin vapausasteiden kaava vaihtelee suorittamasi t-testin tyypin mukaan.
3. Määritä kriittinen arvo:
kriittinen arvo on kynnys, jossa kahden luvun välistä eroa pidetään tilastollisesti merkitsevänä.
4. Vertaa t-tunnusluvun itseisarvoa kriittiseen arvoon:
Jos t-tunnusluku on suurempi kuin kriittinen arvo, eri on merkitsevä. Jos t-tunnusluku on pienempi, näillä kahdella luvulla ei ole eroa tilastollisesta näkökulmasta katsottuna.
Käymme nyt läpi esimerkin alusta loppuun: Hypoteesisi on, että miehet antavat yrityksellesi alhaisempia NPS-pisteitä kuin naiset. Miehiltä saatujen NPS-pisteiden keskiluku on 9, ja vastaava luku naisilta on 12. Onko lukujen 9 ja 12 välinen ero tilastollisesti merkitsevä? Tämä on esimerkki kahden otoksen t-testin käyttötapauksesta.
1. Laske t-tunnusluku:
Alla on kahden otoksen t-testin kaava, jossa
2. Laske vapausasteet:
Tätä kaavaa on käytettävä vapausasteiden määrittämiseen kahden otoksen t-testeissä. Muun tyyppisten testien kaavat löytyvät alta.
3. Määritä kriittinen arvo:
Tämän taulukon mukaan kriittinen arvo on 2,02 kaksisuuntaisessa testissä, jossa alfataso on 0,05, kun vapausasteita on 41. Huomaa että useimmat analyytikot käyttävät kaksisuuntaista testiä yksisuuntaisen sijasta, koska se on maltillisempi. Saat lisätietoja yksi- ja kaksisuuntaisten testien eroista katsomalla tämän Khan Academyn videon.
4. Vertaa t-tunnusluvun itseisarvoa kriittiseen arvoon:
Koska t-tunnusluvun itseisarvo on 0,86, mikä ei ole suurempi kuin kriittinen arvo 2,02, voit päätellä, että miehet eivät anna merkittävästi alhaisempia NPS-pisteitä kuin naiset.
Luultavimmin teet t-testit taulukkolaskentaohjelmassa tai tilasto-ohjelmistossa (kuten Excel tai SPSS). Jos kuitenkin haluat tehdä laskutoimitukset käsin, kahden muun tyyppisen t-testin kaavat ovat alla.
Jos päätät (useimpien muiden tavoin) tehdä t-testit taulukkolaskentaohjelmassa tai tilasto-ohjelmistossa, prosessi on hieman erilainen. Sen sijaan, että t-tunnuslukua verrattaisiin kriittiseen arvoon, useimmat ohjelmat laskevat p-arvon, jota ne vertaavat alfatasoon (useimmin käytetty taso on 0,05). Tässä tapauksessa alfatasoa alhaisempi p-arvo näyttää, että numerot eroavat merkitsevästi toisistaan.
Net Promoter Score on Bain & Company, Inc:n, Satmetrix Systems, Inc:n ja F. Reichheldin tavaramerkki.
Työkalumme on suunniteltu hyödyntämään palautetta työtehtävässäsi tai toimialallasi.
Kysymällä irtisanoutumishaastattelussa juuri oikeat kysymykset voit vähentää työvoiman vaihtuvuutta. Aloita jo tänään työntekijälomaketyökalun ja -mallien avulla.
Hanki tarvitsemasi luvat muokattavan suostumuslomakkeen avulla. Rekisteröidy ilmaiseksi jo tänään ja laadi lomakkeita suostumuslomakemalliemme avulla.
Luo ja muokkaa pyyntölomakkeita helposti ja kerää pyyntöjä työntekijöiltä ja asiakkailta. Asiantuntijoiden tekemillä malleilla pääset alkuun hetkessä.