Keskihajonta - Excel ja Google Sheets

Tämä opetusohjelma osoittaa, miten Excelin keskihajonta Excelissä laskemaan keskihajonnan koko väestölle.

STANDARD DEVIATION Toimintojen yleiskatsaus

STANDARD DEVIATION -toiminto Laskee keskihajonnan laskemisen koko väestölle.

Jos haluat käyttää STANDARD DEVIATION Excel -työarkkitoimintoa, valitse solu ja kirjoita:

(Huomaa, miten kaavasyötteet näkyvät)

STANDARD DEVIATION -toiminto Syntaksi ja tulot:

1 = STDEV (luku1, [luku2],…)

numeroita- Arvot standardivarianssin saamiseksi

Kuinka laskea keskihajonta Excelissä

Aina kun käsittelet tietoja, sinun kannattaa suorittaa joitain perustestejä, jotka auttavat sinua ymmärtämään ne. Aloitat yleensä laskemalla keskiarvon Excel AVERAGE -toiminnolla <>.

Tämä antaa sinulle käsityksen siitä, missä tietojen "keskikohta" on. Ja sieltä haluat tarkastella, kuinka tiedot ovat hajallaan tämän keskipisteen ympärillä. Tässä tulee keskihajonta.

Excel antaa sinulle useita toimintoja keskihajonnan laskemiseksi - STDEV, STDEV.P, STDEV.S ja DSTDEV. Pääsemme kaikkiin niihin, mutta ensin selvitetään, mikä on keskihajonta On, tarkalleen.

Mikä on keskihajonta?

Keskihajonta antaa sinulle käsityksen siitä, kuinka kaukana datapisteesi ovat keskiarvosta. Ota seuraavat testitulokset 100: sta:

1 48,49,50,51,52

Tämän tietojoukon keskiarvo on 50 (laske kaikki luvut yhteen ja jaa n: llä, missä n on alueen arvojen lukumäärä).

Katso nyt seuraavaa datajoukkoa:

1 10,25,50,75,90

Tämän tietojoukon keskiarvo on myös 50 - mutta nämä kaksi sarjaa kertovat hyvin erilaisen tarinan. Jos käytit vain keskiarvoa, saatat ajatella, että nämä kaksi ryhmää olivat suunnilleen tasavertaisia ​​- ja keskimäärin.

Mutta ensimmäisessä ryhmässä meillä on viisi ihmistä, jotka saivat hyvin samankaltaisia, erittäin keskinkertaisia ​​pisteitä. Ja toisessa ryhmässä pari korkean lentäjää tasapainotti pari huonoa maalintekijää, yksi henkilö keskellä. The levitän pisteistä on hyvin erilainen, joten tulkintasi tiedoista on hyvin erilainen.

Keskihajonta on tämän hajonnan mitta.

Kuinka keskihajonta lasketaan

Jos haluat ymmärtää, mikä on keskihajonta ja miten se toimii, se voi auttaa käsittelemällä esimerkin käsin. Tällä tavalla tiedät, mitä "konepellin alla" tapahtuu, kun pääsemme Excel-toimintoihin, joita voit käyttää.

Voit laskea keskihajonnan seuraavasti:

1) Laske keskiarvo

Otetaan ensimmäinen tietojoukko yllä: 48,49,50,51,52

Tiedämme jo keskiarvon (50), jonka olen vahvistanut täällä Excel AVERAGE -toiminnolla <>:

1 = KESKIMÄÄRÄINEN (C4: C8)

2) Vähennä keskiarvo jokaisesta tietojoukon arvosta

Olen tehnyt tämän seuraavan kaavan avulla:

1 = C4- $ H $ 4

Keskiarvomme on H4, ja olen "lukinnut" soluviittauksen asettamalla dollarimerkit sarakkeen ja rivin eteen (painamalla F4). Tämä tarkoittaa, että voin kopioida kaavan alas sarakkeeseen ilman, että soluviittaus päivittyy.

Lopputulos:

Pysähdytään nyt hetkeksi tähän. Jos katsot uutta saraketta, huomaat, että numerot ovat nolla. Näiden lukujen keskiarvo on myös nolla.

Tietojemme leviäminen ei tietenkään voi olla nolla - tiedämme, että siellä on jonkin verran vaihtelua. Tarvitsemme tavan edustaa tätä vaihtelua ilman, että keskiarvo on nolla.

3) Neliö eroja

Voimme saavuttaa tämän neliöimällä erot. Joten lisätään uusi sarake ja neliöidään numerot D -sarakkeessa:

1 = D4*D4

Tämä näyttää paremmalta. Nyt meillä on jonkin verran vaihtelua, ja vaihtelun määrä liittyy siihen, kuinka kaukana jokainen piste on keskiarvosta.

4) Laske varianssit - neliöerojen keskiarvo

Seuraava askel on saada näiden neliöerojen keskiarvo. Keskihajonnan laskemisessa on itse asiassa kaksi tapaa tehdä tämä.

  • Jos käytät väestötiedot, otat vain keskiarvon (summat arvot ja jaat n: llä)
  • Jos käytät näytetiedot, otat arvot yhteen ja jaat n-1

Väestötiedot tarkoittavat, että sinulla on ”koko joukko” tietojasi, esimerkiksi sinulla on tietoja jokaisesta tietyn luokan oppilasta.

Esimerkkidata tarkoittaa, että sinulla ei ole kaikkia tietojasi, vain näyte suuremmalta populaatiolta. Tyypillisesti tavoite näytetiedoilla on arvioida, mikä arvo on suuremmalla populaatiolla.

Poliittinen mielipidemittaus on hyvä esimerkki otantatiedoista - tutkijat tutkivat esimerkiksi 1000 ihmistä saadakseen käsityksen siitä, mitä koko maa tai valtio ajattelee.

Tässä meillä ei ole näytettä. Meillä on vain viisi tilastollisesti ajattelevaa perheenjäsentä, jotka haluavat laskea kaikkien suorittamansa testin keskihajonnan. Meillä on kaikki datapisteet, emmekä tee arviota suuremmasta ihmisryhmästä. Nämä ovat väestötietoja - joten voimme vain ottaa keskiarvon täältä:

1 = KESKIMÄÄRÄINEN (E4: E8)

OK, joten meillä on 2. Tämä pisteet tunnetaan "varianssina", ja se on perusta monille tilastollisille testeille, mukaan lukien keskihajonta. Voit lukea lisää varianssista sen etusivulta: kuinka varianssit lasketaan Excelissä <>.

5) Hanki varianssin neliöjuuri

Neliöimme numeromme aiemmin, mikä luonnollisesti lisää arvoja hieman. Joten saadaksemme luvun takaisin yhdenmukaiseksi pisteiden todellisten erojen kanssa keskiarvosta, meidän on neliöydettävä vaiheen 4 tulos:

1 = SQRT (H4)

Ja meillä on tulos: keskihajonta on 1,414

Koska olemme juurruttaneet aiemmin neliöidyt numeromme, keskihajonta on annettu samoissa yksiköissä kuin alkuperäiset tiedot. Joten keskihajonta tässä on 1,414 testipistettä.

Keskihajonta, kun tiedot ovat enemmän levinneet

Aiemmin meillä oli toinen esimerkki tietoalueesta: 10,25,50,75,90

Katsotaanpa huvin vuoksi, mitä tapahtuu, kun laskemme näiden tietojen keskihajonnan:

Kaikki kaavat ovat täsmälleen samat kuin ennen (huomaa, että kokonaiskeskiarvo on edelleen 50).

Ainoa asia, joka muuttui, oli sarakkeen C pisteiden leviäminen. Mutta nyt keskihajonta on paljon suurempi, 29,832 testipistettä.

Tietenkin, koska meillä on vain 5 datapistettä, on erittäin helppo nähdä, että pisteiden jakauma on erilainen kahden sarjan välillä. Mutta kun sinulla on 100 tai 1000 datapistettä, et voi kertoa siitä vain skannaamalla tiedot nopeasti. Ja juuri siksi käytämme keskihajontaa.

Excel -toiminnot keskihajonnan laskemiseksi

Nyt kun tiedät, miten keskihajonta toimii, sinun ei tarvitse käydä läpi koko prosessia saavuttaaksesi keskihajonnan. Voit käyttää vain yhtä Excelin sisäänrakennetuista toiminnoista.

Excelissä on useita toimintoja tähän tarkoitukseen:

  • P laskee väestötietojen keskihajonnan (käyttämällä tarkkaa menetelmää, jota käytimme yllä olevassa esimerkissä)
  • S laskee näytetietojen keskihajonnan (käyttämällä aiemmin käsiteltyä n-1-menetelmää)
  • STDEV on täsmälleen sama kuin STDEV.S. Tämä on vanhempi toiminto, joka on korvattu STDEV.S: llä ja STDEV.P: llä.
  • STDEVA on hyvin samankaltainen kuin STDEV.S, paitsi että se sisältää tekstisoluja ja Boolean (TRUE/FALSE) -soluja laskettaessa.
  • STDEVPA on hyvin samanlainen kuin STDEV.P, paitsi että se sisältää tekstisoluja ja Boolean (TRUE/FALSE) -soluja laskettaessa.

Vau, täällä on paljon vaihtoehtoja! Älä pelkää - useimmissa tapauksissa käytät joko STDEV.P tai STDEV.S.

Käydään kukin näistä vuorotellen läpi alkaen STDEV.P: stä, koska juuri tätä menetelmää olemme käyttäneet.

Excel STDEV.P -toiminto

STDEV.P laskee väestötietojen keskihajonnan. Käytät sitä näin:

1 = STDEV.P (C4: C8)

Määrität yhden argumentin STDEV.P: ssä: tietoalueen, jolle haluat laskea keskihajonnan.

Tämä on sama esimerkki, jonka kävimme läpi vaihe vaiheelta edellä laskiessamme keskihajonnan käsin. Ja kuten yllä näet, saamme täsmälleen saman tuloksen - 1.414.

Huomautus STDEV.P jättää huomiotta kaikki solut, jotka sisältävät tekstiä tai Boolen (TRUE/FALSE) -arvoja. Jos haluat sisällyttää nämä, käytä STDEVPA: ta.

Excel STDEV.S -toiminto

STDEV.S laskee näytetietojen keskihajonnan. Käytä sitä näin:

1 = STDEV.S (C4: C8)

Jälleen tarvitaan yksi argumentti - tietoalue, jonka haluat tietää keskihajonnan.

Ennen kuin aloitamme esimerkin, keskustelemme eroa STDEV.S: n ja STDEV.P: n välillä.

Kuten olemme jo keskustelleet, STDEV.S: ää tulisi käyttää näytetiedoissa - kun tietosi ovat osa suurempaa joukkoa. Oletetaan nyt, että yllä olevassa esimerkissämme enemmän ihmisiä oli tehnyt testin. Haluamme arvioida kaikkien testin tehneiden keskihajonnan käyttämällä vain näitä viittä pistettä. Käytämme nyt esimerkkitietoja.

Nyt laskelma eroaa edellä olevasta vaiheesta (4), kun laskemme varianssia - jokaisen pistemäärän neliöeron keskiarvon kokonaiskeskiarvosta.

Sen sijaan, että käytämme normaalia menetelmää - laske kaikki arvot yhteen ja jaa n: llä, summaamme kaikki arvot ja jaamme n-1:

1 = SUMMA (E4: E8) / (LASKE (E4: E8) -1)

Tässä kaavassa:

  • SUM saa neliöerojen summan
  • COUNT palauttaa n: n, josta vähennämme 1
  • Sitten yksinkertaisesti jaamme summan n-1: llämme

Tällä kertaa neliöerojen keskiarvo on 2,5 (saatat muistaa, että se oli 2 aiemmin, joten se on hieman suurempi).

Joten miksi jaamme n-1: llä n: n sijasta käsitellessämme näytetietoja?

Vastaus on melko monimutkainen, ja jos yrität vain käyttää numeroitasi ymmärtääksesi tietojasi, sinun ei todellakaan tarvitse huolehtia itsestäsi. Varmista vain, että käytät STDEV.S -mallitietoja ja STDEV.P -väestötietoja, ja olet kunnossa.

Jos olet todella utelias tietämään miksi, tutustu Excelin varianssin laskemisen etusivulle <>.

OK, joten meillä on näytteen varianssit nyt, joten otoksen keskihajonnan saamiseksi saamme vain varianssin neliöjuuren:

1 = SQRT (H4)

Saamme 1.581.

STDEV.S tekee kaikki yllä olevat laskelmat puolestamme ja palauttaa näytteen keskihajonnan vain yhdessä solussa. Joten katsotaan mitä siitä tulee…

1 = STDEV.S (C4: C8)

Joo, 1.581 taas.

Excel STDEV -toiminto

Excelin STDEV -toiminto toimii täsmälleen samalla tavalla kuin STDEV.S - eli se laskee tietonäytteen keskihajonnan.

Käytät sitä samalla tavalla:

1 = STDEV (C4: C8)

Saamme jälleen saman tuloksen.

Tärkeä muistiinpano: STDEV on "yhteensopivuustoiminto", mikä tarkoittaa pohjimmiltaan sitä, että Microsoft eroaa siitä. Se toimii vielä toistaiseksi, joten kaikki vanhemmat laskentataulukot toimivat normaalisti. Mutta tulevissa Excel -versioissa Microsoft saattaa pudottaa sen kokonaan, joten käytä STDEV.S: ää STDEV: n sijaan aina kun mahdollista.

Excelin STDEVA -toiminto

STDEVA: ta käytetään myös näytteen keskihajonnan laskemiseen, mutta sillä on pari tärkeää eroa, jotka sinun on tiedettävä:

  • TOSI -arvot lasketaan yhdeksi
  • FALSE -arvot lasketaan 0: ksi
  • Tekstimerkkijonot lasketaan 0: ksi

Käytä sitä seuraavasti:

1 = STDEVA (C4: C8)

Neljä muuta ystävää ja perheenjäsentä ovat antaneet testituloksensa. Nämä on esitetty sarakkeessa C, ja sarake D osoittaa, miten STDEVA tulkitsee nämä tiedot.

Koska nämä solut tulkitaan niin pieniksi arvoiksi, tämä luo paljon laajemman leviämisen tietoihimme kuin aiemmin, mikä on lisännyt huomattavasti keskihajontaa, nyt 26.246.

Excelin STDEVPA -toiminto

STDEVPA laskee keskihajonnan populaatiolle samalla tavalla kuin STDEV.P. Se sisältää kuitenkin myös Boolen arvot ja tekstimerkkijonot laskelmiin, jotka tulkitaan seuraavasti:

  • TOSI -arvot lasketaan yhdeksi
  • FALSE -arvot lasketaan 0: ksi
  • Tekstimerkkijonot lasketaan 0: ksi

Käytät sitä näin:

1 = STDEVPA (C4: C12)

Tietojen suodatus ennen keskihajonnan laskemista

Todellisessa maailmassa sinulla ei aina ole tarkkoja tietoja kauniissa siistissä taulukossa. Usein sinulla on suuri laskentataulukko täynnä tietoja, jotka sinun on suodatettava ennen keskihajonnan laskemista.

Voit tehdä tämän erittäin helposti Excelin tietokantatoiminnoilla: DSTDEV (näytteille) ja DSTDEVP (populaatioille).

Näiden toimintojen avulla voit luoda kriteeritaulukon, jossa voit määrittää kaikki tarvitsemasi suodattimet. Toiminnot käyttävät näitä suodattimia kulissien takana ennen keskihajonnan palauttamista. Näin sinun ei tarvitse koskea automaattisuodattimeen tai vetää tietoja erilliselle arkille - DSTDEV ja SDTDEVP voivat tehdä kaiken puolestasi.

Lisätietoja Excel DSTDEV- ja DSTDEVP -toimintojen pääsivulta <>.

STANDARD DEVIATION -toiminto Google Sheetsissä

STANDARD DEVIATION -toiminto toimii täsmälleen samalla tavalla Google Sheetsissä kuin Excelissä:

Tulet auttaa kehittämään sivuston jakaminen sivu ystävillesi

wave wave wave wave wave