Standardni odklon - Excel in Google Preglednice

Ta vadnica prikazuje, kako uporabljati Excelova funkcija standardnega odklona v Excelu za izračun standardnega odklona za celotno populacijo.

STANDARDNI DEVIATION Pregled funkcije

Funkcija STANDARD DEVIATION Izračuna izračun standardnega odklona za celotno populacijo.

Če želite uporabiti STANDARDNO DEVIATION funkcijo delovnega lista Excel, izberite celico in vnesite:

(Upoštevajte, kako so prikazani vnosi formule)

STANDARDNA DEVIATION funkcija Sintaksa in vhodi:

1 = STDEV (številka1, [številka2],…)

številke- Vrednosti za pridobitev standardne variacije

Kako izračunati standardni odklon v Excelu

Kadar koli se ukvarjate s podatki, boste želeli izvesti nekaj osnovnih testov, ki vam bodo pomagali razumeti. Običajno boste začeli z izračunom povprečja z uporabo funkcije Excel AVERAGE <>.

Tako dobite predstavo o tem, kje je "sredina" podatkov. Od tam boste želeli pogledati, kako razpršeni so podatki okoli te srednje točke. Tu nastopi standardni odklon.

Excel vam ponuja številne funkcije za izračun standardnega odstopanja - STDEV, STDEV.P, STDEV.S in DSTDEV. Do vseh jih bomo prišli, najprej pa se naučimo, kaj je standardni odklon je, točno.

Kaj je standardni odklon?

Standardni odklon vam daje predstavo o tem, kako daleč so vaše podatkovne točke od povprečja. Od 100 vzemite naslednji niz podatkovnih testov:

1 48,49,50,51,52

Povprečje tega niza podatkov je 50 (seštejte vse številke in delite z n, pri čemer je n število vrednosti v obsegu).

Zdaj pa poglejte naslednji niz podatkov:

1 10,25,50,75,90

Povprečje tega niza podatkov je tudi 50 - a oba razpona pripovedujeta zelo različno zgodbo. Če bi uporabili zgolj povprečje, bi lahko mislili, da sta skupini po svoji sposobnosti približno enaki - v povprečju pa sta.

Toda v prvi skupini imamo 5 ljudi, ki so dobili zelo podobne, zelo povprečne ocene. In v drugi skupini smo nekaj visokih letakov uravnovesili nekaj slabih strelcev, z eno osebo na sredini. The širjenje ocene so zelo različne, zaradi česar je tudi vaša interpretacija podatkov zelo različna.

Standardni odklon je merilo tega razmika.

Kako se izračuna standardni odklon

Če želite razumeti, kaj je standardni odklon in kako deluje, lahko pomagate z ročnim pregledom primera. Tako boste vedeli, kaj se dogaja »pod pokrovom«, ko pridemo do Excelovih funkcij, ki jih lahko uporabite.

Če želite izračunati standardni odklon, naredite ta postopek:

1) Izračunajte povprečje

Vzemimo prvi zgornji niz podatkov: 48,49,50,51,52

Povprečje (50) že poznamo, kar sem tukaj potrdil s funkcijo Excel povprečje <>:

1 = POVPREČNO (C4: C8)

2) Odštejte povprečje od vsake vrednosti v nizu podatkov

To sem naredil po naslednji formuli:

1 = C4- $ H $ 4

Naša srednja vrednost je v H4 in sklic na celico sem "zaklenil" tako, da sem pred stolpec in vrstico postavil znake za dolar (s pritiskom na F4). To pomeni, da lahko kopiram formulo v stolpec brez posodabljanja sklica celice.

Rezultat:

Zdaj pa se ustavimo za trenutek. Če pogledate nov stolpec - boste videli, da se številke tukaj seštejejo do nič. Povprečje teh številk je prav tako nič.

Seveda širjenje naših podatkov ne more biti nič - vemo, da obstaja nekaj razlik. Potrebujemo način za predstavitev te variacije, ne da bi se povprečje izkazalo za nič.

3) Poravnajte razlike

To lahko dosežemo s kvadratanjem razlik. Torej, dodajmo nov stolpec in poravnamo številke v stolpcu D:

1 = D4*D4

To izgleda bolje. Zdaj imamo nekaj variacij in količina variacije je odvisna od tega, kako daleč je vsak rezultat od povprečja.

4) Izračunajte variacijo - sredino kvadratnih razlik

Naslednji korak je, da dobimo povprečje teh kvadratnih razlik. Pri izračunu standardnega odstopanja to dejansko obstajata na dva načina.

  • Če uporabljate podatki o prebivalstvu, preprosto vzamete povprečje (seštejte vrednosti in delite z n)
  • Če uporabljate vzorčni podatki, vzamete vrednosti in delite z n-1

Podatki o prebivalstvu pomenijo, da imate "celoten niz" svojih podatkov, na primer imate podatke o vsakem učencu v določenem razredu.

Vzorčni podatki pomenijo, da nimate vseh svojih podatkov, samo vzorec iz večje populacije. Običajno je vaš cilj z vzorčnimi podatki oceniti, kakšna je vrednost v večji populaciji.

Anketa političnega mnenja je dober primer vzorčnih podatkov - raziskovalci recimo anketirajo 1.000 ljudi, da bi dobili predstavo o tem, kaj misli celotna država ali država.

Tukaj nimamo vzorca. Imamo le pet statistično naravnanih družinskih članov, ki želijo izračunati standardni odklon testa, ki so ga vsi opravili. Imamo vse podatkovne točke in ne ocenjujemo večje skupine ljudi. To so podatki o prebivalstvu - zato lahko tukaj vzamemo samo povprečje:

1 = POVPREČNO (E4: E8)

V redu, torej imamo 2. Ta ocena je znana kot "varianca" in je izhodišče za številne statistične teste, vključno s standardnim odstopanjem. Več o varianci si lahko preberete na njeni glavni strani: kako izračunati varianco v Excelu <>.

5) Pridobite kvadratni koren variacije

Naše številke smo prej postavili na kvadrat, kar očitno nekoliko napihne vrednosti. Torej, da bi številko spet uskladili z dejanskimi razlikami točk od povprečja, moramo kvadratni koren rezultat 4. koraka:

1 = SQRT (H4)

In imamo naš rezultat: standardni odklon je 1,414

Ker smo svoje kvadratne številke zakoreninili, je standardni odklon podan v istih enotah kot izvirni podatki. Standardni odklon je torej 1.414 preskusnih točk.

Standardni odklon, ko so podatki bolj razpršeni

Prej smo imeli drugi primer podatkovnega obsega: 10,25,50,75,90

Samo za zabavo, poglejmo, kaj se zgodi, ko izračunamo standardni odklon na teh podatkih:

Vse formule so popolnoma enake kot prej (upoštevajte, da je skupna sredina še vedno 50).

Edino, kar se je spremenilo, je bil razpon rezultatov v stolpcu C. Zdaj pa je naš standardni odklon veliko višji in znaša 29.832 preskusnih točk.

Seveda, ker imamo samo 5 podatkovnih točk, je zelo enostavno ugotoviti, da je razpon rezultatov med obema nizoma različen. Ko pa imate 100 ali 1000 podatkovnih točk, tega ne morete ugotoviti s hitrim skeniranjem podatkov. In ravno zato uporabljamo standardni odklon.

Excelove funkcije za izračun standardnega odstopanja

Zdaj, ko veste, kako deluje standardni odklon, vam ni treba iti skozi ves ta postopek, da bi prišli do standardnega odklona. Uporabite lahko samo eno od vgrajenih funkcij programa Excel.

Excel ima v ta namen več funkcij:

  • P izračuna standardno odstopanje za podatke o prebivalstvu (z uporabo natančne metode, ki smo jo uporabili v zgornjem primeru)
  • S izračuna standardno odstopanje za vzorčne podatke (z uporabo metode n-1, ki smo se je dotaknili prej)
  • STDEV je popolnoma enak STDEV.S. To je starejša funkcija, ki sta jo nadomestili STDEV.S in STDEV.P.
  • STDEVA je zelo podoben STDEV.S, le da pri izračunu vključuje besedilne celice in logične celice (TRUE/FALSE).
  • STDEVPA je zelo podoben STDEV.P, le da pri izračunu vključuje besedilne celice in logične celice (TRUE/FALSE).

Vau, tukaj je veliko možnosti! Naj vas ne ustraši - v veliki večini primerov boste uporabljali bodisi STDEV.P bodisi STDEV.S.

Pojdimo skozi vsakega od teh po vrsti, začenši s STDEV.P, saj je to metoda, ki smo jo pravkar obdelali.

Excel STDEV.P funkcija

STDEV.P izračuna standardno odstopanje za podatke o prebivalstvu. Uporabljate ga tako:

1 = STDEV.P (C4: C8)

V STDEV.P določite en argument: obseg podatkov, za katerega želite izračunati standardni odklon.

To je isti primer, ki smo ga opisali korak za korakom zgoraj, ko smo ročno izračunali standardni odklon. In kot lahko vidite zgoraj, dobimo popolnoma enak rezultat - 1.414.

Opomba STDEV.P prezre vse celice, ki vsebujejo besedilo ali logične vrednosti (TRUE/FALSE). Če jih morate vključiti, uporabite STDEVPA.

Excel STDEV.S funkcija

STDEV.S izračuna standardno odstopanje za vzorčne podatke. Uporabite ga tako:

1 = STDEV.S (C4: C8)

Spet je potreben en argument - obseg podatkov, za katere želite vedeti standardni odklon.

Preden se lotimo primera, se pogovorimo o razliki med STDEV.S in STDEV.P.

Kot smo že razpravljali, je treba STDEV.S uporabiti za vzorčne podatke - kadar so vaši podatki del večjega niza. Predpostavimo torej, da je v našem zgornjem primeru test opravilo več ljudi. Z uporabo teh petih točk želimo oceniti standardni odklon vseh, ki so opravili test. Zdaj uporabljamo vzorčne podatke.

Zdaj se izračun razlikuje od koraka (4) zgoraj, ko izračunamo varianco - povprečje kvadratne razlike vsakega rezultata od skupnega povprečja.

Namesto običajne metode - seštejte vse vrednosti in delite z n, bi povzeli vse vrednosti in delili z n-1:

1 = SUM (E4: E8) / (COUNT (E4: E8) -1)

V tej formuli:

  • SUM dobi vsoto kvadratnih razlik
  • COUNT vrne naš n, od katerega odštejemo 1
  • Nato preprosto delimo naš vsoto z našim n-1

Tokrat je povprečje kvadratnih razlik 2,5 (spomnite se, da je bilo prej 2, zato je nekoliko višje).

Zakaj torej pri obravnavi vzorčnih podatkov delimo z n-1 namesto z n?

Odgovor je precej zapleten in če želite le razumeti svoje podatke, to ni nekaj, kar bi vas res moralo skrbeti. Prepričajte se, da uporabljate STDEV.S za vzorčne podatke in STDEV.P za podatke o populaciji, in vse bo v redu.

Če vas resnično zanima, zakaj, si oglejte glavno stran o tem, kako izračunati varianco v Excelu <>.

V redu, zdaj imamo variacijo za vzorec, zato bi dobili standardni odklon za vzorec, dobili bi samo kvadratni koren variance:

1 = SQRT (H4)

Dobimo 1.581.

STDEV.S za nas izvede vse zgornje izračune in vrne vzorčno standardno odstopanje v samo eno celico. Pa poglejmo, kaj bo nastalo …

1 = STDEV.S (C4: C8)

Ja, spet 1.581.

Excel STDEV funkcija

Excelova funkcija STDEV deluje popolnoma enako kot STDEV.S - to pomeni, da izračuna standardni odklon za vzorec podatkov.

Uporabljate ga na enak način:

1 = STDEV (C4: C8)

Spet dobimo enak rezultat.

Pomembna opomba: STDEV je "združljivostna funkcija", kar v bistvu pomeni, da se je Microsoft znebi. Zaenkrat še deluje, zato bodo vse starejše preglednice še naprej delovale kot običajno. Toda v prihodnjih različicah Excela bi ga Microsoft lahko popolnoma izpustil, zato bi morali uporabiti STDEV.S namesto STDEV, kadar koli je to mogoče.

Excel STDEVA funkcija

STDEVA se uporablja tudi za izračun standardnega odklona za vzorec, vendar ima nekaj pomembnih razlik, o katerih morate vedeti:

  • Vrednosti TRUE se štejejo kot 1
  • Vrednosti FALSE se štejejo kot 0
  • Besedilni nizi se štejejo kot 0

Uporabite ga na naslednji način:

1 = STDEVA (C4: C8)

Še štirje prijatelji in družinski člani so dali svoje rezultate na testu. Ti so prikazani v stolpcu C, stolpec D pa prikazuje, kako STDEVA razlaga te podatke.

Ker se te celice razlagajo kot tako nizke vrednosti, to ustvarja veliko širši razpon med našimi podatki, kot smo videli prej, kar je močno povečalo standardni odklon, zdaj na 26.246.

Funkcija Excel STDEVPA

STDEVPA izračuna standardni odklon za populacijo na enak način kot STDEV.P. V izračun pa vključuje tudi logične vrednosti in besedilne nize, ki se razlagajo na naslednji način:

  • Vrednosti TRUE se štejejo kot 1
  • Vrednosti FALSE se štejejo kot 0
  • Besedilni nizi se štejejo kot 0

Uporabljate ga tako:

1 = STDEVPA (C4: C12)

Filtriranje podatkov pred izračunom standardnega odstopanja

V resničnem svetu ne boste imeli vedno natančnih podatkov, ki jih potrebujete v lepi urejeni tabeli. Pogosto boste imeli veliko preglednico, polno podatkov, ki jo boste morali filtrirati, preden izračunate standardni odklon.

To lahko zelo preprosto storite z Excelovimi funkcijami zbirke podatkov: DSTDEV (za vzorce) in DSTDEVP (za populacije).

Te funkcije vam omogočajo, da ustvarite tabelo meril, v kateri lahko določite vse filtre, ki jih potrebujete. Funkcije te filtre uporabijo zakulisno, preden vrnejo standardno odstopanje. Tako se vam ni treba dotikati samodejnega filtra ali izvleči podatkov na ločen list - DSTDEV in SDTDEVP lahko vse to naredita namesto vas.

Več o glavni funkciji Excel DSTDEV in DSTDEVP na glavni strani <>.

STANDARDNA DEVIATION funkcija v Google Preglednicah

STANDARDNA DEVIATION funkcija v Google Preglednicah deluje popolnoma enako kot v Excelu:

wave wave wave wave wave