Mi az eltérés? Egy diszkrét valószínűségi változó diszperziója. Szórás

.

Ezzel szemben, ha egy nem negatív a.e. olyan funkciót, hogy , akkor van egy abszolút folytonos valószínűségi mérték azon, hogy ez a sűrűsége.

    A mérték cseréje a Lebesgue-integrálban:

,

ahol az a Borel-függvény, amely integrálható a valószínűségi mértékhez képest.

Diszperzió, a diszperzió típusai és tulajdonságai A diszperzió fogalma

Diszperzió a statisztikákban a jellemző egyedi értékeinek szórása a számtani átlagtól négyzetesen. A kezdeti adatoktól függően az egyszerű és súlyozott varianciaképletekkel határozzuk meg:

1. Egyszerű szórás(csoportosítatlan adatok esetén) a következő képlettel számítható ki:

2. Súlyozott szórás (variációs sorozatokhoz):

ahol n a gyakoriság (az X faktor megismételhetősége)

Példa a variancia megállapítására

Ez az oldal egy szabványos példát ír le a variancia megállapítására, és megtekinthet más problémákat is

1. példa: Csoport, csoportátlag, csoportközi és teljes variancia meghatározása

2. példa A variancia és a variációs együttható megkeresése egy csoportosítási táblázatban

3. példa Variancia keresése diszkrét sorozatban

4. példa: A következő adatok állnak rendelkezésre egy 20 fős levelező hallgatóból álló csoportra. Szükséges a jellemző eloszlásának intervallumsorozat megalkotása, a jellemző átlagos értékének kiszámítása és szórásának tanulmányozása.

Építsünk intervallum-csoportosítást. Határozzuk meg az intervallum tartományát a képlet segítségével:

ahol X max a csoportosítási jellemző maximális értéke; X min – a csoportosítási jellemző minimális értéke; n – intervallumok száma:

Elfogadjuk, hogy n=5. A lépés a következő: h = (192 - 159)/ 5 = 6,6

Hozzunk létre egy intervallum csoportosítást

A további számításokhoz készítünk egy segédtáblát:

X"i – az intervallum közepe. (például az intervallum közepe 159 – 165,6 = 162,3)

A tanulók átlagos magasságát a súlyozott számtani átlag képlettel határozzuk meg:

Határozzuk meg az eltérést a képlet segítségével:

A képlet a következőképpen alakítható át:

Ebből a képletből az következik variancia egyenlő az opciók négyzeteinek átlaga és a négyzet és az átlag közötti különbség.

Diszperzió a variációs sorozatokban egyenlő intervallumokkal a momentumok módszerével a következő módon számítható ki a diszperzió második tulajdonságával (az összes lehetőséget elosztva az intervallum értékével). Variancia meghatározása, a momentumok módszerével számítva, a következő képlet segítségével kevésbé munkaigényes:

ahol i az intervallum értéke; A egy hagyományos nulla, amelyhez kényelmes az intervallum közepét használni a legmagasabb frekvenciával; m1 az elsőrendű nyomaték négyzete; m2 - másodrendű pillanat

Alternatív tulajdonságvariancia (ha egy statisztikai sokaságban egy jellemző úgy változik, hogy csak két, egymást kizáró lehetőség van, akkor ezt a variabilitást alternatívnak nevezzük) a következő képlettel számítható:

Ha q = 1-p-t behelyettesítjük ebbe a diszperziós képletbe, a következőt kapjuk:

A variancia típusai

Teljes variancia egy jellemző változását méri a teljes populáció egészében, minden olyan tényező hatására, amely ezt a változást okozza. Ez egyenlő egy karakterisztikus x egyedi értékeinek az x általános átlagértékétől való eltérésének középnégyzetével, és egyszerű varianciaként vagy súlyozott eltérésként definiálható.

Csoporton belüli variancia véletlenszerű variációt jellemzi, azaz. a változás egy része, amely a fel nem számolt tényezők hatásából adódik, és nem függ a csoport alapját képező faktor-attribútumtól. Ez a diszperzió megegyezik az X csoporton belüli attribútum egyedi értékeinek a csoport számtani átlagától való eltérésének átlagos négyzetével, és kiszámítható egyszerű diszperzióként vagy súlyozott diszperzióként.

És így, csoporton belüli varianciamérők egy tulajdonság változása egy csoporton belül, és a következő képlet határozza meg:

ahol xi a csoport átlaga; ni a csoportban lévő egységek száma.

Például a csoporton belüli eltérések, amelyeket meg kell határozni a dolgozók képzettségének a munkatermelékenység szintjére gyakorolt ​​hatásának tanulmányozása során egy műhelyben, az egyes csoportokban a kibocsátás változásait mutatják, amelyeket minden lehetséges tényező okoz (a berendezések műszaki állapota, szerszámok és anyagok, a dolgozók életkora, munkaintenzitása, stb.), kivéve a képzettségi kategória eltéréseit (egy csoporton belül minden dolgozó azonos képzettséggel rendelkezik).

A csoporton belüli szórások átlaga a véletlenszerű variációt tükrözi, vagyis a variációnak azt a részét, amely a csoportosítási tényező kivételével minden más tényező hatására következett be. Kiszámítása a következő képlet segítségével történik:

Csoportközi variancia a kapott jellemző szisztematikus változását jellemzi, amely a csoport alapját képező faktor-attribútum befolyásának köszönhető. Ez egyenlő a csoportátlagok általános átlagtól való eltéréseinek négyzetes átlagával. A csoportok közötti variancia kiszámítása a következő képlettel történik:

A statisztikai eltérések fő általánosító mutatói a diszperziók és a szórások.

Diszperzió ezt számtani átlaga az egyes jellemző értékek négyzetes eltérései az összátlagtól. A szórást általában az eltérések átlagos négyzetének nevezik, és  2-vel jelöljük. A szórást a forrásadatoktól függően az egyszerű vagy súlyozott számtani átlag segítségével lehet kiszámítani:

 súlyozatlan (egyszerű) variancia;

 szórással súlyozott.

Szórás ez az abszolút méretek általánosító jellemzője variációk jelek összesítve. Ugyanazokban a mértékegységekben van kifejezve, mint az attribútum (méterben, tonnában, százalékban, hektárban stb.).

A szórás a variancia négyzetgyöke, és -val jelöljük:

 súlyozatlan szórás;

 súlyozott szórás.

A szórás az átlag megbízhatóságának mértéke. Minél kisebb a szórás, annál jobban tükrözi a számtani átlag a teljes reprezentált sokaságot.

A szórás számítását a szórás számítása előzi meg.

A súlyozott variancia kiszámításának eljárása a következő:

1) határozza meg a súlyozott számtani átlagot:

2) számítsa ki az opciók átlagtól való eltérését:

3) négyzetre emelje az egyes opciók átlagtól való eltérését:

4) szorozd meg az eltérések négyzetét a súlyokkal (gyakoriságokkal):

5) foglalja össze az eredményül kapott termékeket:

6) a kapott összeget elosztjuk a súlyok összegével:

2.1. példa

Számítsuk ki a súlyozott számtani átlagot:

Az átlagtól való eltérések értékeit és azok négyzeteit a táblázat tartalmazza. Határozzuk meg az eltérést:

A szórása egyenlő lesz:

Ha a forrásadatokat intervallum formájában mutatjuk be terjesztési sorozat , akkor először meg kell határoznia az attribútum diszkrét értékét, majd alkalmaznia kell a leírt módszert.

Példa 2.2

Mutassuk meg egy intervallumsorozat varianciaszámítását a kolhoz vetésterületének búzatermés szerinti megoszlására vonatkozó adatok felhasználásával.

A számtani átlag a következő:

Számítsuk ki a szórást:

6.3. Varianciaszámítás egyedi adatokon alapuló képlet segítségével

Számítástechnika eltérések összetett, és nagy lehetőségek és frekvenciák mellett nehézkes lehet. A számítások leegyszerűsíthetők a diszperzió tulajdonságaival.

A diszperzió a következő tulajdonságokkal rendelkezik.

1. Egy változó jellemző súlyának (frekvenciájának) meghatározott számú csökkentése vagy növelése nem változtatja meg a diszperziót.

2. Csökkentse vagy növelje a jellemző minden értékét azonos állandó értékkel A nem változtatja meg a diszperziót.

3. Csökkentse vagy növelje egy jellemző értékét meghatározott számú alkalommal k rendre csökkenti vagy növeli a szórást k 2 alkalommal szórás  be k egyszer.

4. Egy karakterisztika tetszőleges értékhez viszonyított szórása mindig nagyobb, mint az átlagos és tetszőleges értékek közötti különbség négyzetenkénti számtani átlagához viszonyított szórása:

Ha A 0, akkor a következő egyenlőséghez jutunk:

vagyis a karakterisztika szórása megegyezik a jellemző értékek középnégyzete és az átlag négyzete közötti különbséggel.

Mindegyik tulajdonság önállóan vagy másokkal kombinálva is használható a variancia számításakor.

A variancia kiszámításának folyamata egyszerű:

1) határozza meg számtani átlaga :

2) négyzetre emelje a számtani átlagot:

3) négyzetre emelje a sorozat egyes változatainak eltérését:

x én 2 .

4) keresse meg az opciók négyzetösszegét:

5) osszuk el az opciók négyzeteinek összegét a számukkal, azaz határozzuk meg az átlagos négyzetet:

6) határozza meg a különbséget a jellemző négyzete és az átlag négyzete között:

Példa 3.1 A következő adatok állnak rendelkezésre a dolgozók termelékenységéről:

Végezzük el a következő számításokat:

Megoldás.

A valószínűségi változók értékeinek szórásának mértékeként használjuk diszperzió

A diszperzió (a diszperzió szó jelentése „szórás”) az valószínűségi változók értékeinek szóródásának mértéke matematikai elvárásához képest. A diszperzió egy valószínűségi változó matematikai elvárásától való négyzetes eltérésének matematikai elvárása

Ha a valószínűségi változó diszkrét végtelen, de megszámlálható értékkészlettel, akkor

ha az egyenlőség jobb oldalán lévő sorozatok összefolynak.

A diszperzió tulajdonságai.

  • 1. Egy állandó érték varianciája nulla
  • 2. A valószínűségi változók összegének szórása egyenlő a szórások összegével
  • 3. A négyzetes diszperzió előjeléből kivehető az állandó tényező

A valószínűségi változók különbségének szórása egyenlő a szórások összegével

Ez a tulajdonság a második és harmadik tulajdonság következménye. Az eltérések csak összeadhatók.

Célszerű a diszperziót olyan képlettel számítani, amely könnyen meghatározható a diszperzió tulajdonságaival

A szórás mindig pozitív.

A szórás megvan dimenzió magának a valószínűségi változónak a négyzetes dimenziója, ami nem mindig kényelmes. Ezért a mennyiség

Szórás egy valószínűségi változó (szórása vagy standardja) a varianciája négyzetgyökének számtani értéke

Dobj két érmét 2 és 5 rubel címletben. Ha az érme címerként landol, akkor nulla pontot adunk, ha pedig számként, akkor az érme címletével megegyező számú pontot. Határozza meg a pontok számának matematikai elvárását és szórását!

Megoldás. Először keressük meg az X valószínűségi változó eloszlását - a pontok számát. Minden kombináció - (2;5), (2;0), (0;5), (0;0) - egyformán valószínű, és az eloszlási törvény:

Várható érték:

Az eltérést a képlet segítségével találjuk meg

miért számoljuk

2. példa

Ismeretlen valószínűség keresése R, valószínűségi eloszlási táblával meghatározott diszkrét valószínűségi változó matematikai elvárása és varianciája

Megtaláljuk a matematikai elvárást és szórást:

M(x) = 00,0081 + 10,0756 + 20,2646 + 3 0,4116 + +40,2401=2,8

A diszperzió kiszámításához a (19.4) képletet használjuk.

D(x) = 020 ,0081 + 120,0756 + 220,2646 + 320,4116 + 420,2401 - 2,82 = 8,68 -

3. példa Két egyformán erős atléta rendez egy tornát, amely vagy egyikük első győzelméig, vagy öt meccsig tart. Annak a valószínűsége, hogy minden versenyző nyer egy meccset, 0,3, a döntetlen esélye pedig 0,4. Keresse meg az elosztási törvényt, a lejátszott játékok számának matematikai elvárását és szórását.

Megoldás. Véletlenszerű érték x- a lejátszott játékok száma 1-től 5-ig terjed, azaz.

Határozzuk meg a mérkőzés befejezésének valószínűségét. A mérkőzés az első szettben ér véget, ha valamelyik sportolójuk nyer. A nyerési valószínűség az

R(1) = 0,3+0,3 =0,6.

Ha döntetlen született (a döntetlen valószínűsége 1 - 0,6 = 0,4), akkor a mérkőzés folytatódik. A mérkőzés a második játszmában ér véget, ha az első döntetlen lett, és valaki megnyerte a másodikat. Valószínűség

R(2) = 0,4 0,6=0,24.

Hasonlóképpen, a mérkőzés a harmadik játszmában véget ér, ha két döntetlen van egymás után, és ismét valaki nyer

R(3) = 0,4 0,4 0,6 = 0,096. R(4)= 0,4 0,4 0,4 0,6=0,0384.

Az ötödik játék minden változatban az utolsó.

R(5)= 1 - (R(1)+R(2)+R(3)+R(4)) = 0,0256.

Tegyünk mindent egy táblázatba. A „nyert játékok száma” valószínűségi változó eloszlási törvénye a következő formában van

Várható érték

Az eltérést a (19.4) képlet segítségével számítjuk ki.

Szabványos diszkrét eloszlások.

Binomiális eloszlás. Valósítsuk meg Bernoulli kísérleti sémáját: n azonos független kísérletek, amelyek mindegyikében az esemény Aállandó valószínűséggel megjelenhet pés nem nagy valószínűséggel fog megjelenni

(lásd a 18. előadást).

Az esemény előfordulásának száma A ezekben n kísérletekben van egy diszkrét valószínűségi változó x, melynek lehetséges értékei:

0; 1; 2; ... ;m; ... ; n.

Az előfordulás valószínűsége m események A egy adott sorozatában n Az ilyen valószínűségi változókkal való kísérletezés és eloszlási törvénye a Bernoulli-formula adja meg (lásd a 18. előadást)

Valószínűségi változó numerikus jellemzői x a binomiális törvény szerint elosztva:

Ha n nagy (), akkor, amikor a (19.6) képlet bekerül a képletbe

és a táblázatos Gauss-függvény (a Gauss-függvény értéktáblázata a 18. előadás végén található).

A gyakorlatban gyakran nem maga az előfordulás valószínűsége a fontos. m eseményeket A egy adott sorozatban től n kísérletek, és annak valószínűsége, hogy az esemény A nem kevésbé fog megjelenni

szor és legfeljebb alkalommal, azaz annak a valószínűsége, hogy X felveszi az értékeket

Ehhez összegeznünk kell a valószínűségeket

Ha n nagy (), akkor, amikor a (19.9) képlet közelítő képletté változik

táblázatos függvény. A táblázatok a 18. előadás végén találhatók.

A táblázatok használatakor figyelembe kell venni azt

1. példa. Egy kereszteződéshez közeledő autó a három út bármelyikén haladhat tovább: A, B vagy C azonos valószínűséggel. Öt autó közeledik a kereszteződéshez. Határozza meg az A úton közlekedő autók átlagos számát és annak a valószínűségét, hogy három autó halad a B úton.

Megoldás. Az egyes utakon elhaladó autók száma egy véletlenszerű változó. Ha feltételezzük, hogy az összes kereszteződéshez közeledő autó egymástól függetlenül halad, akkor ez a valószínűségi változó a binomiális törvény szerint eloszlik

n= 5 és p = .

Ezért az A utat követő autók átlagos száma a (19.7) képlet szerint alakul.

és a kívánt valószínűség at

2. példa A készülék meghibásodásának valószínűsége minden teszt során 0,1. A készüléken 60 tesztet végeznek. Mennyi a valószínűsége annak, hogy a készülék meghibásodik: a) 15 alkalommal; b) legfeljebb 15-ször?

A. Mivel a tesztek száma 60, a (19.8) képletet használjuk.

A 18. előadás mellékletének 1. táblázata szerint találjuk

b. A (19.10) képletet használjuk.

A 18. előadás mellékletének 2. táblázata szerint

  • - 0,495
  • 0,49995

Poisson-eloszlás) ritka események törvénye). Ha n nagy és R kevés (), és a termék stbállandó értéket tart, amit l-el jelölünk,

akkor a (19.6) képlet Poisson-formulává válik

A Poisson-eloszlási törvény formája a következő:

Nyilvánvalóan helyes a Poisson-törvény meghatározása, mert egy elosztási sorozat fő tulajdonsága

Kész, mert sorozatok összege

A függvény sorozatbővítése at

Tétel. A Poisson-törvény szerinti eloszlású valószínűségi változó matematikai elvárása és szórása egybeesik, és egyenlő ennek a törvénynek a paraméterével, azaz.

Bizonyíték.

Példa. Termékeinek piaci népszerűsítése érdekében a cég szórólapokat helyez el a postaládákba. A korábbi tapasztalatok azt mutatják, hogy 2000 esetből hozzávetőlegesen egy megrendelés következik. Határozza meg annak valószínűségét, hogy 10 000 hirdetés feladásakor legalább egy rendelés érkezik, a beérkezett rendelések átlagos számát és a beérkezett rendelések számának szórását!

Megoldás. Itt

Meg fogjuk találni annak valószínűségét, hogy legalább egy megbízás megérkezik az ellenkező esemény valószínűségén keresztül, pl.

Az események véletlenszerű áramlása. Az eseményfolyam véletlenszerű időpontokban bekövetkező események sorozata. Tipikus példák az adatfolyamokra a számítógépes hálózatok meghibásodásai, a telefonközpontokon történő hívások, a berendezésjavítási kérelmek áramlása stb.

Folyam eseményeknek nevezzük helyhez kötött, ha annak a valószínűsége, hogy egy adott számú esemény egy hosszúságú időintervallumba esik, csak az intervallum hosszától függ, és nem függ attól, hogy az időintervallum hol helyezkedik el az időtengelyen.

A stacionaritási feltételt a kérések áramlása teljesíti, amelyek valószínűségi jellemzői nem függnek az időtől. A stacionárius áramlást különösen állandó sűrűség jellemzi (az időegységenkénti kérések átlagos száma). A gyakorlatban gyakran vannak olyan kérések, amelyek (legalábbis korlátozott ideig) állandónak tekinthetők. Például egy városi telefonközpont 12 és 13 óra közötti hívásfolyama vezetékesnek tekinthető. Ugyanaz az áramlás egy egész nap alatt már nem tekinthető állónak (éjszaka a hívássűrűség lényegesen kisebb, mint nappal).

Folyam az eseményeket folyamnak nevezzük utóhatás nélkül, ha bármely nem átfedő időszakra az egyikre eső események száma nem függ a többire eső események számától.

Az utóhatás hiányának feltétele - a legegyszerűbb áramláshoz a leglényegesebb - azt jelenti, hogy az alkalmazások egymástól függetlenül lépnek be a rendszerbe. Például a metróállomásra belépő utasok utóhatások nélküli áramlásnak tekinthetők, mivel azok az okok, amelyek egy adott pillanatban egy utas érkezését határozták meg, és nem a másikban, általában nem kapcsolódnak más utasok hasonló okához. . Az utóhatás hiányának feltétele azonban könnyen megsérthető az ilyen függőség megjelenése miatt. Például a metróállomásról kilépő utasok áramlása már nem tekinthető utóhatás nélküli áramlásnak, hiszen az ugyanazon a vonaton érkező utasok kiszállási pillanatai egymástól függenek.

Folyam eseményeknek nevezzük rendes, ha egy rövid t időintervallumon belül két vagy több esemény bekövetkezésének valószínűsége elhanyagolható egy esemény bekövetkezésének valószínűségéhez képest (ebben a vonatkozásban a Poisson-törvényt a ritka események törvényének nevezzük).

A közönségességi feltétel azt jelenti, hogy a megbízások egyenként érkeznek, nem pedig párban, hármasban stb. variancia eltérés Bernoulli eloszlás

Például a fodrászatba belépő vásárlók áramlása szinte hétköznapinak tekinthető. Ha egy rendkívüli áramlásban az alkalmazások csak párban, csak hármasban, stb. érkeznek, akkor a rendkívüli áramlás könnyen lecsökkenthető egy hétköznapira; Ehhez elegendő egy párok, hármasok stb. folyamát figyelembe venni az egyéni kérések folyama helyett. Nehezebb lesz, ha minden kérés véletlenszerűen dupla, hármas stb nem homogén, hanem heterogén események folyamával foglalkozik.

Ha egy eseményfolyam mindhárom tulajdonsággal rendelkezik (azaz stacionárius, közönséges, és nincs utóhatása), akkor egyszerű (vagy stacioner Poisson-folyamnak) nevezzük. A "Poisson" elnevezés annak köszönhető, hogy ha a felsorolt ​​feltételek teljesülnek, akkor a rögzített időintervallumra eső események száma eloszlik Poisson törvénye

Itt látható az események átlagos száma A, időegységenként megjelenő.

Ez a törvény egyparaméteres, azaz. beállításához csak egy paramétert kell ismernie. Kimutatható, hogy a Poisson-törvény elvárása és szórása számszerűen egyenlő:

Példa. Tegyük fel, hogy a munkanap közepén az átlagos kérések száma másodpercenként 2. Mennyi a valószínűsége annak, hogy 1) egy másodpercen belül nem érkezik be jelentkezés, 2) két másodpercen belül 10 jelentkezés érkezik?

Megoldás. Mivel a Poisson-törvény alkalmazásának érvényessége nem kétséges, és paramétere adott (= 2), a probléma megoldása a (19.11) Poisson-formula alkalmazására redukálódik.

1) t = 1, m = 0:

2) t = 2, m = 10:

A nagy számok törvénye. Annak a ténynek a matematikai alapja, hogy a valószínűségi változók klaszterének értékei bizonyos állandó értékek körül a nagy számok törvénye.

Történelmileg a nagy számok törvényének első megfogalmazása Bernoulli tétele volt:

„Az azonos és független kísérletek n számának korlátlan növekedésével az A esemény előfordulási gyakorisága valószínűségében konvergál a valószínűségéhez”, azaz.

hol van az A esemény előfordulási gyakorisága n kísérletben,

A (19.10) kifejezés lényegében azt jelenti, hogy nagy számú kísérlet mellett az esemény előfordulási gyakorisága A helyettesítheti ennek az eseménynek az ismeretlen valószínűségét, és minél több az elvégzett kísérlet, annál közelebb van p* p-hez. Érdekes történelmi tény. K. Pearson 12 000-szer dobott fel egy érmét, címere pedig 6019-szer került fel (gyakoriság 0,5016). Ugyanazon érme 24 000-szeri dobásakor 12 012 címert kapott, i.e. frekvencia 0,5005.

A nagy számok törvényének legfontosabb formája Csebisev tétele: a független, véges varianciájú és azonos körülmények között végzett kísérletek számának korlátlan növekedésével a valószínűségi változó megfigyelt értékeinek számtani átlaga valószínűség szerint konvergál a matematikai elvárásaihoz.. Analitikus formában ez a tétel a következőképpen írható fel:

Csebisev tételének alapvető elméleti jelentősége mellett fontos gyakorlati alkalmazásai is vannak, például a méréselméletben. Egy bizonyos mennyiség n mérése után x, különböző nem egyező értékeket kap x 1, x 2, ..., xn. A mért mennyiség hozzávetőleges értékéhez x vegyük a megfigyelt értékek számtani átlagát

ahol, Minél több kísérletet végeznek, annál pontosabb lesz az eredmény. Az a tény, hogy a mennyiség szórása az elvégzett kísérletek számának növekedésével csökken, mert

D(x 1) = D(x 2)=…= D(xn) D(x), Ez

A (19.13) összefüggés azt mutatja, hogy a mérőműszerek nagy pontatlansága (nagy érték) mellett is a mérések számának növelésével tetszőlegesen nagy pontosságú eredményt lehet kapni.

A (19.10) képlet segítségével meghatározható annak a valószínűsége, hogy a statisztikai gyakoriság legfeljebb annyival tér el a valószínűségtől, mint

Példa. Egy esemény valószínűsége minden kísérletben 0,4. Hány tesztet kell elvégeznie ahhoz, hogy legalább 0,8 valószínűséggel számítson arra, hogy egy esemény relatív gyakorisága 0,01-nél kisebb mértékben tér el az abszolút értékben megadott valószínűségtől?

Megoldás. A (19.14) képlet szerint

ezért a táblázat szerint két alkalmazás létezik

ennélfogva, n 3932.

Variációs tartomány (vagy variációs tartomány) - ez a különbség a jellemző maximális és minimális értéke között:

Példánkban a dolgozók műszakteljesítményének változási tartománya: az első brigádban R = 105-95 = 10 gyermek, a második brigádban R = 125-75 = 50 gyermek. (5-ször több). Ez arra utal, hogy az 1. dandár teljesítménye „stabilabb”, de a második dandárnak több tartaléka van a teljesítmény növelésére, mert Ha minden dolgozó eléri a maximális teljesítményt ennél a brigádnál, akkor 3 * 125 = 375 alkatrészt tud előállítani, az 1. brigádban pedig csak 105 * 3 = 315 alkatrészt.
Ha egy jellemző szélső értékei nem jellemzőek a populációra, akkor kvartilis vagy decilis tartományokat használnak. Az RQ= Q3-Q1 kvartilis tartomány a populáció térfogatának 50%-át fedi le, az első decilis tartomány RD1 = D9-D1 az adatok 80%-át, a második decilis tartomány RD2= D8-D2 – 60%.
A variációs tartomány mutató hátránya, hogy értéke nem tükrözi a tulajdonság minden ingadozását.
A jellemző összes ingadozását tükröző legegyszerűbb általános mutató az átlagos lineáris eltérés, amely az egyes opciók átlagos értékétől való abszolút eltérésének számtani átlaga:

,
csoportosított adatokhoz
,
ahol xi az attribútum értéke egy diszkrét sorozatban vagy az intervallum közepe az intervallumeloszlásban.
A fenti képletekben a számláló különbségeit modulo vesszük, ellenkező esetben a számtani átlag tulajdonsága szerint a számláló mindig nulla lesz. Ezért az átlagos lineáris eltérést ritkán alkalmazzák a statisztikai gyakorlatban, csak olyan esetekben, amikor a mutatók összegzése az előjel figyelembevétele nélkül van gazdaságilag értelmes. Segítségével például a munkaerő összetételét, a termelés jövedelmezőségét, a külkereskedelmi forgalmat elemzik.
Egy tulajdonság varianciája az átlagos értéktől való eltérések átlagos négyzete:
egyszerű szórás
,
szórással súlyozott
.
A variancia kiszámításának képlete leegyszerűsíthető:

Így a szórás egyenlő az opció négyzeteinek átlaga és a sokaságopció átlagának négyzete közötti különbséggel:
.
A szórás azonban a négyzetes eltérések összegzése miatt torz képet ad az eltérésekről, így az átlagot ez alapján számítjuk szórás, amely megmutatja, hogy egy tulajdonság adott változatai átlagosan mennyivel térnek el átlagos értéküktől. A variancia négyzetgyökéből számítva:
csoportosítatlan adatokhoz
,
variációs sorozatokhoz

Minél kisebb a variancia és a szórás értéke, minél homogénebb a sokaság, annál megbízhatóbb (tipikusabb) lesz az átlagérték.
Az átlagos lineáris és szórás elnevezett számok, azaz egy jellemző mértékegységében vannak kifejezve, tartalmukban azonosak és jelentésükben közeliek.
Az abszolút eltérések kiszámítása táblázatok segítségével javasolt.
3. táblázat – A változási jellemzők számítása (a személyzeti dolgozók műszakteljesítményére vonatkozó adatok időszakának példájával)


Dolgozók száma

Az intervallum közepe

Számított értékek

Teljes:

A dolgozók átlagos műszakteljesítménye:

Átlagos lineáris eltérés:

Termelési eltérés:

Az egyes dolgozók kibocsátásának szórása az átlagos termeléstől:
.

1. Diszperziószámítás nyomatékos módszerrel

Az eltérések kiszámítása nehézkes számításokat igényel (különösen, ha az átlagot nagy számként fejezzük ki, több tizedesjegygel). A számítások leegyszerűsíthetők egy egyszerűsített képlet és diszperziós tulajdonságok használatával.
A diszperzió a következő tulajdonságokkal rendelkezik:

  1. Ha egy jellemző összes értékét csökkentjük vagy növeljük ugyanazzal az A értékkel, akkor a diszperzió nem csökken:

,

, akkor vagy
A diszperzió tulajdonságait felhasználva, a sokaság összes változatát először A értékkel redukálva, majd elosztva a h intervallum értékével, egy képletet kapunk a diszperzió kiszámítására egyenlő intervallumú variációs sorozatokban. pillanatok módja:
,
ahol a nyomatékok módszerével számított diszperzió;
h – a variációs sorozat intervallumának értéke;
– új (átalakított) értékek opció;
A egy állandó érték, amely a legnagyobb gyakoriságú intervallum közepeként használatos; vagy a legmagasabb frekvenciájú opció;
– az elsőrendű nyomaték négyzete;
– a második rend pillanata.
Számítsuk ki a diszperziót a momentumok módszerével a csapat dolgozóinak műszakteljesítményére vonatkozó adatok alapján.
4. táblázat - Varianciaszámítás a nyomatékok módszerével


Termelő munkások csoportjai, db.

Dolgozók száma

Az intervallum közepe

Számított értékek

Számítási eljárás:


  1. Kiszámoljuk a szórást:

2 Alternatív jellemző varianciájának kiszámítása

A statisztikák által vizsgált jellemzők között vannak olyanok is, amelyeknek csak két, egymást kizáró jelentése van. Ezek alternatív jelek. Két mennyiségi értéket kapnak: az 1. és a 0. opciót. Az 1. opció gyakorisága, amelyet p-vel jelölünk, az ezzel a tulajdonsággal rendelkező egységek aránya. Az 1-р=q különbség a 0 opciók gyakorisága.


xi

Az alternatív jel számtani átlaga
, mert p+q=1.

Alternatív tulajdonságvariancia
, mert 1-р=q
Így egy alternatív jellemző szórása megegyezik az ezzel a jellemzővel rendelkező egységek arányának és az ezzel a jellemzővel nem rendelkező egységek arányának szorzatával.
Ha az 1 és 0 értékek egyformán gyakran fordulnak elő, azaz p=q, akkor a szórás eléri a maximumot, pq=0,25.
Egy alternatív attribútum szórását használják mintavételes felmérésekben, például a termékminőségre vonatkozóan.

3 Csoportok közötti variancia. Varianciaösszeadás szabály

A diszperzió a változás egyéb jellemzőitől eltérően additív mennyiség. Vagyis az aggregátumban, amely faktorjellemzők szerint csoportokra oszlik x , az eredő jellemző varianciája y felbontható az egyes csoportokon belüli (csoportokon belüli) és a csoportok közötti (csoportok közötti) varianciákra. Ezután egy adott tulajdonság variációjának tanulmányozása a teljes populáció egészére kiterjedően lehetővé válik az egyes csoportokban, valamint ezen csoportok közötti eltérések tanulmányozása.

Teljes variancia egy tulajdonság variációját méri nál nél teljes egészében minden olyan tényező hatására, amely ezt az eltérést (eltéréseket) okozta. Ez egyenlő az attribútum egyedi értékeinek átlagos négyzetes eltérésével nál nél a nagy átlagból, és kiszámítható egyszerű vagy súlyozott varianciaként.
Csoportközi variancia a kapott tulajdonság variációját jellemzi nál nél faktor-jel hatása okozza x, amely a csoportosítás alapját képezte. Ez jellemzi a csoportátlagok változását, és egyenlő a csoportátlagok összátlagtól való eltéréseinek átlagos négyzetével:
,
ahol az i-edik csoport számtani átlaga;
– egységek száma az i-edik csoportban (az i-edik csoport gyakorisága);
– a népesség összátlaga.
Csoporton belüli variancia véletlenszerű variációt tükröz, vagyis a változásnak azt a részét, amelyet nem figyelembe vett tényezők hatása okoz, és nem függ a csoportosítás alapját képező faktor-attribútumtól. Az egyéni értékek csoportátlagokhoz viszonyított változását jellemzi, és megegyezik az attribútum egyéni értékeinek átlagos négyzetes eltérésével. nál nél egy csoporton belül ennek a csoportnak a számtani átlagából (csoportátlag), és egyszerű vagy súlyozott varianciaként számítják ki minden csoportra:
vagy ,
ahol a csoportban lévő egységek száma.
Az egyes csoportok csoporton belüli eltérései alapján meg lehet határozni a csoporton belüli eltérések általános átlaga:
.
A három diszperzió közötti kapcsolatot ún eltérések hozzáadásának szabályai, amely szerint a teljes variancia egyenlő a csoportok közötti variancia és a csoporton belüli eltérések átlagának összegével:

Példa. A munkavállalók tarifakategóriájának (képzettségének) a munkájuk termelékenységére gyakorolt ​​hatásának vizsgálatakor a következő adatokat kaptuk.
5. táblázat – A dolgozók megoszlása ​​átlagos órateljesítmény szerint.



p/p

A 4. kategória dolgozói

Az 5. kategória dolgozói

Kimenet
munkás, db,

Kimenet
munkás, db,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

Ebben a példában a munkavállalókat két csoportra osztjuk a tényezők jellemzői szerint x– képesítések, amelyeket a rangjuk jellemez. Az így létrejövő tulajdonság – a termelés – mind a hatása (csoportközi variáció), mind más véletlenszerű tényezők (csoporton belüli variáció) hatására változik. A cél az, hogy ezeket a változásokat három varianciával mérjük: teljes, csoportok közötti és csoporton belüli eltérésekkel. Az empirikus determinációs együttható azt mutatja meg, hogy az eredményül kapott karakterisztikában mekkora a változás aránya nál nél faktorjel hatására x. A teljes variáció többi része nál nél más tényezők változásai okozzák.
A példában az empirikus determinációs együttható a következő:
vagy 66,7%
Ez azt jelenti, hogy a dolgozók termelékenységének ingadozásának 66,7%-a a képzettségbeli különbségekből, 33,3%-a pedig egyéb tényezők hatásából adódik.
Empirikus korrelációs kapcsolat a csoportosítás és a teljesítményjellemzők szoros kapcsolatát mutatja. Az empirikus determinációs együttható négyzetgyökeként számítva:

Az empirikus korrelációs arány, mint például, 0 és 1 közötti értékeket vehet fel.
Ha nincs kapcsolat, akkor =0. Ebben az esetben =0, vagyis a csoportátlagok egyenlőek egymással, és nincs csoportok közötti eltérés. Ez azt jelenti, hogy a csoportosítási jellemző - faktor nem befolyásolja az általános variáció kialakulását.
Ha a kapcsolat működőképes, akkor =1. Ebben az esetben a csoportátlagok szórása megegyezik a teljes variancia () értékével, vagyis nincs csoporton belüli eltérés. Ez azt jelenti, hogy a csoportosítási jellemző teljes mértékben meghatározza a vizsgált eredő jellemző változását.
Minél közelebb van a korrelációs hányados értéke az egységhez, annál szorosabb, közelebb áll a funkcionális függéshez a kapcsolat a jellemzők között.
A tulajdonságok közötti kapcsolat szorosságának kvalitatív értékelésére Chaddock relációit használjuk.

A példában , ami szoros kapcsolatot jelez a dolgozók termelékenysége és képzettsége között.

Egy jellemző változásának a teljes populációra kiterjedő vizsgálata mellett gyakran szükséges a jellemző mennyiségi változásainak nyomon követése a csoportok között, amelyekre a sokaság fel van osztva, valamint a csoportok között. Ez a variáció vizsgálata különböző típusú variancia kiszámításával és elemzésével érhető el.
Vannak teljes, csoportok közötti és csoporton belüli eltérések.
Teljes variancia σ 2 egy tulajdonság változását méri a teljes populációban minden olyan tényező hatására, amely ezt a változást okozta.

A csoportközi variancia (δ) a szisztematikus variációt jellemzi, azaz. a vizsgált tulajdonság értékbeli különbségei, amelyek a csoport alapját képező faktortulajdonság hatására keletkeznek. Kiszámítása a következő képlet segítségével történik:
.

Csoporton belüli variancia (σ) véletlenszerű variációt tükröz, azaz. az eltérés olyan része, amely fel nem számolt tényezők hatására következik be, és nem függ a csoport alapját képező faktor-attribútumtól. Kiszámítása a következő képlettel történik:
.

A csoporton belüli eltérések átlaga: .

Van egy törvény, amely 3 típusú diszperziót köt össze. A teljes variancia egyenlő a csoporton belüli és a csoportok közötti variancia átlagának összegével: .
Ezt az arányt ún eltérések hozzáadásának szabálya.

Az elemzésben széles körben használt mutató a csoportok közötti variancia aránya a teljes variancia arányában. Ezt hívják tapasztalati determinációs együttható (η 2): .
Az empirikus determinációs együttható négyzetgyökét ún empirikus korrelációs arány (η):
.
A csoport alapját képező jellemző hatását jellemzi a kapott jellemző változására. Az empirikus korrelációs arány 0 és 1 között van.
Mutassuk be gyakorlati felhasználását a következő példával (1. táblázat).

1. számú példa. 1. táblázat - Két munkavállalói csoport munkatermelékenysége a "Cyclone" nonprofit szervezet egyik műhelyében

Számítsuk ki az összesített és csoportos átlagokat és eltéréseket:




A csoporton belüli és csoportközi variancia átlagának kiszámításához szükséges kiindulási adatokat a táblázat tartalmazza. 2.
2. táblázat
Számítás és δ 2 a munkavállalók két csoportjára.


Munkáscsoportok
Dolgozók száma, fő Átlagos, gyerek/műszak Diszperzió

Elvégzett műszaki képzés

5 95 42,0

Akik nem végeztek műszaki képzést

5 81 231,2

Minden dolgozó

10 88 185,6
Számítsuk ki a mutatókat. A csoporton belüli eltérések átlaga:
.
Csoportközi variancia

Teljes szórás:
Így az empirikus korrelációs arány: .

A mennyiségi jellemzők változása mellett a minőségi jellemzők változása is megfigyelhető. Az eltérések vizsgálatát a következő típusú eltérések kiszámításával érjük el:

A részesedés csoporton belüli szóródását a képlet határozza meg

Ahol n i– az egységek száma külön csoportokban.
A vizsgált jellemző részesedése a teljes populációban, amelyet a következő képlet határoz meg:
A három varianciatípus a következőképpen kapcsolódik egymáshoz:
.

Ezt a szórások összefüggését a vonásrészesedés varianciáinak összeadási tételének nevezzük.