Kend alle trekantens sider, find medianen. Opgave

hjem / Tidligere

Mode og median– en særlig slags gennemsnit, der bruges til at studere variationsrækkens opbygning. De kaldes undertiden strukturelle gennemsnit, i modsætning til de tidligere diskuterede effektgennemsnit.

Mode– dette er værdien af ​​en karakteristik (variant), der oftest findes i en given population, dvs. har den højeste frekvens.

Mode har stor praktisk anvendelse, og i nogle tilfælde kan kun mode karakterisere sociale fænomener.

Median- dette er en variant, der er midt i en bestilt variationsserie.

Medianen viser den kvantitative grænse for værdien af ​​en varierende karakteristik, som er nået af halvdelen af ​​enhederne i populationen. Det er tilrådeligt at bruge medianen sammen med gennemsnittet eller i stedet for det, hvis der er åbne intervaller i variationsrækken, fordi for at beregne medianen er betinget etablering af grænserne for åbne intervaller ikke påkrævet, og derfor påvirker manglen på information om dem ikke nøjagtigheden af ​​beregningen af ​​medianen.

Medianen bruges også, når de indikatorer, der skal bruges som vægte, er ukendte. Medianen bruges i stedet for det aritmetiske gennemsnit i statistiske metoder til produktkvalitetskontrol. Summen af ​​mulighedernes absolutte afvigelser fra medianen er mindre end fra noget andet tal.

Lad os overveje beregningen af ​​tilstanden og medianen i en diskret variationsserie :

Bestem tilstanden og medianen.

Mode Mo = 4 år, da denne værdi svarer til den højeste frekvens f = 5.

De der. det største antal arbejdere har 4 års erfaring.

For at beregne medianen finder vi først halvdelen af ​​summen af ​​frekvenserne. Hvis summen af ​​frekvenser er et ulige tal, lægger vi først én til denne sum og deler derefter i to:

Medianen vil være den ottende mulighed.

For at finde ud af, hvilken mulighed der vil være den ottende efter tal, vil vi akkumulere frekvenser, indtil vi får en sum af frekvenser lig med eller større end halvdelen af ​​summen af ​​alle frekvenser. Den tilsvarende mulighed vil være medianen.

Meh = 4 år.

De der. halvdelen af ​​arbejderne har mindre end fire års erfaring, halvdelen mere.

Hvis summen af ​​akkumulerede frekvenser mod en mulighed er lig med halvdelen af ​​summen af ​​frekvenser, så er medianen defineret som det aritmetiske middelværdi af denne mulighed og den næste.

Beregning af mode og median i intervalvariationsrækker

Tilstanden i intervalvariationsserien beregnes af formlen

Hvor x M0- indledende grænse for det modale interval,

hm 0 – værdien af ​​det modale interval,

fm 0 , fm 0-1 , fm 0+1 – hyppigheden af ​​det modale interval forud for henholdsvis det modale interval.

Modal Det interval, som den højeste frekvens svarer til, kaldes.

Eksempel 1

Grupper efter erfaring

Antal arbejdere, mennesker

Akkumulerede frekvenser

Bestem tilstanden og medianen.

Modalt interval, fordi det svarer til den højeste frekvens f = 35. Så:

Hm 0 =6, 0 =35

Strukturelle (positionelle) gennemsnit– disse er gennemsnitsværdier, der indtager en bestemt plads (position) i en rangeret variationsserie.

Mode(Mo) er værdien af ​​den egenskab, der forekommer hyppigst i den undersøgte population.

Til diskrete variationsserier mode vil være værdien af ​​mulighederne med den højeste frekvens

Eksempel. Bestem tilstanden ved hjælp af de tilgængelige data (tabel 7.5).

Tabel 7.5 - Fordeling af damesko solgt i skobutik N februar 2013

Ifølge tabellen. 5 er det klart, at den højeste frekvens f max= 28, svarer det til værdien af ​​attributten x= størrelse 37. Derfor, Mo= 37 skostørrelse, dvs. Det var denne skostørrelse, der var mest efterspurgt, sko i størrelse 37 blev oftest købt.

I først bestemt modalt interval, dvs. indeholdende en tilstand - et interval med den højeste frekvens (i tilfælde af en intervalfordeling med lige intervaller, i tilfælde af ulige intervaller - i henhold til den højeste tæthed).

Tilstanden anses omtrent for at være midten af ​​det modale interval. Den specifikke tilstandsværdi for en intervalserie bestemmes af formlen:

Hvor xMo– nedre grænse for det modale interval;

i Mo– værdien af ​​det modale interval;

fMo– hyppigheden af ​​det modale interval;

f Mo -1– frekvensen af ​​intervallet forud for det modale;

f Mo +1– hyppigheden af ​​intervallet efter det modale.

Eksempel. Bestem tilstanden ved hjælp af de tilgængelige data (tabel 7.6).

Tabel 7.6 – Fordeling af ansatte på anciennitet

Ifølge tabellen. 6 er det klart, at den højeste frekvens f max= 35, det svarer til intervallet: 6-8 år (modalt interval). Lad os bestemme tilstanden ved hjælp af formlen:

flere år.

Derfor, Mo= 6,8 år, dvs. De fleste medarbejdere har 6,8 års erfaring.

Navnet median er taget fra geometri, hvor det refererer til et segment, der forbinder en af ​​hjørnerne i en trekant med midten af ​​den modsatte side og dermed deler trekantens side i to lige store dele.

Median(Mig) Dette er værdien af ​​den egenskab, der falder i midten af ​​den rangerede population. Ellers er medianen en værdi, der deler antallet af en ordnet variationsserie i to lige store dele - den ene del har værdier af den varierende karakteristik mindre end den gennemsnitlige mulighed, og den anden har større værdier.

Til rangeret serie(dvs. ordnet - bygget i stigende eller faldende rækkefølge af individuelle værdier af en karakteristik) med et ulige antal led ( n= ulige) medianen er indstillingen placeret i midten af ​​rækken. Ordinaltal af median ( N mig) er defineret som følger:

N Mig =(n+1)/ 2.

Eksempel. I en række på 51 led er mediantallet (51+1)/2 = 26, dvs. Medianen er den mulighed, der er nummer 26 i rækken.

For en rangeret serie med et lige antal led ( n= lige) – medianen vil være det aritmetiske middelværdi af to attributværdier placeret i midten af ​​serien. Serienumrene for de to centrale muligheder bestemmes som følger:

N Me 1 =n/ 2; N Me 2 =(n/ 2)+ 1.

Eksempel. Når n=50; N Me1 = 50/2 = 25; N Me2= (50/2)+1 = 26, dvs. Medianen er gennemsnittet af de muligheder, der er 25. og 26. i rækkefølge.

I diskrete variationsserier Medianen findes ved den akkumulerede frekvens svarende til serienummeret på medianen eller overskrider den for første gang. Ellers er den akkumulerede frekvens lig med eller for første gang over halvdelen af ​​summen af ​​alle frekvenser i serien.

Eksempel. Bestem medianen ud fra de tilgængelige data (tabel 7.7).

Tabel 7.7 - Fordeling af damesko solgt i skobutik N februar 2013

Ifølge tabellen. 7 bestemmer vi ordenstallet for medianen: N mig =( 67+1)/2=34.

Mode. Median. Metoder til deres beregning (side 1 af 2)

Den akkumulerede frekvens overskrider denne værdi for første gang S= 41, svarer det til værdien af ​​attributten x= størrelse 37. Derfor, Mig= 37 skostørrelse, dvs. Halvdelen af ​​parrene er købt mindre end str. 37, og den anden halvdel er købt større.

I dette eksempel er tilstanden og medianen de samme, men de er muligvis ikke de samme.

I intervalvariationsserier akkumulerede frekvenser bestemmes, baseret på data om akkumulerede frekvenser, de er fundet median interval– et interval, hvor den akkumulerede frekvens er halvdelen eller for første gang overstiger halvdelen af ​​den samlede sum af frekvenser. Formlen til bestemmelse af medianen i en intervalfordelingsrække er som følger:

.

Hvor xMe– nedre grænse for medianintervallet;

jeg mig– værdien af ​​medianintervallet;

f i– summen af ​​frekvenser i serien;

S Me -1– summen af ​​de akkumulerede frekvenser af intervallet forud for medianen;

f mig– hyppigheden af ​​medianintervallet.

Eksempel. Bestem medianen ud fra de tilgængelige data (tabel 7.8).

Tabel 7.8 – Fordeling af ansatte efter anciennitet

Ifølge tabellen. 8 bestemmer vi ordenstallet for medianen: N Me =100/2=50. Den akkumulerede frekvens overskrider denne værdi for første gang S= 82, det svarer til et interval på 6-8 år (medianinterval). I dette eksempel er det modale interval og medianinterval det samme, men de er muligvis ikke ens. Lad os bestemme medianen ved hjælp af formlen:

flere år

Derfor, Mig= 6,2 år, dvs. halvdelen af ​​arbejderne har mindre end 6,2 års erfaring, og den anden halvdel har mere end 6,2 års erfaring.

Mode og median er meget udbredt inden for forskellige områder af økonomi. Således beregnes modal arbejdsproduktivitet, transportomkostninger mv. giver økonomen mulighed for at bedømme deres nuværende fremherskende niveau. Denne egenskab skal bruges til at identificere reserverne i vores økonomi. Mode er vigtigt for at løse praktiske problemer. Når masseproduktionen af ​​tøj og sko planlægges, fastlægges den produktstørrelse, der er størst efterspørgsel (modal størrelse). Tilstanden kan bruges som en tilnærmet karakteristik af niveauet af den karakteristik, der undersøges, i stedet for det aritmetiske middelværdi, hvis frekvensfordelingen er tæt på symmetrisk og har ét ikke-fladt toppunkt.

Medianen skal bruges som gennemsnitsværdi i tilfælde, hvor der er utilstrækkelig tillid til homogeniteten i den population, der undersøges. Medianen påvirkes ikke så meget af værdierne i sig selv som af antallet af sager på et bestemt niveau. Det skal også bemærkes, at medianen altid er specifik (med et stort antal observationer eller i tilfælde af et ulige antal befolkningsmedlemmer), fordi under Meh et faktisk reelt element af populationen er underforstået, mens det aritmetiske gennemsnit ofte får en værdi, som ingen anden enhed i populationen kan tage.

Hovedejendom Meh er, at summen af ​​absolutte afvigelser af attributværdier fra medianen er mindre end fra nogen anden værdi: . Denne ejendom Meh kan fx bruges ved fastlæggelse af byggepladsen for offentlige bygninger, pga Meh bestemmer det punkt, der giver den korteste afstand, for eksempel børnehaver fra bopæl for forældre, beboere i en lokalitet fra en biograf, ved design af sporvogne, trolleybusstoppesteder osv.

I systemet med strukturelle indikatorer er indikatorerne for fordelingsformens karakteristika de muligheder, der indtager en bestemt plads i den rangerede variationsserie (hver fjerde, femte, tiende, femogtyvende osv.). På samme måde kan du, når du finder medianen i variationsserier, finde værdien af ​​en karakteristik for enhver enhed i den rangerede serie.

Kvartiler– karakteristiske værdier, der deler den rangerede befolkning i fire lige store dele. Der er lavere kvartiler ( Q 1), gennemsnit ( Q 2) og top ( Q 3). Den nederste kvartil adskiller 1/4 af populationen med de laveste værdier af attributten, den øvre kvartil adskiller 1/4 af populationen med de højeste værdier af attributten. Det betyder, at 25 % af enhederne i befolkningen vil være mindre i størrelse Q 1; 25% af enhederne vil blive kontraheret mellem Q 1 Og Q 2; 25 % – mellem Q 2 Og Q 3; de resterende 25 % overstiger Q 3. Mellem kvartil ( Q 2) er medianen .

For at beregne kvartiler ved hjælp af en intervalserie skal du bruge følgende formler:

;

.

Hvor x Q1– den nedre grænse for intervallet, der indeholder den nedre kvartil (intervallet bestemmes af den akkumulerede frekvens, hvor den første overstiger 25 %);

x Q3– den nedre grænse for intervallet, der indeholder den øvre kvartil (intervallet bestemmes af den akkumulerede frekvens, hvor den første overstiger 75 %);

S Q 1-1– akkumuleret frekvens af intervallet forud for intervallet, der indeholder den nedre kvartil;

S Q 3-1– akkumuleret frekvens af intervallet forud for intervallet, der indeholder den øvre kvartil;

f Q1– hyppigheden af ​​det interval, der indeholder den nedre kvartil;

f Q3– hyppigheden af ​​det interval, der indeholder den øvre kvartil.

Deciler– disse er variantværdierne, der deler den rangerede serie i ti lige store dele: 1. decil ( d 1) deler befolkningen i forholdet 1/10 til 9/10, 2. decil ( d 2) - i forholdet 2/10 til 8/10 osv. Deciler beregnes efter samme skema som medianen og kvartilerne:

;

.

Brugen af ​​fordelingen af ​​karakteristikaene diskuteret ovenfor i analysen af ​​variationsserier giver os mulighed for at karakterisere populationen under undersøgelse i dybden og detaljer.

SE MERE:

Strukturelle gennemsnit

Sammen med effektgennemsnit er strukturelle gennemsnit blevet udbredt.

Strukturen af ​​statistiske aggregater varierer. Desuden, jo mere symmetrisk fordelingen af ​​befolkningsenheder er, jo mere kvalitativt homogen dens sammensætning i henhold til den karakteristik, der undersøges, jo bedre og mere pålidelig karakteriserer karakteristikkens gennemsnitlige værdi det fænomen, der undersøges. Men for tilfælde af skarp skævhed (asymmetri) af fordelingsrækken er det aritmetiske gennemsnit ikke længere så typisk. Eksempelvis er den gennemsnitlige størrelse af et indskud i sparekasser ikke af særlig interesse, da størstedelen af ​​indlån er under dette niveau, og gennemsnittet er væsentligt påvirket af store indlån, som er få, og som ikke er typiske for massen af indskud.

Mode (statistik)

I sådanne tilfælde bruger statistikken et andet system - systemet med hjælpestrukturelle gennemsnit. Disse inkluderer mode, median, samt kvarteller, kvinteller, deceler, procenter.

Mode (Mo)– den hyppigst forekommende værdi af en karakteristik, og i en diskret variationsserie – dette er den variant med den højeste frekvens.

I statistisk praksis bruges mode i studiet af befolkningsindkomst, forbrugerefterspørgsel, prisregistrering og i analysen af ​​visse tekniske og økonomiske indikatorer for virksomhedens ydeevne.

I nogle tilfælde er det tilstanden, der er af interesse, og ikke det aritmetiske gennemsnit. Nogle gange bruges det i stedet for det aritmetiske gennemsnit, for eksempel til at karakterisere strukturen af ​​fordelingsrækker.

Proceduren for at bestemme tilstanden afhænger af typen af ​​distributionsserie. Hvis en varierende karakteristik præsenteres i form af en diskret serie, kræves der ingen beregninger for at bestemme tilstanden. I en sådan serie vil tilstanden være værdien af ​​den attribut, der har den højeste frekvens.

Hvis værdien af ​​en karakteristik præsenteres i form af en intervalvariationsserie med lige store intervaller, bestemmes tilstanden ved beregning ved hjælp af formlen:

Hvor x Mo– nedre grænse for det modale interval,

jeg Mo– værdien af ​​det modale interval,

f Mo , f Mo-1 , f Mo+1– henholdsvis frekvenserne af modale, præmodale (tidligere) og postmodale (følgende modale) intervaller.

Median (mig)- dette er værdien af ​​en karakteristik, der er i midten af ​​en rangeret variationsserie, hvor individuelle værdier af karakteristikken (varianter) er arrangeret i stigende eller faldende rækkefølge (efter rang).

Medianen skal bruges som gennemsnitsværdi i tilfælde, hvor der er utilstrækkelig tillid til homogeniteten i den population, der undersøges. Medianen bruges i marketingaktiviteter. For eksempel placeringen af ​​elevatorer, primære vinfremstillingsanlæg, konservesfabrikker, summen af ​​de afstande, som fra leverandører af råvarer skal være den mindste.

Medianen er ligesom tilstanden defineret på forskellige måder. Dette afhænger af distributionsseriens struktur.
Sådan bestemmes medianen i diskrete variationsserier:

1) find dens serienummer ved hjælp af formlen

N Mig =
2) opbygge en række akkumulerede frekvenser

3) find den akkumulerede frekvens, som er lig med serienummeret på medianen eller overstiger den

4) mulighed svarende til en given akkumuleret frekvens er medianen.

Hvis antallet af led i en diskret række er ulige, er medianen i midten af ​​rækken og deler denne række i to lige store dele efter antallet af led i rækken. Ordinaltallet for medianen i dette tilfælde beregnes ved formlen:

N Me =(f + 1)2,

Hvor f antal medlemmer af serien.

I intervalserier bestemmes først medianintervallet. For at gøre dette, ligesom i diskrete serier, beregnes serienummeret på medianen. Den akkumulerede frekvens, som er lig med mediantallet eller det første, der overstiger det, i intervalvariationsrækken svarer til medianintervallet. Lad os betegne denne akkumulerede frekvens S Me . Medianen beregnes direkte ved hjælp af formlen:

,
hvor er den nedre grænse for medianintervallet

— værdien af ​​medianintervallet

— akkumuleret frekvens af intervallet forud for medianen

— hyppigheden af ​​medianintervallet

Grafisk definition af mode og median
Tilstanden og medianen i en intervalserie kan bestemmes grafisk.

Tilstanden bestemmes af distributionshistogrammet. For at gøre dette skal du vælge det højeste rektangel, som i dette tilfælde er modal. Derefter forbinder vi det modale rektangels højre toppunkt til det øverste højre hjørne af det forrige rektangel. Og venstre toppunkt af det modale rektangel - med det øverste venstre hjørne af det efterfølgende rektangel. Dernæst fra punktet af deres skæringspunkt sænkes en vinkelret ned på abscisseaksen. Abscissen af ​​skæringspunktet for disse linjer vil være fordelingstilstanden (fig. 1). Medianen beregnes ud fra kumulatet (fig. 2). For at bestemme det, fra et punkt på skalaen af ​​akkumulerede frekvenser (frekvenser) svarende til 50%, trækkes en ret linje parallelt med abscisseaksen, indtil den skærer kumulatet. Derefter, fra skæringspunktet for den angivne linje med kumulatet, sænkes en vinkelret på abscisseaksen. Abscissen af ​​skæringspunktet er medianen.

Indikatorer for variation i statistik.

I processen med statistisk analyse kan der opstå en situation, når værdierne af gennemsnitsværdierne falder sammen, og de populationer, som de beregnes på grundlag af, består af enheder, hvis attributværdier adskiller sig ret skarpt fra hinanden. I dette tilfælde beregnes variationsindekser.

Katalog: downloads -> Sotrudniki
downloads -> N. L. Ivanova M. F. Lukanina
downloads -> Foredrag for førskolespecialister og forældre "Forebyggelse af aggressiv adfærd hos førskolebørn"
downloads -> Psykologisk professionel tilpasning af personlighed
downloads -> Institut for Uddannelse og Videnskab i Kemerovo-regionen Kemerovo Regionale Psykologiske og Valeologiske Center
downloads -> Federal Service of the Russian Federation for Drug Control, Administration for Kemerovo-regionen
Sotrudniki -> Chuvash Republics bue SPO "chetk" Undervisningsministeriet i Chuvashia
downloads -> Funktioner af psykologisk og pædagogisk støtte til udvikling af førskolebørn
downloads -> Mishina M. M. Udvikling af tænkning afhængig af involvering i familieforhold
Sotrudniki -> Dannelse af fagligt betydningsfulde kvaliteter hos studerende med intellektuelle handicap efter profession

PRØVE

Om emnet: "Tilstand. Median. Metoder til deres beregning"

Introduktion

Gennemsnitsværdier og tilhørende indikatorer for variation spiller en meget vigtig rolle i statistik, hvilket skyldes emnet for dens undersøgelse. Derfor er dette emne et af de centrale i forløbet.

Gennemsnittet er et meget almindeligt opsummerende mål i statistik. Dette forklares med, at kun ved hjælp af gennemsnittet kan en befolkning karakteriseres ved en kvantitativt varierende egenskab. I statistik er gennemsnitsværdien en generaliserende karakteristik af et sæt af lignende fænomener baseret på nogle kvantitativt varierende karakteristika. Gennemsnittet viser niveauet af denne egenskab pr. enhed af befolkningen.

Når de studerer sociale fænomener og forsøger at identificere deres karakteristiske, typiske træk under specifikke forhold for sted og tid, bruger statistikere i vid udstrækning gennemsnitlige værdier. Ved hjælp af gennemsnit kan du sammenligne forskellige populationer med hinanden i henhold til forskellige karakteristika.

Gennemsnit, der bruges i statistik, tilhører klassen af ​​effektgennemsnit. Af effektgennemsnit anvendes oftest det aritmetiske middel, sjældnere det harmoniske middel; Den harmoniske middelværdi bruges kun ved beregning af gennemsnitlige dynamikhastigheder, og middelkvadraten bruges kun ved beregning af variationsindekser.

Det aritmetiske gennemsnit er kvotienten for at dividere summen af ​​varianterne med deres antal. Det bruges i tilfælde, hvor volumenet af en varierende karakteristik for hele befolkningen er dannet som summen af ​​de karakteristiske værdier af dens individuelle enheder. Det aritmetiske middel er den mest almindelige type gennemsnit, da det svarer til karakteren af ​​sociale fænomener, hvor mængden af ​​varierende karakteristika i aggregatet oftest dannes præcist som summen af ​​de karakteristiske værdier af individuelle enheder af befolkningen .

Ifølge dens definerende egenskab skal den harmoniske middelværdi bruges, når det samlede volumen af ​​attributten er dannet som summen af ​​variantens inverse værdier. Det bruges, når vægtene afhængigt af materialet ikke skal ganges, men opdeles i optioner eller, hvad der er det samme, ganges med deres gensidige værdi. Den harmoniske middelværdi i disse tilfælde er den reciproke af det aritmetiske middelværdi af karakteristikkens gensidige værdier.

Det harmoniske middelværdi bør anvendes i tilfælde, hvor ikke populationsenhederne - bærerne af karakteristikken - bruges som vægte, men produkterne af disse enheder ved karakteristikkens værdi.

1. Definition af tilstand og median i statistik

Aritmetiske og harmoniske midler er generaliserende karakteristika for befolkningen i henhold til en eller anden varierende karakteristik. Hjælpe beskrivende karakteristika for fordelingen af ​​en varierende karakteristik er mode og median.

I statistik er en tilstand værdien af ​​en karakteristik (variant), der oftest findes i en given population. I en variationsserie vil dette være muligheden med den højeste frekvens.

I statistik er medianen den mulighed, der er i midten af ​​variationsrækken. Medianen deler serien i to; på begge sider af den (op og ned) er der det samme antal befolkningsenheder.

Modus og median, i modsætning til kraftmidler, er specifikke karakteristika; deres betydning er tildelt enhver specifik mulighed i variationsserien.

Mode bruges i tilfælde, hvor det er nødvendigt at karakterisere den hyppigst forekommende værdi af en karakteristik.

5.5 Mode og median. Deres beregning i diskrete og intervalvariationsserier

Hvis det f.eks. er nødvendigt at finde frem til den mest almindelige lønsats i en virksomhed, den pris på markedet, hvor der blev solgt flest varer, den skostørrelse, der er størst efterspørgsel på blandt forbrugerne mv. disse sager tyer de til mode.

Medianen er interessant ved, at den viser den kvantitative grænse for værdien af ​​en varierende egenskab, som halvdelen af ​​befolkningen har nået. Lad den gennemsnitlige løn for bankansatte være 650.000 rubler. om måneden. Denne egenskab kan suppleres, hvis vi siger, at halvdelen af ​​arbejderne modtog en løn på 700.000 rubler. og højere, dvs. Lad os give medianen. Mode og median er typiske karakteristika i tilfælde, hvor populationer er homogene og store i antal.

Finde tilstanden og medianen i en diskret variationsserie

At finde tilstanden og medianen i en variationsserie, hvor værdierne af en karakteristik er givet ved bestemte tal, er ikke særlig svært. Lad os se på tabel 1 med fordelingen af ​​familier efter antal børn.

Tabel 1. Familiers fordeling på antal børn

Naturligvis vil mode i dette eksempel være en familie med to børn, da denne option-værdi svarer til det største antal familier. Der kan være fordelinger, hvor alle muligheder forekommer lige ofte, i hvilket tilfælde der ikke er nogen tilstand, eller med andre ord, vi kan sige, at alle muligheder er lige modale. I andre tilfælde kan ikke én, men to muligheder være af den højeste frekvens. Så vil der være to modes, fordelingen vil være bimodal. Bimodale fordelinger kan indikere kvalitativ heterogenitet af befolkningen i henhold til den egenskab, der undersøges.

For at finde medianen i en diskret variationsserie skal du dividere summen af ​​frekvenser i to og lægge ½ til resultatet. Så i fordelingen af ​​185 familier efter antallet af børn, vil medianen være: 185/2 + ½ = 93, dvs. Den 93. mulighed, som deler den bestilte række i to. Hvad er meningen med den 93. mulighed? For at finde ud af det, skal du akkumulere frekvenser, startende fra de mindste muligheder. Summen af ​​frekvenserne for 1. og 2. valgmulighed er 40. Det er klart, at der ikke er 93 muligheder her. Hvis vi lægger frekvensen af ​​den 3. mulighed til 40, får vi en sum svarende til 40 + 75 = 115. Derfor svarer den 93. mulighed til den tredje værdi af den varierende karakteristik, og medianen vil være en familie med to børn.

Tilstanden og medianen i dette eksempel faldt sammen. Hvis vi havde en lige sum af frekvenser (f.eks. 184), ville vi ved hjælp af ovenstående formel få tallet på medianoptionen, 184/2 + ½ =92,5. Da der ikke er nogen brøkoptioner, indikerer resultatet, at medianen er midtvejs mellem 92 og 93 muligheder.

3. Beregning af mode og median i intervalvariationsrækker

Den beskrivende karakter af tilstanden og medianen skyldes, at de ikke kompenserer for individuelle afvigelser. De svarer altid til en bestemt mulighed. Derfor kræver tilstanden og medianen ikke beregninger for at finde ud af, om alle værdierne af attributten er kendte. Men i en intervalvariationsserie bruges beregninger til at finde den omtrentlige værdi af tilstanden og medianen inden for et bestemt interval.

For at beregne en bestemt værdi af den modale værdi af en karakteristik indeholdt i et interval, skal du bruge formlen:

Mo = X Mo + i Mo *(f Mo – f Mo-1)/((f Mo – f Mo-1) + (f Mo – f Mo+1)),

Hvor XMo er minimumsgrænsen for det modale interval;

i Mo – værdien af ​​det modale interval;

f Mo – frekvensen af ​​det modale interval;

f Mo-1 – frekvensen af ​​intervallet forud for det modale;

f Mo+1 – frekvensen af ​​intervallet efter det modale.

Lad os vise beregningen af ​​tilstanden ved hjælp af eksemplet i tabel 2.

Tabel 2. Fordeling af virksomhedsarbejdere efter opfyldelse af produktionsstandarder

For at finde tilstanden bestemmer vi først det modale interval for denne serie. Eksemplet viser, at den højeste frekvens svarer til det interval, hvor varianterne ligger i området fra 100 til 105. Dette er det modale interval. Den modale intervalværdi er 5.

Ved at erstatte de numeriske værdier fra tabel 2 i ovenstående formel får vi:

Mo = 100 + 5 * (104 -12)/((104 - 12) + (104 - 98)) = 108,8

Betydningen af ​​denne formel er som følger: Værdien af ​​den del af det modale interval, der skal tilføjes til dets minimumsgrænse, bestemmes afhængigt af størrelsen af ​​frekvenserne for de foregående og efterfølgende intervaller. I dette tilfælde lægger vi 8,8 til 100, dvs. mere end et halvt interval, fordi frekvensen af ​​det foregående interval er mindre end frekvensen af ​​det efterfølgende interval.

Lad os nu beregne medianen. For at finde medianen i en intervalvariationsserie bestemmer vi først det interval, hvori den er placeret (medianinterval). Et sådant interval vil være et, hvis kumulative frekvens er lig med eller større end halvdelen af ​​summen af ​​frekvenserne. Kumulative frekvenser dannes ved gradvist at summere frekvenser, startende fra intervallet med den laveste værdi af attributten. Halvdelen af ​​summen af ​​frekvenser er 250 (500:2). Derfor vil medianintervallet ifølge tabel 3 være intervallet med en lønværdi på 350.000 rubler. op til 400.000 gnid.

Tabel 3. Beregning af medianen i intervalvariationsrækken

Før dette interval var summen af ​​de akkumulerede frekvenser 160. For at opnå medianværdien er det derfor nødvendigt at tilføje yderligere 90 enheder (250 – 160).

Ved bestemmelse af medianværdien antages det, at værdien af ​​enheder inden for intervallet er jævnt fordelt. Derfor, hvis 115 enheder placeret i dette interval er fordelt jævnt i et interval svarende til 50, vil følgende værdi svare til 90 enheder:

Mode i statistik

Median (statistik)

Median (statistik), i matematisk statistik, et tal, der karakteriserer en prøve (f.eks. et sæt tal). Hvis alle prøveelementerne er forskellige, så er medianen prøveantallet, således at nøjagtig halvdelen af ​​prøveelementerne er større end det, og den anden halvdel er mindre end det.

Mere generelt kan medianen findes ved at ordne elementerne i en prøve i stigende eller faldende rækkefølge og tage det midterste element. Eksempelvis bliver prøven (11, 9, 3, 5, 5) efter bestilling til (3, 5, 5, 9, 11), og dens median er tallet 5. Hvis prøven har et lige antal elementer, medianen er muligvis ikke entydigt bestemt: for numeriske data bruges den halve sum af to tilstødende værdier oftest (det vil sige, at medianen af ​​sættet (1, 3, 5, 7) tages lig med 4).

Med andre ord er en median i statistik en værdi, der deler en serie i to på en sådan måde, at der på begge sider af den (ned eller op) er det samme antal enheder i en given population. På grund af denne egenskab har denne indikator flere andre navne: 50. percentil eller 0,5 kvantil.

Medianen bruges i stedet for det aritmetiske gennemsnit, når de ekstreme muligheder for den rangerede serie (mindst og størst) i sammenligning med resten viser sig at være for store eller for små.

MEDIAN-funktionen måler central tendens, som er centrum for et sæt tal i en statistisk fordeling. Der er tre mest almindelige måder at bestemme central tendens på:

  • Gennemsnits værdi- aritmetisk middelværdi, som beregnes ved at tilføje et sæt tal og derefter dividere den resulterende sum med deres tal.
    For eksempel, gennemsnittet af tallene 2, 3, 3, 5, 7 og 10 er 5, hvilket er resultatet af at dividere deres sum af 30 med deres sum af 6.
  • Median- et tal, der er midten af ​​et sæt tal: halvdelen af ​​tallene har værdier, der er større end medianen, og halvdelen af ​​tallene har værdier mindre.
    For eksempel, medianen for tallene 2, 3, 3, 5, 7 og 10 er 4.
  • Mode- det tal, der oftest findes i et givent sæt tal.

    For eksempel, tilstanden for tallene 2, 3, 3, 5, 7 og 10 er 3.

Median (statistik), i matematisk statistik, et tal, der karakteriserer en prøve (f.eks. et sæt tal). Hvis alle prøveelementerne er forskellige, så er medianen prøveantallet, således at nøjagtig halvdelen af ​​prøveelementerne er større end det, og den anden halvdel er mindre end det. Mere generelt kan medianen findes ved at ordne elementerne i en prøve i stigende eller faldende rækkefølge og tage det midterste element. Eksempelvis bliver prøven (11, 9, 3, 5, 5) efter bestilling til (3, 5, 5, 9, 11), og dens median er tallet 5. Hvis prøven har et lige antal elementer, medianen er muligvis ikke entydigt bestemt: for numeriske data bruges den halve sum af to tilstødende værdier oftest (det vil sige, at medianen af ​​sættet (1, 3, 5, 7) tages lig med 4).

Med andre ord er en median i statistik en værdi, der deler en serie i to på en sådan måde, at der på begge sider af den (ned eller op) er det samme antal enheder i en given population. På grund af denne egenskab har denne indikator flere andre navne: 50. percentil eller 0,5 kvantil.

Medianen bruges i stedet for det aritmetiske gennemsnit, når de ekstreme muligheder for den rangerede serie (mindst og størst) i sammenligning med resten viser sig at være for store eller for små.

MEDIAN-funktionen måler central tendens, som er centrum for et sæt tal i en statistisk fordeling. Der er tre mest almindelige måder at bestemme central tendens på:

  • Gennemsnits værdi- aritmetisk middelværdi, som beregnes ved at tilføje et sæt tal og derefter dividere den resulterende sum med deres tal.
    For eksempel, gennemsnittet af tallene 2, 3, 3, 5, 7 og 10 er 5, hvilket er resultatet af at dividere deres sum af 30 med deres sum af 6.
  • Median- et tal, der er midten af ​​et sæt tal: halvdelen af ​​tallene har værdier større end medianen, og halvdelen af ​​tallene har værdier mindre.
    For eksempel, medianen for tallene 2, 3, 3, 5, 7 og 10 er 4.
  • Mode- det tal, der oftest findes i et givent sæt tal.
    For eksempel, tilstanden for tallene 2, 3, 3, 5, 7 og 10 er 3.

Mode og median– en særlig slags gennemsnit, der bruges til at studere variationsrækkens opbygning. De kaldes undertiden strukturelle gennemsnit, i modsætning til de tidligere diskuterede effektgennemsnit.

Mode– dette er værdien af ​​en karakteristik (variant), der oftest findes i en given population, dvs. har den højeste frekvens.

Mode har stor praktisk anvendelse, og i nogle tilfælde kan kun mode karakterisere sociale fænomener.

Median- dette er en variant, der er midt i en bestilt variationsserie.

Medianen viser den kvantitative grænse for værdien af ​​en varierende karakteristik, som er nået af halvdelen af ​​enhederne i populationen. Det er tilrådeligt at bruge medianen sammen med gennemsnittet eller i stedet for det, hvis der er åbne intervaller i variationsrækken, fordi for at beregne medianen er betinget etablering af grænserne for åbne intervaller ikke påkrævet, og derfor påvirker manglen på information om dem ikke nøjagtigheden af ​​beregningen af ​​medianen.

Medianen bruges også, når de indikatorer, der skal bruges som vægte, er ukendte. Medianen bruges i stedet for det aritmetiske gennemsnit i statistiske metoder til produktkvalitetskontrol. Summen af ​​mulighedernes absolutte afvigelser fra medianen er mindre end fra noget andet tal.

Lad os overveje beregningen af ​​tilstanden og medianen i en diskret variationsserie :

Bestem tilstanden og medianen.

Mode Mo = 4 år, da denne værdi svarer til den højeste frekvens f = 5.

De der. det største antal arbejdere har 4 års erfaring.

For at beregne medianen finder vi først halvdelen af ​​summen af ​​frekvenserne. Hvis summen af ​​frekvenser er et ulige tal, lægger vi først én til denne sum og deler derefter i to:

Medianen vil være den ottende mulighed.

For at finde ud af, hvilken mulighed der vil være den ottende efter tal, vil vi akkumulere frekvenser, indtil vi får en sum af frekvenser lig med eller større end halvdelen af ​​summen af ​​alle frekvenser. Den tilsvarende mulighed vil være medianen.

Meh = 4 år.

De der. halvdelen af ​​arbejderne har mindre end fire års erfaring, halvdelen mere.

Hvis summen af ​​akkumulerede frekvenser mod en mulighed er lig med halvdelen af ​​summen af ​​frekvenser, så er medianen defineret som det aritmetiske middelværdi af denne mulighed og den næste.

Beregning af mode og median i intervalvariationsrækker

Tilstanden i intervalvariationsserien beregnes af formlen

Hvor x M0- indledende grænse for det modale interval,

hm 0 – værdien af ​​det modale interval,

fm 0 , fm 0-1 , fm 0+1 – hyppigheden af ​​det modale interval forud for henholdsvis det modale interval.

Modal Det interval, som den højeste frekvens svarer til, kaldes.

Eksempel 1

Grupper efter erfaring

Antal arbejdere, mennesker

Akkumulerede frekvenser

Bestem tilstanden og medianen.

Modalt interval, fordi det svarer til den højeste frekvens f = 35. Så:

Hm 0 =6, 0 =35

hm 0 =2, 0-1 =20

0+1 =11

Konklusion: Det største antal arbejdere har cirka 6,7 ​​års erfaring.

For en intervalserie beregnes Me ved hjælp af følgende formel:

Hvor Hm e- nedre kant af det mediale interval,

hmm e– størrelsen af ​​det mediale interval,

– halvdelen af ​​summen af ​​frekvenser,

e- hyppigheden af ​​medianintervallet,

Sm e-1– summen af ​​de akkumulerede frekvenser af intervallet forud for medianen.

Medianinterval er et interval, der svarer til en kumulativ frekvens lig med eller større end halvdelen af ​​summen af ​​frekvenserne.

Lad os bestemme medianen for vores eksempel.

siden 82>50, så er medianintervallet .

Hm e =6, e =35,

hmm e =2, Sm e-1 =47,

Konklusion: Halvdelen af ​​arbejderne har mindre end 6,16 års erfaring, og halvdelen har mere end 6,16 års erfaring.

Bemærk. Denne lektion dækker geometriproblemer om medianen af ​​en trekant. Hvis du skal løse et geometriproblem, der ikke er her, så skriv om det i forummet. Kurset vil næsten helt sikkert blive suppleret.

Opgave. Find længden af ​​medianen af ​​en trekant ved hjælp af dens sider

Trekantens sider er 8, 9 og 13 centimeter. Medianen tegnes til den længste side af trekanten. Bestem medianen af ​​trekanten baseret på dimensionerne af dens sider.

Løsning.

Problemet har to måder at løse det på. Den første, som ikke kan lide af gymnasielærere, men er den mest universelle.

Metode 1.

Lad os anvende Stewarts sætning, hvorefter kvadratet af medianen er lig med en fjerdedel af summen af ​​det dobbelte af kvadraterne på de sider, hvorfra kvadratet på den side, som medianen er trukket til, trækkes fra.

M c 2 = (2a 2 + 2b 2 - c 2) / 4

Henholdsvis

M c 2 = (2 * 8 2 + 2 * 9 2 - 13 2) / 4
mc2 = 30,25
m c = 5,5 cm

Metode 2.

Den anden løsningsmetode, som lærere på skolen kan lide, er yderligere konstruktion af en trekant til et parallelogram og en løsning gennem sætningen om diagonalerne i et parallelogram.

Lad os udvide siderne af trekanten og medianen ved at bygge dem ind i et parallelogram. I dette tilfælde vil medianen BO af trekanten ABC være lig med halvdelen af ​​diagonalen af ​​det resulterende parallelogram, og de to sider af trekanten AB, BC vil være dens laterale sider. Den tredje side af trekanten AC, som medianen blev trukket til, er den anden diagonal af det resulterende parallelogram.

Ifølge sætningen er summen af ​​kvadraterne af diagonalerne i et parallelogram lig med to gange summen af ​​kvadraterne på dets sider.

2(a 2 + b 2) = d 1 2 + d 2 2

Lad os betegne diagonalen af ​​parallelogrammet, som er dannet af fortsættelsen af ​​medianen af ​​den oprindelige trekant, som x, får vi:

2(8 2 + 9 2) = 13 2 + x 2
290 = 169 + x 2
x 2 = 290 - 169
x 2 = 121
x = 11

Da den nødvendige median er lig med halvdelen af ​​parallelogrammets diagonal, vil værdien af ​​trekantens median være 11/2 = 5,5 cm

Svar: 5,5 cm

© 2023 skudelnica.ru -- Kærlighed, forræderi, psykologi, skilsmisse, følelser, skænderier