Central Tendency: A Close View

Betydning sentral tendens :

Mange problemer innen økonomi og ledelse innebærer frekvensfordeling. I frekvensfordeling møter man på visse verdier som forekommer ofte, mens andre verdier sjeldnere.

For å være mer spesifikk, i mange frekvensfordelinger, viser de tabulerte verdiene mindre frekvenser i begynnelsen og på slutten og større eller høyere frekvenser i midten av fordelingen.

Dette indikerer at de typiske verdiene for variabelen ligger nærmere den sentrale delen av fordelingen og andre verdier klynger eller grupper rundt disse sentrale verdiene. Denne oppførselen til dataene om konsentrasjonen av verdiene i den sentrale delen av distribusjonen kalles sentral tendens (eller plassering) av data.

En variabel har som kjent et antall observasjoner som endres over tid (kalt tidsseriedata) eller rom (kalt tverrsnittsdata). Hvis vi undersøker hele settet med observasjoner mye nøye og ganske intenst, opplever vi at disse verdiene har en generell tendens til å klynge seg rundt en sentral eller en typisk verdi som nesten eksisterer i den sentrale posisjonen. Den spesifikke verdien som er identifisert, kalles den sentrale verdien, og fenomenet blir notert som den sentrale tendensen til variabelen. Gjennomsnitt av flere typer beregnet er de vanlige målene for en slik tendens til en gitt variabel.

Vanligvis er vi kjent med tre følgende typer av de sentrale tendensene til en variabel, nemlig middelverdien, medianen og modus fra de tilgjengelige verdiene for den gitte variabelen. Igjen er midler fra tre kategorier - det aritmetiske gjennomsnittet (AM) det geometriske middelverdien (GM) og det harmoniske middelverdien (HM).

Vi kan representere dem på følgende måte.

Klassifisering av målingene av en sentral tendens til en variabel innenfor et spesielt variasjonsområde:

Vi bruker vanligvis følgende uttrekk for å kvantifisere en slik tendens til at en gitt variabel vises med et antall separate verdier:

Klassifisering av sentral tendens:

(et gjennomsnitt:

(i) Aritmetisk middelverdi

(ii) Geometrisk middel

(iii) Harmonisk middel

(b) median,

(c) Modus for grupperte (med frekvenser) og ugrupperte (uten frekvenser) data.

Summation Notation (∑):

Symbolet ∑ er den greske store bokstaven sigma som angir summen. La symbolet X i (les x subscript i) betegne en av verdiene X 1 X 2, X 3 ... X n, antatt av en variabel x. Bokstaven i står for noe av tallet 1, 2 ... n kalles et abonnement.

Mener:

Gjennomsnittet eller det aritmetiske gjennomsnittet av et sett med verdier for en variabel er verdien oppnådd etter å ha delt summen av alle verdiene til den gitte variabelen med deres antall.

Det aritmetiske gjennomsnittet er vanligvis av to typer:

(a) Enkelt aritmetisk middelverdi, og

(b) Vektet aritmetisk middel.

Enkel AM:

Det mest brukte mål for sentral tendens er det aritmetiske gjennomsnittet. Den er definert som å være lik summen av numeriske verdier for hver observasjon delt på det totale antall observasjoner. Med andre ord beregnes det ved å legge sammen verdiene til elementene i settet med observasjoner og dele det totale med antall objekter eller observasjoner.

Det aritmetiske gjennomsnittet er definert symbolsk som:

I ligning (8.1) er x (les x bar) gjennomsnittet eller det aritmetiske gjennomsnittet.

Det er den representative verdien av alle observasjonene gitt på en variabel.

Eksempel 1:

Finn gjennomsnittslønnen for de ti arbeiderne som jobber i en liten industriell enhet i en landsby:

X: 88, 72, 33, 29, 70, 54, 86, 91, 57, 6

Løsning:

Den nødvendige summen av lønnen til de ti arbeiderne er:

Det er klart fra ligning (8.1) eller eksempel 1 at hvis X 1, x 2 etc. forekommer med frekvenser, si f 1, f 2 osv., Så blir AM

når N = ∑f er den totale frekvensen eller det totale antall observasjoner.

Eksempel 2:

Hvis karakterene på 16 elever i en eksamen var henholdsvis 55, 68, 36, 28 med frekvensene 3, 2, 4, 6 og 1. Beregnet AM.

Løsning:

Den aritmetiske gjennomsnitt beregnes på grunnlag av ligning (8.2)

Eksempel 3:

Følgende merker oppnås av Il-yr. studenter i en klassetest av 10. Resultat av en eksaminert ble oppdaget manglet og inkludert i etterkant, og gjennomsnittet beregnet var 3. Bestem poengsummen til den siste eksaminanten.

1, 1, 0, 2, 0, 3, 0, 4, 8, 6, 5.

Løsning:

På grunn av inkludering av ytterligere en eksaminert i prosessen, ble det totale antall eksaminanter 12 og følgelig skulle deres totale karakter være 12 x 3 = 36.

Igjen var summen av karakterene oppnådd av de forrige 11 studentene 30.

Derfor ble scoringen til den siste

36 - 30 = 6.

Vektet AM:

Det aritmetiske middelet legger like stor vekt på alle gjenstandene eller observasjonene. Sannelig, alle slike observasjoner vil kanskje ikke ha samme betydning eller vekt. Noen observasjoner kan få større vekt enn andre. For eksempel blir større vekter tildelt våre daglige behov (si mat) og mindre vekter blir gitt til luksusvarer i familiebudsjettet.

Slik viktighet knyttet til forskjellige elementer med figurer (eller tall) i henhold til deres prioriteringer kalles vekter. Når middelet uttrykkes med respektive vekter oppnår man vektet AM. Denne typen middel brukes ofte til å studere forskjellige økonomiske problemer.

Legg merke til likheten mellom ligningene (8.2) og (8.3). Derfor kan ligning (8.2) betraktes som den vektede AM med vekter f 1, f 2 …… f n .

Eksempel 4:

Finn den vektede AM for de fire gitte tallene 92, 125, 180 og 80 med deres respektive frekvenser 12, 7, 6 og 9.

Løsning:

Det vektede AM for de fire gitte tallene med sine egne frekvenser kan uttrykkes som:

Eksempel 5:

Beregn det aritmetiske gjennomsnittet av følgende lønnsgruppe arbeidere.

Sammensatt middelverdi fra to separate grupper:

Når to separate grupper som inneholder n 1 og n 2 observasjoner med deres respektive aritmetiske midler x 1 og x 2 er gitt for en variabel, kan komposittgjennomsnittet av disse to gruppene sammen bestemmes ut fra følgende forhold:

x̅ representerer her det sammensatte eller felles middelet for de to gitte gruppene sammen.

Eksempel 6:

Beregn det sammensatte gjennomsnittet av lønnen til de ansatte i to forskjellige avdelinger i en organisasjon.

Tabell: 8.3: Beregn det sammensatte gjennomsnittet

Viktige egenskaper for AM:

(a) Summen av et sett med gitte observasjoner er lik produktet av antall observasjoner og AM.

Fordeler og ulemper ved AM:

I følge den anerkjente statistikeren og forfatteren av denne disiplinen GU Yule, er aritmetisk middel et tilfredsstillende gjennomsnitt.

Det har følgende fordeler:

(a) Det er lett forståelig.

(b) Det er enkelt og nøyaktig beregningsbart.

(c) Det er egnet for algebraisk behandling.

(d) Den forblir fri for prøvetakingssvingninger.

(e) Beregningen involverer alle verdiene til den gitte variabelen.

(f) Det kan stivt defineres.

(g) Det er trygt brukbart og uttrykkelig i alle situasjoner.

Aritmetisk middel er imidlertid ikke fritt for noen ulemper. Noen av dem er nevnt nedenfor:

(a) Det aritmetiske gjennomsnittet fra et sett med gitte observasjoner kan ikke identifiseres bare gjennom observasjoner.

(b) Det er ikke korrekt beregnet når en enkelt observasjon mangler eller avvises fra det gitte datasettet.

(c) Det kan aldri beregnes riktig med mindre hele observasjonene på den gitte variabelen er gitt om gangen.

(d) Det aritmetiske middelet legger større vekt på større gjenstander mens mindre gjenstander får mindre oppmerksomhet.

(e) Det må huskes at det ikke er et lokasjonsgjennomsnitt som sådan. Det trenger bare matematiske beregninger.

(f) Til slutt antyder det enkle aritmetiske gjennomsnittet bare en numerisk figur og ingenting annet.

Imidlertid er det aritmetiske gjennomsnittet en vanlig type primært statistisk verktøy og mye brukt i forskjellige statistiske analyser. I dag blir den brukt som en veldig populær representasjon av en sentral tendens til en variabel og følgelig ofte brukt til flere analytiske formål.

Betydning av GM:

Det geometriske middelet som AM er også et beregnet gjennomsnitt. Imidlertid er det en annen type statistisk enhet å identifisere den sentrale tendensen til en variabel som har et begrenset antall observasjoner. Mer presist for et sett med n-observasjoner, bestemmes det som den n-th roten til deres produkt.

Symbolsk sett har GM av observasjonene til en variabel (x) som har:

GM (for n-observasjoner sammen av variabelen x) til et sett med n-positive tall X 1, X 2 … .. X n er den niende roten til produktet av disse tallene

Det må tas i betraktning at hvis antallet observasjoner er mer enn 3, som vist tidligere, blir beregning veldig vanskelig og kjedelig. Med tanke på denne typen problemer anbefales det å bruke logaritmer. Logaritmer brukes med andre ord for å forenkle beregningen når antall observasjoner er stort nok. For å beregne GM bruker vi ofte

Hvis X1 X2 ... .Xn forekommer med frekvenser (eller vekter) henholdsvis f 1, f 2 ... f n, gis GM deretter av:

Fordeler og ulemper ved GM:

Det geometriske middelverdien har, i likhet med det aritmetiske middelverdi, en rekke fordeler og ulemper.

Disse er gitt i rekkefølgen nedenfor:

(a) Det kan defineres stivt

(b) Det beregnes på grunnlag av alle observasjoner av en variabel.

(c) Det er mye praktisk å beregne nødvendige gjennomsnitt av forholdstall, priser og prosenter ved hjelp av GM.

(d) Det påvirkes ikke av de eksepsjonelle og ekstremt store eller små verdiene til en variabel.

(e) Det gir den høyeste vekten for den laveste observasjonen og den laveste vekten for den høyeste observasjonen og balanserer dermed hele prosedyren for å få det beste resultatet.

(f) Det egner seg mye å bruke det i forskjellige matematiske behandlinger etterpå.

(g) Det hjelper i beregningen for å bestemme valutakurser mellom valutaene i forskjellige land.

Det er notert nedenfor:

en. Det er veldig vanskelig å beregne når dataene er gitt i form av en gruppert frekvensfordeling som har store frekvenser i nok antall.

b. Resultatet blir meningsløst hvis noe av informasjonen er null eller negativt.

c. Endelig oppnådd resultat kan ikke være lik noen av observasjonene gitt i serien.

d. Det gir minst betydning for de marginale og ekstreme observasjonene.

e. I noen tilfeller kan den ikke spille rollen som den egentlige representanten for et gjennomsnitt.

f. Det får vanligvis frem egenskapen til forholdet mellom endringer og ikke forskjeller i endring.

Beregning av GM:

Eksempel 1:

Finn GM til observasjonene 12, 18, 48 og 61 for en variabel som har henholdsvis 5, 3, 2 og 8

Løsning:

La oss utarbeide dataene i form av en tabell for å beregne GM.

Eksempel 2:

GM for tre tall er 15 og tallene er 5, 25 og x, finn verdien av x-

Løsning:

Vi vet at for tre tall sammen-

Viktige egenskaper til GM :

(a) Når observasjonene på den gitte variabelen er like store i størrelse, vil det geometriske middelverdien være lik deres felles verdi.

Symbolsk skriver vi:

X G = (C n) 1 / n = C

Her tar den gitte variabelen x n-antall observasjoner som hver for seg er lik C.

(b) Logaritmen til det geometriske gjennomsnittet av et sett med verdier av en variabel er det aritmetiske gjennomsnittet av deres logaritmer.

(c) Hvis y er en funksjon av en variabel x i formen y = aks, er det geometriske gjennomsnittet av y relatert til det av x i den lignende formen, dvs. y G = aks G der y G og X G er den geometriske middel for henholdsvis y og X

(d) De geometriske midlene for forholdet mellom to variabler er forholdet mellom deres geometriske midler:

(e) Hvis det er to sett med verdier av en variabel X som består av n 1 og n 2 observasjoner og G, og G2 er deres respektive geometriske midler, blir det geometriske gjennomsnittet av det kombinerte settet gitt ved:

Betydning av harmonisk middel:

Det harmoniske gjennomsnittet av et sett med observasjoner på en variabel er definert som det gjensidige av det aritmetiske gjennomsnittet av det gjensidige av de gitte observasjonene (noen av observasjonene må ikke være null).

Hvis variabelen som er notert er X som tar n-antall verdier som x 1, x 2, x 3, ... x n og deres frem- og tilbakevending er:

For observasjonene som har sine respektive frekvenser, kan den vektede HM beregnes som:

Det er en spesiell type gjennomsnitt brukt i noen utvalgte situasjoner.

Viktige egenskaper for HM :

(a) Hvis de gitte verdiene til en variabel er alle like (men ≠ 0), vil deres harmoniske middel være lik deres felles verdi.

Her er n det totale antall observasjoner av variabelen og c er den felles verdien.

(b) Hvis en variabel y er relatert til en annen variabel X i formen y = aks, er det harmoniske gjennomsnittet av y relatert til det til x i den samme formen:

(c) Hvis n 1 og n 2 er to sett med verdier av en variabel x og deres respektive harmoniske midler er H1 og H2, blir det harmoniske middelverdien for det kombinerte settet (H) gitt ved:

Beregning av HM :

Eksempel 1:

Beregn det enkle harmoniske gjennomsnittet av tallene 3, 6, 24 og 48.

Løsning:

Ved å bruke prinsippet om HM får vi:

Eksempel 2:

Bestem den vektede HM for observasjonene av variabelen X ut fra følgende:

Verdier og forfall fra HM :

Som alle apparater med sentral tendens som er nevnt tidligere, har harmonisk middel også en rekke fordeler og forfall.

Disse er:

Meriter av det harmoniske middel:

(a) Det er definert mye tydelig og stivt

(b) Det beregnes på grunnlag av all tilgjengelig informasjon om variabelen.

(c) Den egner seg veldig godt til bruk i forskjellige matematiske analyser.

(d) Det forblir mer eller mindre upåvirket på grunn av svingninger i prøvetakingen.

(e) Den er lett beregningsbar og derav presis.

(f) Den har alltid en bestemt verdi.

(g) Den vurderer mindre observasjon med større betydning og omvendt.

(h) Når den måler relative endringer i de gitte observasjonene av en variabel, blir den perfekt nyttig for å finne ut gjennomsnitt av visse forholdstall og priser.

Demerits of the Harmonic Mean:

(a) Resultatet som vanligvis er funnet, har ingen eksistens i den gitte serien med observasjoner på variabelen.

(b) Det er ikke lett forklarbart, beregningsdyktig og derav forståelig.

(c) Det er mye begrensende i den forstand at det ikke kan beregnes hvis noen av observasjonene er null.

(d) Den har begrensede bruksområder i praktiske situasjoner.

Innbyrdes forhold mellom AM, GM og HM:

La oss se på det enkleste eksemplet på en variabel X som bare har to observasjoner x 1 og x 2 (f.eks. De to sidene av en mynt).

Den samme analysen kan utvides for et hvilket som helst antall observasjoner på en variabel, og det samme resultatet kan lett etableres.

Andre viktige forhold er:

2. AM = GM = HM når alle observasjonene på variabelen er identiske i størrelsesorden.

AM> GM> HM for heterogene observasjoner.

Symbolisk sett generaliserer vi dem som

AM> GM> HM

Men for to forskjellige tall blir forholdet til:

AM x HM = (GM) 2

Alle gjennomsnittene blir like med hverandre når variabelen antar identiske observasjoner.

median:

Median til et sett med observasjoner på en variabel identifiseres som den midterste verdien fra de gitte settet med observasjoner. For et sett med ugrupperte data som er ordnet i stigende eller synkende rekkefølge, beregnes den midterste verdien eller medianen som (N + 1/2) -th-verdien for et oddetall antall observasjoner. Men for et jevnt antall observasjoner vil median være gjennomsnittet av (N / 2) -th og (N + 1/2) –th verdien av disse observasjonene.

Det er således tydelig at medianen deler hele serien i to like store deler. Det er et posisjonsgjennomsnitt og påvirkes ikke av tilstedeværelsen av en ekstrem stor eller liten verdi. Det kan også beregnes ut fra en gruppert frekvensfordeling med åpne klasser.

Eksempel 1:

Finn medianverdien av: Rs. 110, Rs. 90, Rs. 40, Rs. 50, Rs. 125, Rs. 65, og Rs. 100.

Løsning:

Ordne de gitte verdiene i stigende rekkefølge, får vi sekvensen som Rs. 40, Rs. 50, Rs. 65, Rs. 90, Rs. 100, Rs. 110 og, Rs. 125. Dermed er n = 7. Siden 7 er et oddetall. det er bare en verdi i midten som er

–Th, dvs.

den fjerde verdien. Merk at den fjerde ventilen = Rs. 90. Derfor er medianverdien per definisjon Rs. 90.

Eksempel 2:

Finn medianen for verdiene: 25, 24. 23, 32, 40, 27, 30, 25, 20, 10, 15, 45.

Løsning:

Ordne de gitte verdiene i stigende rekkefølge, får vi sekvensen som 10, 15, 20, 23, 24, 25, 25. 27, 30, 32. 40 og 45.

Dermed har n = 12, siden tallet 12 er jevnt, det har to midtre begrep som er det 6. og det 7. trinn, dvs. 25 og 25.

Derfor median per definisjon

Denne typen beregning av medianverdien tar ikke hensyn til frekvensfordeling. Dermed er beregningen for medianen ikke annet enn enkel for en slik serie.

I stedet har vi tenkt å beregne median for både ugrupperte og grupperte data. La oss vurdere de ugrupperte dataene først. I dette tilfellet beregner vi først kumulative frekvenser som tilsvarer hver verdi av variabelen. Da er verdien av variabelen som tilsvarer (n + 1/2) kumulativ frekvens medianverdien der n = ∑f = total frekvens.

På bakgrunn av eksempel 3, beregner vi kumulativ frekvens for ugrupperte data (tabell 8.5).

Eksempel 3:

Finn medianen fra følgende data:

Løsning:

Hvordan beregnes kumulativ frekvens er vist i tabell 8.5.

Eksempel 4:

Tenk på følgende inntektsfordeling for en gruppe på 400 arbeidere på en fabrikk. Bestem medianinntekten.

Løsning:

Merk at dataene er ulikt fordelt og åpne i begge ender.

Fra tabellen over er det tydelig at medianen må skje mellom Rs. 109, 5 og Rs. 139, 5 da N / 2 = 200 forekommer mellom 196 og 336 som vist i tabellen. Derfor median = Rs. 109, 5 + en brøkdel av klassens intervall (109, 5-139, 5). Denne fraksjonen kan bli funnet ved enkel interpolering.

Vi fortsetter som følger:

Forskjellen i frekvens fra 196 til 336 tilsvarer forskjellen i inntekt fra Rs. 109, 5 til Rs. 139, 5, dvs. tilsvarende en forskjell på 140 i frekvens er det en forskjell på Rs. 30 i inntekt.

Derfor, tilsvarer enhetsforskjellen i frekvens, vil det være en forskjell på Rs.30 / 140 i inntekt.

Men for å finne medianen, ønsker vi å gå videre til den kumulative frekvensen 200, dvs. til en forskjell på 200 - 196 = 4.

Således, tilsvarende en forskjell på 4 i frekvens, vil det være en forskjell på Rs. 30/140 x 4 i inntekt. Her Rs. 30 / 140x 4 = Rs. 0, 85 er brøkdelen som skal tilsettes. Derfor median Rs. (109, 5 + 0, 85) = Rs. 110, 35.

Det er åpenbart fra eksemplet ovenfor at beregning av median fra en frekvensfordeling med åpne ender ikke gir noen problemer med mindre median faller i en åpen x-klasse. Vi bør også merke oss at når man skal finne ut median for en gruppert distribusjon, bør klassegrenser, ikke klassegrenser, brukes.

Når vi interpolerte medianverdien i eksemplet ovenfor, startet vi fra toppen av tabellen, men vi kunne ha startet fra bunnen av tabellen også og fått samme resultat. Noen ganger blir det oppgitt at median tilsvarer den kumulative frekvensen lik (n + 1/2) der n er den totale frekvensen.

Dette gjelder for ugrupperte data med oddetall antall observasjoner. Men for grupperte frekvensfordelinger bør denne prosedyren unngås. Ellers vil verdien oppnådd ved interpolering fra toppen av tabellen være forskjellig fra verdien oppnådd ved å starte fra bunnen. Dette er ikke ønskelig fordi et gjennomsnitt bør defineres unikt.

Det bør også observeres at om vi finner gjennomsnitt eller median fra en frekvensfordeling, vil ikke de oppnådde verdier være de samme som de som er hentet fra rå data. Dette er naturlig fordi mens vi foretar en frekvensfordeling, er vårt mål å kondensere dataene, og resultatet av denne kondensasjonen er tapet av en viss mengde informasjon.

Eksempel 5:

Representere følgende data ved hjelp av kumulative frekvensskurver— (i) mindre enn og (ii) større enn typer, og bestem også medianverdien av karakterene oppnådd av 100 studenter i statistikk:

Frekvensfordeling av karakterer oppnådd av 100 studenter i statistikk:

Nå plotter vi kumulative frekvenser (av begge typene) vertikalt og korresponderende merker oppnådd horisontalt på et todimensjonalt boksediagram og sporer lett ut de to nødvendige kumulative frekvenskurvene som vist nedenfor:

De to kumulative frekvenskurvene (i og ii) trekkes fra de gitte karakterene oppnådd av 100 studenter— (i) nedenfra og (ii) ovenfra.

Vi finner nå disse to kurvene som skjærer hverandre ved punkt E, og derfra får vi medianverdien for karakterer oppnådd av de 100 studentene som (39, 5 + 02, 5) = 42, 0 (OA = 42)

Fordeler og ulemper ved median :

I noen tilfeller har medianen fordeler nok i forhold til det aritmetiske gjennomsnittet. Hvis observasjonssettet inneholder en stor verdi eller en liten verdi, kan det hende at det aritmetiske gjennomsnittet ikke gir riktig mål. Vi vet at inntekten per innbygger til en indianer er for lav sammenlignet med inntekten per innbygger til en amerikaner. Det samme er inntektene per innbygger til rike og de fattige i India.

Det er et stort inntektsgap mellom de rike og de fattige menneskene. Hvis inntektene fra de rikere klassene bare øker stort sett uten økning i inntektene til de fattige, vil Indias inntekt per innbygger øke. Men en slik høyere per inntekt kan ikke kalles en ekte representativ inntekt. I en slik situasjon vil medianverdien av inntektene være en bedre representant for inntekten per innbygger.

Medianen har følgende fordeler og forfall:

Meritter:

(a) Det er enkelt å forstå, forklare og lett å beregne.

(b) Det er stivt definert.

(c) Det kan beregnes for en åpen endefordeling.

(d) Det påvirkes av antall observasjoner snarere enn størrelsene på observasjonene.

(e) Det forblir upåvirket av ekstreme verdier.

demerits:

(a) Den er ikke basert på alle elementene i serien.

(b) Det er ikke egnet for videre algebraisk behandling.

(c) Det er ikke basert på alle verdiene, da det bare er et posisjonsgjennomsnitt.

(d) Det er mye påvirket av prøvetakingssvingninger i forhold til det aritmetiske gjennomsnittet.

Modus:

Det er et annet effektivt statistisk verktøy for å måle en variabels sentrale tendens. For et sett med observasjoner på en diskret variabel kalles en bestemt som har den høyeste frekvensen sin modus. Modusen for et sett med tall er den verdien som forekommer kjent med størst frekvens, og i den forstand er den den vanligste verdien.

For å gjøre det enkelt, la oss vurdere følgende figurer:

3, 5, 8, 5, 4, 6, 5, 9, 5

Her er modus for disse tallene 5 fordi det har vist seg høyeste tid (4 ganger) i serien med disse tallene.

Imidlertid kan det ikke være noen modus for en serie som ikke har noen repetisjon av noe bestemt nummer, og for noen andre serier kan det også eksistere to eller flere modusverdier, kalt bimodal eller tri-modal serie. I de fleste tilfeller finner vi en enkelt modus i en serie med tall (eller frekvenser), vi kaller det en unimodal frekvensfordeling.

Praktisk sett er det lettere å bestemme modusverdien til en variabel når den er diskret i forhold til en kontinuerlig variabel. For en kontinuerlig variabel er modusverdien nært relatert til verdien på toppunktet på frekvenskurven. For en slik variabel er den primære oppgaven derfor å utlede frekvenskurven fra de gitte dataene og deretter identifisere den høyeste verdien som tilsvarer kurvets toppunkt.

Men i en rekke situasjoner kan vi bestemme den modale verdien til en variabel uten å spore ut frekvensskurven ved å bruke følgende formel:

Det finnes to vanlige måter å beregne modusverdien til en variabel på:

1. Ved å tegne en frekvenskurve, og

2. Ved å bruke den foreskrevne formelen.

Beregningsmetoden for modusverdien fra en gruppert frekvensfordeling, som vist i tabell 8.9, kan nå forklares nedenfor:

Eksempel:

Løsning:

Observerer bordet nøye. Vi finner ut at den høyeste frekvensen er 34 og at den forekommer innenfor klassens intervall 28-32 der klassegrensene er 27, 5-32, 5.

Vi kan nå enkelt oppdage følgende verdier som:

L 0 = 27, 5, f 0 = 34, f -1 = 24, f 1 = 28 og sett dem i følgende formel:

Derfor er den nødvendige modusverdien 30, 62. I andre tilfeller, med ulik klasseintervaller, kan distribusjonsmåten bestemmes gjennom Karl-Pearsons fellesforhold etablert som middel-modus = 3 (middel-median), forutsatt at middelverdien og medianen allerede er bestemt.

Fordeler og ulemper ved modus:

Mode er et nyttig mål for sentral tendens hvis dataene som leveres er kvalitative. Ettersom modus er verdien som har maksimal konsentrasjon rundt, har den noen tydelige dyder.

Fordeler:

(a) Konseptet av modus er lettere å forstå.

(b) Det påvirkes ikke av ekstreme verdier for den gitte variabelen.

(c) Det bestemmes ofte bare ved inspeksjon, i det minste fra en enkel frekvensfordeling. Det brukes veldig ofte i virksomheten.

(d) Det er også beregnet fra en gruppert frekvensfordeling med åpne klasser.

ulemper:

Modusen, som et mål på sentral tendens, er imidlertid ikke fri fra noen ulemper.

Disse er:

(a) Det er ganske vanskelig å finne en veldefinert modus i alle tilfeller.

(b) Den er ikke basert på alle verdiene til den gitte variabelen.

(c) Det er ikke egnet for videre algebraisk behandling ganske lett og enkelt.

(d) Det er betydelig påvirket av prøvetakingssvingninger.

Viktige kjennetegn på et godt statistisk gjennomsnitt:

1. Det skal lett forstås og beregnes. AM er i stand til enkel beregning sammenlignet med GM eller HM. Videre har median så vel som modus også enkelhet i beregningene.

2. Et godt gjennomsnitt må defineres stivt, det vil si at den sentrale verdien eller den gjennomsnittlige verdien som er beregnet skal være unik i sin natur, ellers kan skjønnet i beregningen av gjennomsnittet av statistikerne krype inn flere feil etterpå.

3. Det bør være basert på alle observasjonene. For eksempel er bare AM avhengig av alle observasjonene. Median og modus har ikke denne attributtet.

4. Den skal være i stand til algebraiske behandlinger i den forstand at den skal kunne brukes i videre statistiske beregninger.

5. Det skal ikke påvirkes betydelig av svingningene i prøvetakingen.

6. Den skal ikke påvirkes av de ekstreme verdiene til variabelen. Selv om median og modus ikke påvirkes av de ekstreme verdiene, påvirkes AM i stor grad av de ekstreme verdiene - både store og små.

Dermed er et ideelt mål på gjennomsnittet veldig vanskelig å finne ut av ved flere anledninger.

Forholdet mellom middel, median og modus:

Frekvensfordelingen for et sett med observasjoner gitt på en variabel er av to typer - den ene kalles den symmetriske eller normale fordelingen der middelverdien, medianen og modus sammenfaller med hverandre, og den andre er en asymmetrisk hvor midlen, median og modus er forskjellige i størrelse, kalt skjev fordeling.

I slike skjevfordelinger blir det observert og etablert at de opprettholder en unik relasjon blant dem som:

Gjennomsnitt - Mode = 3 (Gjennomsnitt - Median),

kalte Karl-Pearsons forhold.

Her kan vi enkelt finne ut verdien av en når de to andre verdiene allerede er kjent. Imidlertid kan dette forholdet trygt brukes bare for uimodale og moderat skjevfordelinger.

Igjen finner vi at både middelverdien og medianen tilfredsstiller betingelsene for riktig definisjon og stabilitet, men med hensyn til beregningene deres numerisk, er medianen lettere å beregne enn gjennomsnittet. Tvert imot, de generelle svingningene i prøvetaking påvirker medianen i større grad enn gjennomsnittet, selv om visse unntak også er der.

Når det gjelder algebraiske behandlinger av disse enhetene for måling av sentral tendens til en variabel, er gjennomsnittet definitivt det bedre. I en situasjon der flere serier knyttet til ett bestemt felles aspekt blir kombinert sammen til en, kan vi finne ut det kombinerte gjennomsnittet fra de separate gjennomsnittene for forskjellige serier og antall observasjoner. Men det kan aldri være mulig i tilfelle median.

For et sett med gitte observasjoner av en variabel har medianen selvfølgelig visse fordeler i forhold til dens gjennomsnitt. Det er enkelt å beregne og lett oppnåelig selv uten å ha hele settet med observasjoner på variabelen bare når de er ordentlig anordnet.

Dessuten, i noen spesielle situasjoner, kan middel ikke beregnes der ekstreme klasseintervaller er uspesifiserte (dvs. uendelig), men medianen kan lett fås fra dem. Faktisk kan medianen i mange tilfeller fremstå som en ideell representant for observasjonens sentrale tendens til en variabel, da den forblir upåvirket fra dens ekstreme gjenstander.

Videre er det enighet om at midlet sikkert vil bli påvirket på grunn av uunngåelige prøvetakingssvingninger, men ikke medianen, og i den forstand anerkjennes medianen som et mer naturlig gjennomsnitt for å representere de gitte observasjoner på variabelen enn dens gjennomsnitt.

Fra diskusjonen ovenfor kan vi trygt konkludere med at det ikke vil være lurt å velge en bestemt som den beste fra de tilgjengelige tre målene for sentral tendens for de gitte observasjoner på en variabel i alle situasjoner. Avhengig av arten og kvaliteten på dataene som er gitt og målet med studien, er det faktisk en viktig oppgave for brukeren eller etterforskeren og forskeren å velge den best egnede eller den ideelle til å oppfylle sitt eget formål.

Matematikerne og statistikerne foreskriver i denne sammenheng for 'bety' som det ideelle å akseptere i mange tilfeller enn de to andre. Spesielt når etterforskeren er interessert i å konkludere med et bestemt aspekt forsynt med en gitt prøve fra dens beslektede befolkning, er middelet utvilsomt det beste å velge og bruke usammenhengende.

 

Legg Igjen Din Kommentar