Ofte ønsker vi måske at beregne medianen af data, der er grupperet på en eller anden måde. Husk, at medianen repræsenterer den værdi, der ligger direkte i midten af et datasæt, når alle værdierne er arrangeret fra mindste til største. Antag for eksempel, at vi har følgende grupperede data:
Selvom det ikke er muligt at beregne den nøjagtige median, da vi ikke kender rådataværdierne, er det muligt at estimere medianen ved hjælp af følgende formel:
Median af grupperede data = L + W[(N/2 – C) / F]
hvor:
- L: Nedre grænse for medianklasse
- W: Bredde af medianklasse
- N: strong> Samlet frekvens
- C: Kumulativ frekvens op til medianklasse
- F: Frekvens af medianklasse
Bemærk: Medianklassen er den klasse, der indeholder værdien placeret ved N/2. I eksemplet ovenfor er der N = 23 samlede værdier. Medianværdien er således den i position 23/2 = 11,5, som ville være placeret i klassen 21-30.
De følgende eksempler viser, hvordan man beregner medianen af grupperede data i forskellige scenarier.
Eksempel 1: Beregn medianen af grupperede data
Antag, at vi har følgende frekvensfordeling, der viser den eksamen, der scores modtaget af 40 elever i en bestemt klasse:
I dette eksempel er der N = 40 samlede værdier. Således ligger medianværdien i klassen, hvor 40/2 = 20 er placeret. Den 20. største værdi ville være placeret i 71-80-klassen.
Ved dette, kan vi beregne følgende værdier:
- L: Nedre grænse for medianklasse: 71
- W: Bredde af medianklasse: 9
- N: strong> Samlet frekvens: 40
- C: Kumulativ frekvens op til medianklasse: 12
- F: Frekvens af medianklasse : 15
Vi kan sætte disse værdier ind i formlen for at beregne medianen af fordelingen:
- Median = L + W[(N/2 – C) / F]
- Median = 71 + 9[(40/2 – 12) / 15]
- Median = 75,8
Vi anslår, at medianprøven score er 75,8.
Eksempel 2: Beregn medianen af grupperede data
Antag, at vi har følgende frekvensfordeling, der viser antallet af point scoret pr. kamp af 60 basketballspillere:
Scorede pointfrekvens
1 – 10 8
11 – 20 2 5
21 – 30 14
31 – 40 9
41 – 50 4
I dette eksempel er der N = 60 samlede værdier. Medianværdien ligger således i klassen, hvor 60/2 = 30 er placeret. Den 30. største værdi ville være placeret i klassen 11-20.
Ved dette, kan vi beregne følgende værdier:
- L: Nedre grænse for medianklasse: 11
- W: Bredde af medianklasse: 9
- N: Samlet frekvens: 60
- C: Kumulativ frekvens op til medianklasse: 8
- F: Frekvens af medianklasse: 25
Vi kan sætte disse værdier ind i formlen for at beregne medianen af fordelingen:
- Median = L + W[(N/2 – C) / F]
li>
Vi anslår, at den gennemsnitlige eksamensscore er 18.92.
Yderligere ressourcer
Følgende selvstudier forklarer, hvordan du udfører andre almindelige handlinger med grupperede data:
- Sådan finder du middelværdi og Standardafvigelse for grupperede data
- Sådan finder man tilstanden for grupperede data
- Sådan beregnes procentel rang for grupperet Da ta
OM
Statology er et websted, der gør det nemt at lære statistik ved at forklare emner på enkle og ligetil måder. Lær mere om os.
STATOLOGI STUDY
Statology Study er den ultimative online statistikstudieguide, der hjælper dig med at studere og praktisere alle de kernebegreber, der undervises i i ethvert elementært statistikkursus og gør dit liv så meget lettere som studerende.
INTRODUKTION TIL STATISTIKKURSUS
Introduktion til statistik er vores førende online videokursus, der lærer dig alle de emner, der er dækket i indledende statistik. Kom i gang med vores kursus i dag.
SENESTE OPSLAG
Pandaer: Opret frekvenstabel baseret på flere kolonner
Sådan bytter du to rækker i pandaer (med eksempel)
Sådan bytter du to kolonner i et NumPy-array (med eksempel)