Das Fotonexus-Wiki befindet sich im Testbetrieb.
Median
Aus Fotonexus.
Median (oder Zentralwert) bezeichnet eine Grenze zwischen zwei Hälften. In der Statistik halbiert der Median eine Stichprobe. Gegenüber dem arithmetischen Mittel, auch Durchschnitt genannt, hat der Median den Vorteil, robuster gegenüber Ausreißern (extrem abweichenden Werten) zu sein und sich auch auf ordinal skalierte Variablen anwenden zu lassen.
Ferner wird in der Geometrie die Seitenhalbierende eines Dreiecks als Median bezeichnet, weil sie das Dreieck in zwei flächengleiche Hälften teilt. Der Begriff median als anatomische Lagebezeichnung bedeutet in der Mitte liegend.
Inhaltsverzeichnis |
Median einer Stichprobe
Bei einer Stichprobe ist der Median definiert als jener Beobachtungswert, bei dem die Werte jeweils mindestens der Hälfte der Beobachtungen kleiner oder gleich und die Werte mindestens der Hälfte größer oder gleich diesem Wert sind.
Sortiert man die Beobachtungswerte der Größe nach („geordnete Stichprobe“), so ist der Median bei einer ungeraden Anzahl von Beobachtungen der in der Mitte dieser Folge liegende Beobachtungswert. Bei einer geraden Anzahl von Beobachtungen gibt es kein einziges mittleres Element, sondern zwei. Hier sind die beiden in der Mitte liegenden sowie alle denkbaren (auch nicht beobachteten) Werte dazwischen ein Median der Stichprobe, da für alle diese Werte obige Bedingung zutrifft.
Bei kardinal skalierten Messgrößen verwendet man im Falle einer geraden Anzahl Beobachtungen meist das arithmetische Mittel der beiden mittleren Beobachtungswerte:
Der Median Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): \tilde x
einer geordneten Stichprobe Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): (x_1, x_2, \dots, x_n) von Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): n Messwerten berechnet sich
- Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): \tilde x =\begin{cases} x_{(n+1)/2} & n \; \mathrm{ ungerade} \\ \frac{1}{2} \left( x_{(n/2)} + x_{(n/2\,+\,1)} \right) & n \;\mathrm{ gerade} \end{cases}
.
Oft möchte man dagegen sicherstellen, dass der Median in jedem Fall eines der Elemente der Stichprobe sein soll. In diesem Fall wird alternativ zu dieser Definition bei einer geraden Anzahl von Elementen entweder der Untermedian Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): \tilde x_u = x_{n/2}
oder der Obermedian Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): \tilde x_o = x_{n/2\,+\,1}
genutzt und als Median bezeichnet.
Diese Medianbestimmung spielt beispielsweise bei Datenbanksystemen eine große Rolle, wie z. B. bei SELECT-Abfragen mittels des Medians der Mediane.
Eigenschaften
| Dieser Artikel oder Abschnitt ist unverständlich formuliert. Eine konkrete Begründung findet sich auf der Diskussionsseite des Artikels oder in der Versionsgeschichte. |
| Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Median, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation. |
Der Median ist der Wert, bei dem die Summe der absoluten Abweichungen von ihm minimal sind.
- Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): \sum_i |\tilde x - x_i| = \min
Allerdings gleichen sich die positiven und negativen Abweichungen vom Median nicht aus (es sei denn er fällt mit dem Durchschnitt zusammen).
Beispiele
- Messwerte 1, 2, 4, 5, 18: Ungerade Anzahl. Der Median ist der Wert an der mittleren Stelle, also 4. Das arithmetische Mittel dagegen ist 6.
- Messwerte 1, 1, 2, 3, 4, 37: Gerade Anzahl. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ (2 + 3), also 2,5. Das arithmetische Mittel dagegen ist 8.
Median einer Verteilung
Eine Verallgemeinerung des Begriffes liefert die stochastische Betrachtung einer Zufallsvariable Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): X
bzw. deren Verteilungsfunktion Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): F
. Dort ist der Median das 0,5-Quantil, also
- Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): \inf\{x\in\R:F(x) > \frac 12\}
.
Übertragen auf die oben genannte Stichprobe wäre nach dieser Definition der Median vergleichbar mit dem dort erwähnten Obermedian.
Er ist, neben beispielsweise Erwartungswert, Modus, ein Lageparameter.
- Beispiel
Bei der Dreiecksverteilung
- Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): f(x) = \frac {x} {18},\quad 0 \le x \le 6,
ist der Median 4,24. Denn dies ist der Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): x
-Wert, der die Fläche unter der Dichtefunktion in zwei gleich große Flächen teilt: Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): P(X \le 4{,}24) = 0{,}5
.
Median von gruppierten Daten
Vor allem in den Sozialwissenschaften wird bei Statistiken häufig der Median geschätzt, da nicht alle Daten explizit und exakt gegeben sind, sondern jene nur in Intervallen gruppiert vorliegen. So wird beispielsweise bei Umfragen selten nach dem exakten Gehalt gefragt, sondern nur nach der Einkommensklasse, also dem Bereich, in welchem das Gehalt liegt. Die Berechnungsvorschrift für diese Schätzung unterscheidet sich deswegen von der oben vorgestellten exakten Berechnung des Medians.
Es seien Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): n
die Anzahl aller Daten, Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): n_i die jeweilige Anzahl der Daten der Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): i
-ten Gruppe und Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): u_i
bzw. Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): o_i die entsprechenden oberen bzw. unteren Intervallgrenzen.
Zunächst wird nun die mediane Klasse (oder mediane Gruppe) bestimmt, d. h. diejenige Gruppe, in welche der Median (nach obiger, konventioneller Definition) hineinfällt, z. B. die Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): m -te Gruppe. Wenn keine weiteren Angaben über die Verteilung der Daten gegeben sind, wird z. B. Gleichverteilung postuliert, sodass man sich der linearen Interpolation als Hilfsmittel bedienen kann, um eine Schätzung des Medians der gruppierten Daten zu erhalten:
- Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): x_{med} = u_m+\frac{\frac n2 - \sum\limits_{k=1}^{m-1}n_k}{n_m} \cdot (o_m-u_m).
Im Gegensatz zur konventionellen Definition des Medians muss dieser nicht zwangsläufig ein Element aus der tatsächlichen Datenmenge sein, welche in aller Regel nicht bekannt ist.
Beispiel: Einkommen
| Klasse (Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): i
) | Bereich (Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): u_i
bis Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): o_i ) | Gruppengröße (Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): n_i
) |
|---|---|---|
| 1 | mind. 0, weniger als 1500 | 160 |
| 2 | mind. 1500, weniger als 2500 | 320 |
| 3 | mind. 2500, weniger als 3500 | 212 |
Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): \frac n2 = \frac{212+320+160}2 = \frac{692}2=346
, also liegt der Median in der 2. Klasse (d. h. Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): m=2
), da die erste Klasse nur 160 Elemente umfasst.
Somit ergibt sich als Schätzung für den Median Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): x_{med} = 1500+\frac{346-160}{320}\cdot1000 = 2081{,}25
.
Eine Veranschaulichung dieses Verfahrens zur Festlegung des Medians bei gruppierten Daten ist die grafische Ermittlung mit Hilfe der Summenkurve. Hier wird der Abzissenwert Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): x_{med}\,
gesucht, der zum Ordinatenwert Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): \frac{n}{2} gehört. Bei kleinerem und geradem Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): n kann auch stattdessen der Ordinatenwert Parser-Fehler (Das temporäre Verzeichnis für mathematische Formeln kann nicht angelegt oder beschrieben werden.): \frac{n}{2}+1 gewählt werden.
Vorteile des Medians
Durch seine Resistenz gegen Ausreißer eignet sich der Median besonders gut als Lageparameter für nicht normalverteilte Grundgesamtheiten.
Beispiel:
Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:
- 9 Personen verdienen EUR 1.000 und
- 1 Person verdient EUR 1.000.000.
Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.
Siehe auch
| Wiktionary: median – Bedeutungserklärungen, Wortherkunft, Synonyme und Übersetzungen |
Weblinks
Ausführliche Erläuterungen zur Berechnung des Medians auf dem "Fußweg": Wikibooks und Statscan
| Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Median, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation. |
