Statistik: Lagemaße Grundlagen: Mittel, Median und Modalwert - FernUni Hagen - Psychologie
Summary
TLDRIn diesem Video wird das Ermitteln des Durchschnittsalters aus einer Datenreihe in einem Statistikkurs vermittelt. Es wird erklärt, wie das arithmetische Mittel, auch Durchschnitt genannt, berechnet wird, indem man alle Datenelemente addiert und durch die Anzahl der Elemente dividiert. Zusätzlich werden die Begriffe Median und Modus, als weitere Maße der Lage, eingeführt und anhand der Datenreihe berechnet. Der Median ist der mittlere Wert, der bei sortierten Daten entsteht, während der Modus der häufigste Wert ist. Diese Maße sind wichtig, um verschiedene Aspekte der Verteilung von Daten zu verstehen.
Takeaways
- 📊 Die Teilnehmer eines Statistik-Kurses wurden nach ihrem Alter befragt, um das Durchschnittsalter zu bestimmen.
- 🔢 Das arithmetische Mittel (Durchschnitt) wird berechnet, indem man alle Datenelemente addiert und durch die Anzahl der Elemente dividiert.
- 📐 Die Summe der Alterswerte der Teilnehmer betrug 270, geteilt durch 10 (Anzahl der Teilnehmer) ergibt ein Durchschnittsalter von 27 Jahren.
- 📝 Die Variablen der einzelnen Teilnehmer können durchnummeriert werden, z.B. x1, x2, ..., x10, und das arithmetische Mittel wird als Summe dieser Variablen geteilt durch die Anzahl der Variablen (n) ausgedrückt.
- 🧮 Das arithmetische Mittel kann auch mit dem Summenzeichen (Σ) dargestellt werden, wobei der Index von 1 bis n (in diesem Fall 10) variiert, um die Variablen zu addieren und durch n zu teilen.
- 📈 Der Median ist der mittlere Wert in einer sortierten Datenreihe und wird bestimmt, indem man den Wert in der Mitte der Reihe oder das arithmetische Mittel der beiden mittleren Werte (bei einer geraden Anzahl von Werten) verwendet.
- 📊 Der Median der Alterswerte der Teilnehmer betrug 24,5 Jahre, was durch das arithmetische Mittel der Werte 24 und 25 erhalten wurde.
- 📉 Der Median kann sich stark vom arithmetischen Mittel unterscheiden, insbesondere wenn extreme Werte (Ausreißer) in der Datenreihe vorhanden sind.
- 💼 Der Median wird oft verwendet, um die Verteilung von Daten zu beschreiben, ohne dass sie von wenigen hohen oder niedrigen Werten beeinflusst wird, wie z.B. bei der Ermittlung des mittleren Einkommens.
- 📊 Der Modalwert (Modus) ist der am häufigsten vorkommende Wert in einer Datenreihe und kann verwendet werden, um die hauptsächliche Verteilung der Daten zu identifizieren. In diesem Fall war der Modalwert 23, da dieser Wert dreimal vorkam.
Q & A
Was versteht man unter dem arithmetischen Mittel in der Statistik?
-Das arithmetische Mittel, auch als Durchschnitt bezeichnet, ist der Wert, den man erhält, wenn man alle Datenwerte einer Reihe summiert und durch die Anzahl der Werte teilt.
Wie berechnet man das arithmetische Mittel der Datenreihe im Beispiel?
-Man summiert alle Werte der Datenreihe (23 + 25 + 23 + 27 + 32 + 27 + 21 + 24 + 45 + 23) und teilt die Summe durch die Anzahl der Werte (10). Das Ergebnis ist 27.
Was ist der Unterschied zwischen dem arithmetischen Mittel und dem Median?
-Das arithmetische Mittel ist der Durchschnitt aller Werte, während der Median der mittlere Wert einer sortierten Datenreihe ist. Der Median ist weniger anfällig für Ausreißer als das arithmetische Mittel.
Wie wird der Median in einer Datenreihe mit einer geraden Anzahl von Werten bestimmt?
-Wenn die Datenreihe eine gerade Anzahl von Werten hat, ermittelt man den Median, indem man das arithmetische Mittel der beiden mittleren Werte bildet.
Warum könnte der Median dem arithmetischen Mittel vorgezogen werden?
-Der Median wird vorgezogen, weil er weniger von Ausreißern beeinflusst wird, wie z. B. extrem hohen oder niedrigen Werten, die den Durchschnitt verzerren könnten.
Was ist der Modalwert (Modus) und wie wird er bestimmt?
-Der Modalwert, auch Modus genannt, ist der Wert, der in einer Datenreihe am häufigsten vorkommt. Im Beispiel ist es die Zahl 23, die dreimal vorkommt.
Was passiert, wenn zwei Werte in einer Datenreihe gleich häufig vorkommen?
-Wenn zwei Werte gleich häufig vorkommen, spricht man von einer multimodalen Verteilung, bei der es mehrere Modalwerte gibt.
Wie wird das Summenzeichen in der Statistik verwendet?
-Das Summenzeichen (Sigma) wird verwendet, um die Summe einer Serie von Werten darzustellen. Der Index des Summenzeichens gibt an, welche Werte in die Summe einbezogen werden.
Warum könnte das arithmetische Mittel in einigen Fällen irreführend sein?
-Das arithmetische Mittel kann irreführend sein, wenn es durch Ausreißer beeinflusst wird, wie z. B. sehr hohe oder niedrige Werte, die den Durchschnitt stark verzerren.
Was ist der Vorteil, wenn man sowohl arithmetisches Mittel, Median als auch Modalwert kennt?
-Der Vorteil liegt darin, dass man ein umfassenderes Bild der Verteilung der Daten erhält. Unterschiede zwischen diesen Maßen können Hinweise auf die Struktur und Besonderheiten der Daten geben.
Outlines
📊 Berechnung des Durchschnittsalters
In diesem Abschnitt wird beschrieben, wie das Durchschnittsalter von Teilnehmern eines Statistikkurses ermittelt wird. Es wird erklärt, dass der Durchschnitt, auch als arithmetisches Mittel bekannt, durch die Summe aller Datenelemente dividiert durch die Anzahl dieser Elemente berechnet wird. Die Formel für das arithmetische Mittel wird als Summe der Variablen \( x_1, x_2, \ldots, x_n \) geteilt durch die Anzahl der Variablen \( n \) dargestellt. Der Wert für das Durchschnittsalter wird durch die Berechnung der Summe der Alterszahlen (23, 25, 23, 27, 32, 27, 21, 24, 45, 23) geteilt durch 10, was 27 ergibt. Darüber hinaus wird gezeigt, wie man Variablen mit \( x_1, x_2, \ldots, x_n \) durchnummeriert, um die Berechnung zu erleichtern.
📈 Unterschied zwischen Median und Durchschnitt
Dieser Abschnitt behandelt den Median, der als der mittlere Wert einer sortierten Datenreihe definiert ist. Im Gegensatz zum arithmetischen Mittel, das von Ausreißern beeinflusst werden kann, ist der Median der Wert, der in der Mitte liegt. Bei einer geraden Anzahl von Werten, wie in diesem Fall (10), wird der Median als das arithmetische Mittel der mittleren beiden Werte (24 und 25) berechnet, was 24,5 ergibt. Dies zeigt, dass der Median sich stark vom Durchschnitt unterscheiden kann, insbesondere wenn extreme Werte vorliegen. Der Abschnitt erklärt auch, dass der Median oft verwendet wird, um Ausreißerwirkungen zu vermeiden, wie im Beispiel des Statistischen Bundesamtes für das mittlere Einkommen in Deutschland. Der Modalwert wird ebenfalls erwähnt, der als der häufigste Wert in einer Datenreihe identifiziert wird. In diesem Fall ist der Modalwert 23, da dieser Wert dreimal vorkommt. Die Bedeutung der Kenntnis aller drei zentralen Tendenzmaße (Durchschnitt, Median, Modalwert) wird hervorgehoben, um ein besseres Verständnis der Datenverteilung zu ermöglichen.
Mindmap
Keywords
💡Arithmetic Mean
💡Median
💡Mode
💡Arithmetic Calculation
💡Data Elements
💡Outliers
💡Statistical Measures
💡Summation Symbol
💡Variable Naming
💡Unimodal and Multimodal Distribution
Highlights
Die Teilnehmer eines Statistik-Kurses werden nach ihrem Alter befragt.
Das durchschnittsalter wird als arithmetisches Mittel berechnet.
Das arithmetische Mittel ist auch bekannt als mittig square.
Das arithmetische Mittel wird durch Addition aller Datenelemente und Division durch ihre Anzahl berechnet.
Die Datenreihe umfasst die Werte 23, 25, 23, 27, 32, 27, 21, 24, 45 und 23.
Die Anzahl der Elemente, auch als 'n' bezeichnet, beträgt zehn.
Variablennamen wie x1, x2, ..., x10 werden verwendet, um die einzelnen Elemente zu bezeichnen.
Die Formel für das arithmetische Mittel ist die Summe von x1 bis xn geteilt durch n.
Es gibt eine alternative Darstellungsform mit dem Summenzeichen (Sigma).
Das arithmetische Mittel kann auch als Mittelwert bezeichnet werden.
Es wird ermittelt, dass das durchschnittsalter der Kursteilnehmer 27 ist.
Der Median ist der mittlere Wert in einer sortierten Datenreihe.
Im Falle einer geraden Anzahl an Werten wird der Median als arithmetisches Mittel der mittleren beiden Werte berechnet.
Der Median der Datenreihe ist 24,5.
Der Median kann sich stark vom arithmetischen Mittel unterscheiden, wenn extreme Werte vorliegen.
Der Modus ist der Wert, der am häufigsten in der Datenreihe vorkommt.
Die 23 ist der Modus der Datenreihe, da sie dreimal vorkommt.
Bei großen Datenmengen liegen die Lagermaße oft dicht beieinander.
Wenn alle drei Lagermaße bekannt sind, kann man mehr über die Verteilung erfahren als mit nur einem.
Die Datenreihe zeigt eine unimodale Verteilung mit einem einzigen Modus.
Transcripts
die teilnehmer eines statistik kurses
werden nach ihrem alter befragt das
ergebnis dieser erhebung sei folgende
datenreihe
wir wollen zunächst das
durchschnittsalter ermitteln in der
statistik nennt man den durchschnitt
auch arithmetisches mittel
arithmetisches mittel bezeichnet auch
mittig square den durchschnitt berechnen
wir indem wir alle daten elemente
zusammenzählen und durch ihre anzahl
teilen digg square ist also gleich was
am 23 +25 +23 +27 +32 +27 +21 +24 +45
+23 geteilt durch ihre anzahl und das
sind 1 2 3 4 5 6 7 8 9 10
also geteilt durch 10 rechnen wir mal 23
25 23 plus 27 bis 32 27 kurs 21 plus 24
+45 +23 durch 10 ist gleich 27 icsc wer
das also gleich 27
die anzahl der elemente bezeichnet man
auch mit dem buchstaben m und n ist hier
gleich zehn auch den einzelnen elementen
können wir variablen namen geben und
diese einfach mit x1 x2 x3 und so weiter
bis x10 durchnummerieren
dann ergäbe sich als formel für das
arithmetische mittel icsc wer gleich die
x1 x2 plus x3 und so weiter bis plus x10
und da in diesem fall ja zehn es können
wir für x10 auch einfach schreiben xn
das wiederum geteilt durch 10 bzw
durch n und dieses ende ist dasselbe wie
dieses n für die addition einer
unbestimmten anzahl summenden in einer
allgemeinen formel gibt es noch eine
andere darstellungsform das so genannte
summen zeichen
demnach ist square gleich und die summe
wird dargestellt mit diesem zeichen das
ist das griechische sigma und anders
sigma wird ein sogenannter index dran
geschrieben bezeichnet mit ihm und
dieser index wird hoch gezielt von eins
bis zehn ist in unserem fall jahrzehnt
und wird verwendet um die variablen
namen zu bezeichnen
die wird ja hoch gezielt von 1 bis 1 in
unserem fall von 1 bis 10
also stetig sie für die variablen x1 bis
x10 und die werden zusammengezählt das
ergebnis teilt man dann noch mal durch n
und somit sagt diese formel genau das
gleiche wie diese formel und das kann
man auch schreiben als 1 durch einmal
sieht mix für ii gleich eins bis in das
ist die formel für das arithmetische
mittel
man sagt auch einfach mittelwert
mittelwert ist genau dasselbe wie
athletisches mittel der durchschnitt
durchschnitt mittelwert arithmetisches
mittel drei verschiedene begriffe für
dieselbe sache und ich square ist das
symbol in den formeln wenn wir sagen das
durchschnittsalter der kursteilnehmer
ist 27 bekommen wir schon einen ersten
groben eindruck von der altersstruktur
das arithmetische mittel ist sicher
eines der wichtigsten statistik masse
überhaupt daneben gibt es aber noch
andere lager maße das ist insbesondere
der medien und der modal wert wir haben
hier nochmal die gleiche datenreihe der
median ist buchstäblich der mittlere
wert media bezeichnet mit xp
wir sortieren alle werte in
aufsteigender reihenfolge und wählen den
aus der mitte sowas ist unser kleinster
wert das ist die 21 was ist der nächste
kleinere 23 noch mal 23 23 haben wir
noch mal 24 25 dann die 27
nochmal 27 32 und die 45
sowas ist der mittlere wert wir wissen
wir haben zehn werte
das heißt es gibt keinen mittleren wert
die mitte fällt genau zwischen dem
fünften und sechsten wert wenn es wie
hier keinen mittleren werten gibt dann
nimmt man die beiden aus der mitte und
bildet davon das arithmetische mittel xj
ist also das arithmetische mittel aus 24
und 25
das ist 24 25 durch zwei und das ist
gleich 24,5 es fällt auf dass der median
sich hier recht stark vom arithmetischen
mittel unterscheidet das war ja 27
das liegt daran dass das arithmetische
mittel oder der durchschnitt von
einzelnen oder wenigen ausreißern
beeinflusst sein kann
nimmt man den 45-jährigen hier raus sind
der durchschnitt von 27 auf 25 hätten
wir stattdessen noch einen 80-jährigen
einer gruppe wäre der durchschnitt knapp
32 um dieses problem zu vermeiden wird
manchmal der median verwendet zb
verwendet das statistische bundesamt zur
ermittlung des mittleren einkommens in
deutschland den median so vermeidet man
dass einige wenige multimilliardäre den
gesamteindruck der einkommensstruktur in
deutschland zu sehr verzerren
wenn mark zuckerberg sich für ein
studium in hagen ein schreibt dann sind
die nächsten erstes im durchschnitt alle
millionäre so wir hatten ja noch den
modal wert modal wert manchmal auch
bezeichnet als modus in den formeln
bezeichnet mit ex mode der moda wert ist
ganz einfach der wert der am häufigsten
vorkommt dass es hier die 23 die als
einzige drei mal vorkommt also ist es
mode gleich 23 das mag einem recht
willkürlich und zufällig erscheinen
doch bei großen datenmengen liegen die
lager maße oft recht dicht beieinander
liegen die verschiedenen lager maße
tatsächlich mal weiter auseinander
dann weiß man über die gesamt verteilung
natürlich mehr wenn man alle drei lager
maße kennt als wenn man nur einscannt
gäbe es einen zweiten wert der ebenfalls
drei mal vorkommt zb die 27 dann hätten
wir keinen eindeutigen modell wird
sondern wir hätten zwei modal werte das
nennt man dann auch eine multimodale
verteilung
hier haben wir eine uni modelle
verteilung
浏览更多相关视频
5.0 / 5 (0 votes)