Statistik: Lagemaße Grundlagen: Mittel, Median und Modalwert - FernUni Hagen - Psychologie

Stats Tutor
12 May 201907:59

Summary

TLDRIn diesem Video wird das Ermitteln des Durchschnittsalters aus einer Datenreihe in einem Statistikkurs vermittelt. Es wird erklärt, wie das arithmetische Mittel, auch Durchschnitt genannt, berechnet wird, indem man alle Datenelemente addiert und durch die Anzahl der Elemente dividiert. Zusätzlich werden die Begriffe Median und Modus, als weitere Maße der Lage, eingeführt und anhand der Datenreihe berechnet. Der Median ist der mittlere Wert, der bei sortierten Daten entsteht, während der Modus der häufigste Wert ist. Diese Maße sind wichtig, um verschiedene Aspekte der Verteilung von Daten zu verstehen.

Takeaways

  • 📊 Die Teilnehmer eines Statistik-Kurses wurden nach ihrem Alter befragt, um das Durchschnittsalter zu bestimmen.
  • 🔢 Das arithmetische Mittel (Durchschnitt) wird berechnet, indem man alle Datenelemente addiert und durch die Anzahl der Elemente dividiert.
  • 📐 Die Summe der Alterswerte der Teilnehmer betrug 270, geteilt durch 10 (Anzahl der Teilnehmer) ergibt ein Durchschnittsalter von 27 Jahren.
  • 📝 Die Variablen der einzelnen Teilnehmer können durchnummeriert werden, z.B. x1, x2, ..., x10, und das arithmetische Mittel wird als Summe dieser Variablen geteilt durch die Anzahl der Variablen (n) ausgedrückt.
  • 🧮 Das arithmetische Mittel kann auch mit dem Summenzeichen (Σ) dargestellt werden, wobei der Index von 1 bis n (in diesem Fall 10) variiert, um die Variablen zu addieren und durch n zu teilen.
  • 📈 Der Median ist der mittlere Wert in einer sortierten Datenreihe und wird bestimmt, indem man den Wert in der Mitte der Reihe oder das arithmetische Mittel der beiden mittleren Werte (bei einer geraden Anzahl von Werten) verwendet.
  • 📊 Der Median der Alterswerte der Teilnehmer betrug 24,5 Jahre, was durch das arithmetische Mittel der Werte 24 und 25 erhalten wurde.
  • 📉 Der Median kann sich stark vom arithmetischen Mittel unterscheiden, insbesondere wenn extreme Werte (Ausreißer) in der Datenreihe vorhanden sind.
  • 💼 Der Median wird oft verwendet, um die Verteilung von Daten zu beschreiben, ohne dass sie von wenigen hohen oder niedrigen Werten beeinflusst wird, wie z.B. bei der Ermittlung des mittleren Einkommens.
  • 📊 Der Modalwert (Modus) ist der am häufigsten vorkommende Wert in einer Datenreihe und kann verwendet werden, um die hauptsächliche Verteilung der Daten zu identifizieren. In diesem Fall war der Modalwert 23, da dieser Wert dreimal vorkam.

Q & A

  • Was versteht man unter dem arithmetischen Mittel in der Statistik?

    -Das arithmetische Mittel, auch als Durchschnitt bezeichnet, ist der Wert, den man erhält, wenn man alle Datenwerte einer Reihe summiert und durch die Anzahl der Werte teilt.

  • Wie berechnet man das arithmetische Mittel der Datenreihe im Beispiel?

    -Man summiert alle Werte der Datenreihe (23 + 25 + 23 + 27 + 32 + 27 + 21 + 24 + 45 + 23) und teilt die Summe durch die Anzahl der Werte (10). Das Ergebnis ist 27.

  • Was ist der Unterschied zwischen dem arithmetischen Mittel und dem Median?

    -Das arithmetische Mittel ist der Durchschnitt aller Werte, während der Median der mittlere Wert einer sortierten Datenreihe ist. Der Median ist weniger anfällig für Ausreißer als das arithmetische Mittel.

  • Wie wird der Median in einer Datenreihe mit einer geraden Anzahl von Werten bestimmt?

    -Wenn die Datenreihe eine gerade Anzahl von Werten hat, ermittelt man den Median, indem man das arithmetische Mittel der beiden mittleren Werte bildet.

  • Warum könnte der Median dem arithmetischen Mittel vorgezogen werden?

    -Der Median wird vorgezogen, weil er weniger von Ausreißern beeinflusst wird, wie z. B. extrem hohen oder niedrigen Werten, die den Durchschnitt verzerren könnten.

  • Was ist der Modalwert (Modus) und wie wird er bestimmt?

    -Der Modalwert, auch Modus genannt, ist der Wert, der in einer Datenreihe am häufigsten vorkommt. Im Beispiel ist es die Zahl 23, die dreimal vorkommt.

  • Was passiert, wenn zwei Werte in einer Datenreihe gleich häufig vorkommen?

    -Wenn zwei Werte gleich häufig vorkommen, spricht man von einer multimodalen Verteilung, bei der es mehrere Modalwerte gibt.

  • Wie wird das Summenzeichen in der Statistik verwendet?

    -Das Summenzeichen (Sigma) wird verwendet, um die Summe einer Serie von Werten darzustellen. Der Index des Summenzeichens gibt an, welche Werte in die Summe einbezogen werden.

  • Warum könnte das arithmetische Mittel in einigen Fällen irreführend sein?

    -Das arithmetische Mittel kann irreführend sein, wenn es durch Ausreißer beeinflusst wird, wie z. B. sehr hohe oder niedrige Werte, die den Durchschnitt stark verzerren.

  • Was ist der Vorteil, wenn man sowohl arithmetisches Mittel, Median als auch Modalwert kennt?

    -Der Vorteil liegt darin, dass man ein umfassenderes Bild der Verteilung der Daten erhält. Unterschiede zwischen diesen Maßen können Hinweise auf die Struktur und Besonderheiten der Daten geben.

Outlines

00:00

📊 Berechnung des Durchschnittsalters

In diesem Abschnitt wird beschrieben, wie das Durchschnittsalter von Teilnehmern eines Statistikkurses ermittelt wird. Es wird erklärt, dass der Durchschnitt, auch als arithmetisches Mittel bekannt, durch die Summe aller Datenelemente dividiert durch die Anzahl dieser Elemente berechnet wird. Die Formel für das arithmetische Mittel wird als Summe der Variablen \( x_1, x_2, \ldots, x_n \) geteilt durch die Anzahl der Variablen \( n \) dargestellt. Der Wert für das Durchschnittsalter wird durch die Berechnung der Summe der Alterszahlen (23, 25, 23, 27, 32, 27, 21, 24, 45, 23) geteilt durch 10, was 27 ergibt. Darüber hinaus wird gezeigt, wie man Variablen mit \( x_1, x_2, \ldots, x_n \) durchnummeriert, um die Berechnung zu erleichtern.

05:01

📈 Unterschied zwischen Median und Durchschnitt

Dieser Abschnitt behandelt den Median, der als der mittlere Wert einer sortierten Datenreihe definiert ist. Im Gegensatz zum arithmetischen Mittel, das von Ausreißern beeinflusst werden kann, ist der Median der Wert, der in der Mitte liegt. Bei einer geraden Anzahl von Werten, wie in diesem Fall (10), wird der Median als das arithmetische Mittel der mittleren beiden Werte (24 und 25) berechnet, was 24,5 ergibt. Dies zeigt, dass der Median sich stark vom Durchschnitt unterscheiden kann, insbesondere wenn extreme Werte vorliegen. Der Abschnitt erklärt auch, dass der Median oft verwendet wird, um Ausreißerwirkungen zu vermeiden, wie im Beispiel des Statistischen Bundesamtes für das mittlere Einkommen in Deutschland. Der Modalwert wird ebenfalls erwähnt, der als der häufigste Wert in einer Datenreihe identifiziert wird. In diesem Fall ist der Modalwert 23, da dieser Wert dreimal vorkommt. Die Bedeutung der Kenntnis aller drei zentralen Tendenzmaße (Durchschnitt, Median, Modalwert) wird hervorgehoben, um ein besseres Verständnis der Datenverteilung zu ermöglichen.

Mindmap

Keywords

💡Arithmetic Mean

Das arithmetische Mittel, auch Durchschnitt genannt, ist ein zentrales statistisches Mass, das durch die Summe aller Datenelemente dividiert durch die Anzahl dieser Elemente berechnet wird. Im Video wird das Durchschnittsalter der Teilnehmer eines Statistikkurses als Beispiel verwendet, indem alle Alterszahlen addiert und durch die Anzahl der Teilnehmer geteilt werden, um das Durchschnittsalter zu ermitteln. Dies liefert einen ersten Eindruck über die Altersstruktur der Gruppe.

💡Median

Der Median ist ein weiteres zentrales statistisches Mass, das den mittleren Wert einer geordneten Datenreihe darstellt. Im Video wird ermittelt, indem alle Alterszahlen der Teilnehmer aufsteigend sortiert und der Wert in der Mitte ausgewählt wird. Bei einer geraden Anzahl an Werten, wie im Beispiel mit zehn Teilnehmern, wird das arithmetische Mittel der beiden mittleren Werte (24 und 25) genommen, was zu einem Median von 24,5 führt. Der Median ist besonders nützlich, um die Daten von Ausreißern zu schützen, die den Durchschnitt verzerren könnten.

💡Mode

Der Modus ist der Wert in einer Datenreihe, der am häufigsten vorkommt. Im Kontext des Videos wird der Modus als das Alter bezeichnet, das in der Gruppe am häufigsten vorkommt. In den gegebenen Daten ist das Alter 23 dreimal vorhanden und somit der Modus. Der Modus gibt einen schnellen Überblick darüber, welches Alter in der Gruppe am häufigsten vertreten ist.

💡Arithmetic Calculation

Die arithmetische Berechnung ist der Prozess, bei dem Zahlen durch Addition, Subtraktion, Multiplikation und Division kombiniert werden, um einen Ergebniswert zu erhalten. Im Video wird diese Berechnung verwendet, um sowohl das arithmetische Mittel als auch den Median zu bestimmen, indem die Alterszahlen addiert und dann durch die Anzahl der Teilnehmer geteilt werden oder die mittleren Werte für den Median berechnet werden.

💡Data Elements

Datenelemente sind die einzelnen Werte in einer Datenreihe, die für statistische Berechnungen verwendet werden. Im Video werden die Alterszahlen der Teilnehmer als Datenelemente genannt, die verwendet werden, um statistische Masse wie Durchschnitt, Median und Modus zu berechnen.

💡Outliers

Ausreisser sind Werte in einer Datenreihe, die signifikant von den anderen Werten abweichen und die statistischen Berechnungen wie Durchschnitt und Median verzerren können. Im Video wird darauf hingewiesen, dass der Median verwendet wird, um Ausreisser zu vermeiden, da er weniger anfällig für extreme Werte ist als der Durchschnitt.

💡Statistical Measures

Statistische Maße sind Methoden, die verwendet werden, um die Hauptmerkmale einer Datenreihe zu beschreiben. Im Video werden verschiedene statistische Maße wie Durchschnitt, Median und Modus diskutiert, um verschiedene Aspekte der Altersverteilung der Kursteilnehmer zu beschreiben.

💡Summation Symbol

Das Summationszeichen (σ) ist ein mathematisches Symbol, das verwendet wird, um die Summe einer Reihe von Zahlen darzustellen. Im Video wird das Summationszeichen verwendet, um die Formel für das arithmetische Mittel zu zeigen, wobei der Index von 1 bis zur Anzahl der Datenelemente hochgezählt wird, um alle Werte zu addieren.

💡Variable Naming

Variablenbenennung ist die Zuweisung eines Namens zu einer Variablen in einer Datenreihe, um die Werte leichter zu identifizieren und zu referenzieren. Im Video werden die Alterszahlen der Teilnehmer mit Variablen wie x1, x2, ..., x10 durchnummeriert, um die Berechnung des Durchschnitts zu erleichtern.

💡Unimodal and Multimodal Distribution

Eine einmodale Verteilung hat einen Modus, während eine multimodale Verteilung zwei oder mehr Modi hat. Im Video wird die Altersverteilung als einmodal beschrieben, da nur ein Alter (23) dreimal vorkommt und kein anderer Wert mit der gleichen Häufigkeit vorliegt. Dies zeigt, dass die Verteilung der Alterszahlen in der Gruppe nicht sehr ausgeprägt ist.

Highlights

Die Teilnehmer eines Statistik-Kurses werden nach ihrem Alter befragt.

Das durchschnittsalter wird als arithmetisches Mittel berechnet.

Das arithmetische Mittel ist auch bekannt als mittig square.

Das arithmetische Mittel wird durch Addition aller Datenelemente und Division durch ihre Anzahl berechnet.

Die Datenreihe umfasst die Werte 23, 25, 23, 27, 32, 27, 21, 24, 45 und 23.

Die Anzahl der Elemente, auch als 'n' bezeichnet, beträgt zehn.

Variablennamen wie x1, x2, ..., x10 werden verwendet, um die einzelnen Elemente zu bezeichnen.

Die Formel für das arithmetische Mittel ist die Summe von x1 bis xn geteilt durch n.

Es gibt eine alternative Darstellungsform mit dem Summenzeichen (Sigma).

Das arithmetische Mittel kann auch als Mittelwert bezeichnet werden.

Es wird ermittelt, dass das durchschnittsalter der Kursteilnehmer 27 ist.

Der Median ist der mittlere Wert in einer sortierten Datenreihe.

Im Falle einer geraden Anzahl an Werten wird der Median als arithmetisches Mittel der mittleren beiden Werte berechnet.

Der Median der Datenreihe ist 24,5.

Der Median kann sich stark vom arithmetischen Mittel unterscheiden, wenn extreme Werte vorliegen.

Der Modus ist der Wert, der am häufigsten in der Datenreihe vorkommt.

Die 23 ist der Modus der Datenreihe, da sie dreimal vorkommt.

Bei großen Datenmengen liegen die Lagermaße oft dicht beieinander.

Wenn alle drei Lagermaße bekannt sind, kann man mehr über die Verteilung erfahren als mit nur einem.

Die Datenreihe zeigt eine unimodale Verteilung mit einem einzigen Modus.

Transcripts

play00:00

die teilnehmer eines statistik kurses

play00:03

werden nach ihrem alter befragt das

play00:06

ergebnis dieser erhebung sei folgende

play00:08

datenreihe

play00:09

wir wollen zunächst das

play00:11

durchschnittsalter ermitteln in der

play00:13

statistik nennt man den durchschnitt

play00:15

auch arithmetisches mittel

play00:19

arithmetisches mittel bezeichnet auch

play00:22

mittig square den durchschnitt berechnen

play00:25

wir indem wir alle daten elemente

play00:28

zusammenzählen und durch ihre anzahl

play00:30

teilen digg square ist also gleich was

play00:35

am 23 +25 +23 +27 +32 +27 +21 +24 +45

play00:52

+23 geteilt durch ihre anzahl und das

play00:58

sind 1 2 3 4 5 6 7 8 9 10

play01:03

also geteilt durch 10 rechnen wir mal 23

play01:12

25 23 plus 27 bis 32 27 kurs 21 plus 24

play01:23

+45 +23 durch 10 ist gleich 27 icsc wer

play01:34

das also gleich 27

play01:39

die anzahl der elemente bezeichnet man

play01:41

auch mit dem buchstaben m und n ist hier

play01:45

gleich zehn auch den einzelnen elementen

play01:48

können wir variablen namen geben und

play01:51

diese einfach mit x1 x2 x3 und so weiter

play01:55

bis x10 durchnummerieren

play01:58

dann ergäbe sich als formel für das

play02:00

arithmetische mittel icsc wer gleich die

play02:05

x1 x2 plus x3 und so weiter bis plus x10

play02:15

und da in diesem fall ja zehn es können

play02:19

wir für x10 auch einfach schreiben xn

play02:23

das wiederum geteilt durch 10 bzw

play02:27

durch n und dieses ende ist dasselbe wie

play02:30

dieses n für die addition einer

play02:34

unbestimmten anzahl summenden in einer

play02:36

allgemeinen formel gibt es noch eine

play02:37

andere darstellungsform das so genannte

play02:40

summen zeichen

play02:41

demnach ist square gleich und die summe

play02:46

wird dargestellt mit diesem zeichen das

play02:48

ist das griechische sigma und anders

play02:51

sigma wird ein sogenannter index dran

play02:53

geschrieben bezeichnet mit ihm und

play02:57

dieser index wird hoch gezielt von eins

play03:00

bis zehn ist in unserem fall jahrzehnt

play03:03

und wird verwendet um die variablen

play03:08

namen zu bezeichnen

play03:09

die wird ja hoch gezielt von 1 bis 1 in

play03:13

unserem fall von 1 bis 10

play03:15

also stetig sie für die variablen x1 bis

play03:19

x10 und die werden zusammengezählt das

play03:24

ergebnis teilt man dann noch mal durch n

play03:26

und somit sagt diese formel genau das

play03:29

gleiche wie diese formel und das kann

play03:33

man auch schreiben als 1 durch einmal

play03:38

sieht mix für ii gleich eins bis in das

play03:45

ist die formel für das arithmetische

play03:47

mittel

play03:48

man sagt auch einfach mittelwert

play03:51

mittelwert ist genau dasselbe wie

play03:53

athletisches mittel der durchschnitt

play03:56

durchschnitt mittelwert arithmetisches

play03:59

mittel drei verschiedene begriffe für

play04:01

dieselbe sache und ich square ist das

play04:05

symbol in den formeln wenn wir sagen das

play04:08

durchschnittsalter der kursteilnehmer

play04:10

ist 27 bekommen wir schon einen ersten

play04:12

groben eindruck von der altersstruktur

play04:15

das arithmetische mittel ist sicher

play04:18

eines der wichtigsten statistik masse

play04:20

überhaupt daneben gibt es aber noch

play04:23

andere lager maße das ist insbesondere

play04:26

der medien und der modal wert wir haben

play04:31

hier nochmal die gleiche datenreihe der

play04:34

median ist buchstäblich der mittlere

play04:36

wert media bezeichnet mit xp

play04:42

wir sortieren alle werte in

play04:44

aufsteigender reihenfolge und wählen den

play04:47

aus der mitte sowas ist unser kleinster

play04:50

wert das ist die 21 was ist der nächste

play04:53

kleinere 23 noch mal 23 23 haben wir

play05:01

noch mal 24 25 dann die 27

play05:14

nochmal 27 32 und die 45

play05:25

sowas ist der mittlere wert wir wissen

play05:29

wir haben zehn werte

play05:30

das heißt es gibt keinen mittleren wert

play05:34

die mitte fällt genau zwischen dem

play05:35

fünften und sechsten wert wenn es wie

play05:38

hier keinen mittleren werten gibt dann

play05:41

nimmt man die beiden aus der mitte und

play05:43

bildet davon das arithmetische mittel xj

play05:47

ist also das arithmetische mittel aus 24

play05:49

und 25

play05:50

das ist 24 25 durch zwei und das ist

play05:55

gleich 24,5 es fällt auf dass der median

play06:02

sich hier recht stark vom arithmetischen

play06:04

mittel unterscheidet das war ja 27

play06:07

das liegt daran dass das arithmetische

play06:09

mittel oder der durchschnitt von

play06:12

einzelnen oder wenigen ausreißern

play06:13

beeinflusst sein kann

play06:15

nimmt man den 45-jährigen hier raus sind

play06:18

der durchschnitt von 27 auf 25 hätten

play06:21

wir stattdessen noch einen 80-jährigen

play06:23

einer gruppe wäre der durchschnitt knapp

play06:25

32 um dieses problem zu vermeiden wird

play06:29

manchmal der median verwendet zb

play06:32

verwendet das statistische bundesamt zur

play06:34

ermittlung des mittleren einkommens in

play06:36

deutschland den median so vermeidet man

play06:40

dass einige wenige multimilliardäre den

play06:43

gesamteindruck der einkommensstruktur in

play06:45

deutschland zu sehr verzerren

play06:47

wenn mark zuckerberg sich für ein

play06:49

studium in hagen ein schreibt dann sind

play06:51

die nächsten erstes im durchschnitt alle

play06:53

millionäre so wir hatten ja noch den

play06:57

modal wert modal wert manchmal auch

play07:02

bezeichnet als modus in den formeln

play07:05

bezeichnet mit ex mode der moda wert ist

play07:09

ganz einfach der wert der am häufigsten

play07:11

vorkommt dass es hier die 23 die als

play07:14

einzige drei mal vorkommt also ist es

play07:17

mode gleich 23 das mag einem recht

play07:22

willkürlich und zufällig erscheinen

play07:24

doch bei großen datenmengen liegen die

play07:26

lager maße oft recht dicht beieinander

play07:29

liegen die verschiedenen lager maße

play07:31

tatsächlich mal weiter auseinander

play07:33

dann weiß man über die gesamt verteilung

play07:35

natürlich mehr wenn man alle drei lager

play07:37

maße kennt als wenn man nur einscannt

play07:40

gäbe es einen zweiten wert der ebenfalls

play07:43

drei mal vorkommt zb die 27 dann hätten

play07:46

wir keinen eindeutigen modell wird

play07:48

sondern wir hätten zwei modal werte das

play07:51

nennt man dann auch eine multimodale

play07:53

verteilung

play07:54

hier haben wir eine uni modelle

play07:57

verteilung

Rate This

5.0 / 5 (0 votes)

Связанные теги
StatistikDurchschnittsalterArithmetisches MittelMedianwertModusDatenanalyseStatistische MaßeAltersstrukturEinkommensverteilungDateninterpretation
Вам нужно краткое изложение на английском?