Statistik: Was ist Inferenzstatistik? - FernUni Hagen - Psychologie

Stats Tutor
13 Apr 202016:48

Summary

TLDRDieses Video untersucht die durchschnittliche jährliche Fahrleistung von PKWs in Deutschland. Es wird erklärt, dass es unpraktisch ist, alle 40 Millionen Autofahrer zu befragen, um den Durchschnittswert zu ermitteln. Stattdessen wird eine repräsentative Stichprobe von sechs Autofahrern verwendet, um den Durchschnittswert zu schätzen. Die Stichprobe enthält Fahrleistungen von 10.000 bis 18.000 km, was zu einem durchschnittlichen Stichprobenwert von 11.000 km führt. Darüber hinaus wird die Varianz der Grundgesamtheit geschätzt, indem die Varianz der Stichprobe mit n-1 anstatt n dividiert wird, was ein besseres Schätzwert für die Varianz der Gesamtbevölkerung liefert.

Takeaways

  • 🚗 Die jährliche Fahrleistung von PKWs in Deutschland wird untersucht, um zu ermitteln, wie viele Kilometer ein Auto oder ein Autofahrer im Durchschnitt pro Jahr zurücklegt.
  • 🔢 Es gibt ungefähr 40 Millionen PKW in Deutschland, und es wäre ideal, alle Autofahrer zu befragen, um den Durchschnittswert zu erhalten, was jedoch aufgrund der hohen Anzahl unrealistisch ist.
  • ⏱️ Die praktische Umsetzung einer Befragung aller 40 Millionen Autofahrer wäre zu aufwendig, zu teuer und die Ergebnisse würden schnell veraltet sein.
  • 📊 Statt alle Daten zu sammeln, wird eine Stichprobe verwendet, um den Durchschnittswert zu schätzen, was als Annäherung an den tatsächlichen Durchschnittswert der gesamten Autofahrer dient.
  • 🔎 Eine repräsentative Stichprobe von sechs Autofahrern wird gewählt, um die Durchschnittsrechnung zu erleichtern und um einen ersten Schätzwert für den Durchschnitt zu erhalten.
  • 📈 Der Durchschnittswert der Stichprobe, also 11.000 km, wird als Schätzwert für den Durchschnittswert der gesamten Autofahrer in Deutschland verwendet.
  • 📉 Die Varianz der Grundgesamtheit (gesamte Autofahrer) kann nicht genau bestimmt werden, da nicht alle Daten verfügbar sind, daher wird die Varianz der Stichprobe als Schätzwert verwendet.
  • 🔄 Die Varianz der Stichprobe wird als durchschnittliche quadratische Abweichung berechnet, indem die Abweichungen zum Stichprobenmittelwert quadriert und durch die Anzahl der Stichprobe geteilt werden.
  • 🔢 Der bessere Schätzwert für die Varianz der Grundgesamtheit wird durch die Formel s² = Σ(xᵢ - x̄)² / (n - 1) ermittelt, wobei n-1 anstelle von n verwendet wird, um eine repräsentativere Schätzung zu erhalten.
  • 📋 Die Verwendung von n-1 anstelle von n bei der Varianzberechnung korrigiert die Tendenz, dass Stichprobenvarianz kleiner als die Varianz der Grundgesamtheit ist, was auf die Tatsache zurückzuführen ist, dass Stichproben variabel sind und nicht alle möglichen Werte der Grundgesamtheit enthalten.

Q & A

  • Wie viele PKW gibt es in Deutschland?

    -In Deutschland gibt es ungefähr 40 Millionen PKW.

  • Warum ist es unmöglich, alle PKW-Fahrer in Deutschland zu befragen?

    -Es wäre zu aufwendig, zu teuer und zu lange dauern, und während der Befragung würden neue Fahrer dazukommen oder andere ihr Auto abgeben, was die Ergebnisse veraltet machen würde.

  • Was ist eine Stichprobe und wie wird sie verwendet?

    -Eine Stichprobe ist eine kleine, aber repräsentative Auswahl aus einer größeren Gruppe. Sie wird verwendet, um Schätzungen für die gesamte Gruppe zu treffen, ohne alle Mitglieder befragen zu müssen.

  • Wie groß ist die Stichprobe in diesem Video?

    -Die Stichprobe im Video besteht aus sechs Autofahrern.

  • Wie wird der Durchschnittswert einer Stichprobe berechnet?

    -Der Durchschnittswert einer Stichprobe wird berechnet, indem man die Summe aller Werte der Stichprobe durch die Anzahl der Datenpunkte in der Stichprobe teilt.

  • Was ist der berechnete Durchschnittswert der Stichprobe im Video?

    -Der berechnete Durchschnittswert der Stichprobe im Video beträgt 11.000 km (in 1000 km-Einheiten).

  • Was ist die Varianz und wie wird sie in der Statistik verwendet?

    -Die Varianz ist ein Maß für die Streuung der Datenpunkte um den Durchschnittswert. Sie wird verwendet, um die Streuung oder das Maß an Variation in einer Gruppe von Daten zu beschreiben.

  • Wie wird die Varianz einer Stichprobe berechnet?

    -Die Varianz einer Stichprobe wird berechnet, indem man für jeden Datenpunkt die Abweichung zum Durchschnittswert der Stichprobe (also die Differenz zum Durchschnittswert) berechnet, diese Abweichungen quadriert, die Summe dieser Quadrate bildet und diese durch die Anzahl der Datenpunkte in der Stichprobe teilt.

  • Warum wird bei der Berechnung der Varianz der Faktor (n-1) verwendet?

    -Der Faktor (n-1) wird verwendet, um ein ungefähreres, aber erwartungsgemäßes Ergebnis für die Varianz zu erhalten. Dies korrigiert die Tendenz, dass die Varianz einer Stichprobe aufgrund der Stichprobenvarianz im Durchschnitt kleiner als die Varianz der Grundgesamtheit ist.

  • Was ist der Unterschied zwischen der Varianz der Grundgesamtheit und der Varianz einer Stichprobe?

    -Die Varianz der Grundgesamtheit ist die durchschnittliche quadrierte Abweichung aller Datenpunkte von ihrem Durchschnittswert. Die Varianz einer Stichprobe ist hingegen die durchschnittliche quadrierte Abweichung der Stichprobe von ihrem Durchschnittswert. Die Stichprobenvarianz ist aufgrund der Stichprobenvarianz im Durchschnitt kleiner als die Varianz der Grundgesamtheit.

  • Warum ist die Stichprobenvarianz (s² von -1) ein besserer Schätzwert für die Varianz der Grundgesamtheit als die einfache Stichprobenvarianz (s²)?

    -Die Stichprobenvarianz (s² von -1) ist ein besserer Schätzwert, weil sie die Tendenz korrigiert, dass Stichprobenvarianz aufgrund der Stichprobenvarianz im Durchschnitt kleiner als die Varianz der Grundgesamtheit ist. Durch die Division durch (n-1) anstatt n wird der Schätzwert für die Varianz der Grundgesamtheit etwas erhöht und näher an den tatsächlichen Werten der Grundgesamtheit.

Outlines

00:00

🚗 Durchschnittliche jährliche Fahrleistung von PKWs in Deutschland

Dieses Video thematisiert die Durchschnittsfahrtleistung von Personenkraftwagen (PKW) in Deutschland. Es wird erklärt, dass die tatsächliche Durchschnittsfahrtleistung schwer zu ermitteln ist, da es unpraktisch ist, alle 40 Millionen Autofahrer in Deutschland zu befragen. Stattdessen wird eine Stichprobe von sechs Autofahrern genommen, um den Durchschnittswert zu schätzen. Die Stichprobe enthält Fahrer, die zwischen 5.000 und 18.000 km pro Jahr gefahren sind. Der durchschnittliche Fahrleistungswert für diese Stichprobe wird durch die Summe der gefahrenen Kilometer geteilt durch die Anzahl der Stichprobe (6) berechnet, was etwa 11.000 km pro Jahr ergibt. Dieser Wert dient als Schätzung für die Durchschnittsfahrtleistung aller Autofahrer in Deutschland.

05:01

📊 Schätzung der Varianz der Grundgesamtheit

Der zweite Absatz konzentriert sich auf die Varianz der Grundgesamtheit, also der Variabilität der jährlichen Fahrleistungen der PKW-Fahrer in Deutschland. Da die genaue Varianz aufgrund fehlender Daten nicht bekannt ist, wird die Varianz der Stichprobe als Schätzwert verwendet. Die Varianz der Stichprobe wird als durchschnittliche quadratische Abweichung berechnet, indem die Abweichungen jedes Stichprobeneintrags zum Stichprobenmittelwert quadriert und summiert werden. Der Schätzwert für die Varianz der Grundgesamtheit wird dann als die Summe dieser quadrierten Abweichungen geteilt durch die Anzahl der Stichprobe (6) berechnet. Allerdings wird darauf hingewiesen, dass ein besserer Schätzwert für die Varianz der Grundgesamtheit durch die Division durch n-1 (hier 5) erzielt wird, was zu einem Ergebnis von 20 führt, was als Schätzwert für Sigma Quadrat, also die Varianz der Grundgesamtheit, dient.

10:06

🔍 Warum die Varianz der Stichprobe kleiner ist als die der Grundgesamtheit

Der dritte Absatz erklärt, warum die Varianz der Stichprobe in der Regel kleiner ist als die Varianz der Grundgesamtheit. Es wird darauf hingewiesen, dass die Stichprobe möglicherweise nicht repräsentativ für die gesamte Grundgesamtheit ist, was zu einer geringeren Streuung führen kann. Es wird ein einfaches Beispiel gegeben, um zu veranschaulichen, dass die durchschnittliche Abweichung der Stichprobe von ihrem eigenen Mittelwert in der Regel kleiner ist als die durchschnittliche Abweichung der gesamten Grundgesamtheit. Dies führt dazu, dass die Varianz der Stichprobe als Schätzwert für die Varianz der Grundgesamtheit tendenziell zu niedrig eingeschätzt wird. Um einen verlässlichen Schätzwert für die Varianz der Grundgesamtheit zu erhalten, wird empfohlen, die Varianz der Stichprobe durch n-1 zu dividieren, wobei n die Größe der Stichprobe ist.

15:06

📉 Korrektur der Stichprobenvarianz für einen verlässlichen Schätzwert

Der vierte Absatz betont die Bedeutung der Korrektur der Stichprobenvarianz durch die Division durch n-1, um einen verlässlichen Schätzwert für die Varianz der Grundgesamtheit zu erhalten. Es wird erläutert, dass die Stichprobenvarianz, wenn sie durch n und nicht durch n-1 dividiert wird, zu einem zu niedrigen Schätzwert führt. Der Absatz verdeutlicht, dass die Stichprobenvarianz nur dann ein erwartungsfrohener Schätzwert für die Varianz der Grundgesamtheit ist, wenn sie durch n-1 korrigiert wird. Diese Korrektur führt zu einem etwas größeren Schätzwert, der näher an der tatsächlichen Varianz der Grundgesamtheit liegt. Die Erklärung zeigt, dass der Unterschied zwischen n und n-1 mit zunehmender Stichprobengrösse geringer wird, was bedeutet, dass die Korrektur weniger signifikant ist, je größer die Stichprobe ist.

Mindmap

Keywords

💡Fahrleistung

Fahrleistung bezieht sich auf die gefahrenen Kilometer eines Fahrzeugs im Laufe eines Jahres. Im Video wird die jährliche Fahrleistung von PKWs in Deutschland untersucht, um zu ermitteln, wie viele Kilometer ein Auto oder ein Autofahrer im Durchschnitt pro Jahr zurücklegt. Dies ist ein zentrales Thema, um die Verkehrsaktivitäten und mögliche Umweltauswirkungen zu verstehen.

💡Durchschnitt

Der Durchschnitt oder der Mittelwert ist ein statistisches Maß, das verwendet wird, um die zentrale Tendenz einer Datengruppe darzustellen. Im Kontext des Videos wird der Durchschnitt der gefahrenen Kilometer pro Autofahrer verwendet, um die allgemeine Fahrleistung in Deutschland zu schätzen.

💡Stichprobe

Eine Stichprobe ist eine Teilmenge einer größeren Gruppe, die als Repräsentant für die gesamte Gruppe dient. Im Video wird erklärt, dass es unmöglich ist, alle 40 Millionen Autofahrer in Deutschland zu befragen, daher wird eine Stichprobe verwendet, um den Durchschnitt der gefahrenen Kilometer zu schätzen.

💡Repräsentativität

Repräsentativität bezieht sich auf die Eigenschaft einer Stichprobe, die eine Gruppe oder Bevölkerung adäquat widerzuspiegeln. Im Video wird betont, dass die Stichprobe so repräsentativ wie möglich sein sollte, um sicherzustellen, dass die Ergebnisse für die gesamte Bevölkerung von Deutschland angemessen sind.

💡Mittelwert

Der Mittelwert oder das arithmetische Mittel ist der Durchschnittswert einer Datenreihe. Im Video wird der Mittelwert der Stichprobe berechnet, indem die gefahrenen Kilometer aller befragten Autofahrer addiert und durch die Anzahl der befragten Personen dividiert werden.

💡Varianz

Die Varianz ist ein Maß für die Streuung der Werte in einer Datenmenge um den Mittelwert. Im Video wird die Varianz der Stichprobe berechnet, um die Streuung der gefahrenen Kilometer zu ermitteln und als Schätzung für die Varianz der gesamten Bevölkerung herangezogen.

💡Sigma quadrat

Sigma quadrat (σ²) ist ein Begriff aus der Statistik, der die Varianz einer Verteilung bezeichnet. Im Video wird die Varianz der Grundgesamtheit als Sigma quadrat bezeichnet und wird als wichtiger Faktor für die Streuung der gefahrenen Kilometer diskutiert.

💡Grundgesamtheit

Die Grundgesamtheit oder Population ist die gesamte Gruppe, die in einer Studie oder Untersuchung von Interesse ist. Im Video bezieht sich die Grundgesamtheit auf alle Autofahrer in Deutschland, deren gefahrene Kilometer analysiert werden sollen.

💡Deskriptive Statistik

Deskriptive Statistik ist ein Zweig der Statistik, der Methoden und Verfahren zur Darstellung und Zusammenfassung von Daten verwendet. Im Video wird die Varianz als ein Beispiel aus der deskriptiven Statistik genannt, um die Streuung der gefahrenen Kilometer in der Stichprobe zu beschreiben.

💡Es quadrat von -1

Es quadrat von -1 (s²) ist eine Formel, die verwendet wird, um die Varianz einer Stichprobe zu schätzen. Im Video wird erklärt, dass die Varianz der Stichprobe, dividiert durch n-1, ein besserer Schätzer für die Varianz der Grundgesamtheit ist, da sie die Tendenz der Stichprobenvarianz, kleiner als die Populationsvarianz zu sein, korrigiert.

Highlights

Das Video untersucht die durchschnittliche jährliche Fahrleistung von PKWs in Deutschland.

Es gibt ungefähr 40 Millionen PKWs und Autofahrer in Deutschland.

Es ist unmöglich, alle 40 Millionen Autofahrer zu befragen, um den Durchschnitt zu berechnen.

Statistiken basieren auf Stichproben, um den Durchschnittswert zu schätzen.

Eine repräsentative Stichprobe von sechs Autofahrern wird verwendet, um den Durchschnittswert zu schätzen.

Der durchschnittliche Fahrleistungswert der Stichprobe beträgt 11.000 km pro Jahr.

Die Grundgesamtheit (oder Population) bezieht sich auf alle 40 Millionen Autofahrer in Deutschland.

Die Varianz der Grundgesamtheit kann nicht genau bekannt sein, da nicht alle Datenpunkte verfügbar sind.

Die Varianz einer Stichprobe wird als ES² berechnet und dient als Schätzwert für die Varianz der Grundgesamtheit.

Es wird erklärt, warum die Varianz der Stichprobe (ES²) tendenziell kleiner ist als die Varianz der Grundgesamtheit.

Es wird ein besserer Schätzwert für die Varianz der Grundgesamtheit vorgestellt: ES² von -1.

ES² von -1 ist immer größer als ES² und gibt einen ungefähren, aber besseren Schätzwert für die Varianz der Grundgesamtheit.

Die Stichprobe variiert, und der Mittelwert der Stichprobe ist variabler als der der Grundgesamtheit.

Die Stichprobenvarianz wird korrigiert, indem man nicht durch n, sondern durch n-1 dividiert, um einen erwartungsgerechten Schätzwert zu erhalten.

Je größer die Stichprobe, desto geringer ist der Unterschied zwischen n und n-1, was die Genauigkeit des Schätzwertes erhöht.

Der Mittelwert der Stichprobe (ICSC) wird als Schätzwert für den Mittelwert der Grundgesamtheit verwendet.

Die Stichprobenvarianz (ES² von -1) wird als Schätzwert für die Varianz der Grundgesamtheit (Sigma Quadrat) verwendet.

Transcripts

play00:00

in diesem video wollen wir die jährliche

play00:03

fahrleistung von pkws in deutschland

play00:06

anschauen wie viele kilometer absolviert

play00:09

ein auto oder ein autofahrer pro jahr im

play00:13

durchschnitt

play00:14

wenn wir uns vorstellen das ist die

play00:17

menge aller autofahrer in deutschland

play00:18

und die anzahl der pkw in deutschland

play00:21

ist ungefähr 40 millionen 40 millionen

play00:25

autofahrer in deutschland

play00:26

idealerweise würden wir einfach alle 40

play00:29

millionen autofahrer befragen und aus

play00:31

den angaben der autofahrer zur

play00:33

absolvierten kilometerzahl würden wir

play00:35

den durchschnitt bzw den mittelwert mühe

play00:38

ausrechnen

play00:39

in der praxis ist es aber fast unmöglich

play00:42

alle 40 millionen autofahrer zu befragen

play00:45

theoretisch ist es möglich aber es wäre

play00:47

viel zu aufwendig und zu teuer

play00:49

es würde auch viel zu lange dauern so

play00:51

dass während der befragung neue

play00:52

autofahrer dazu kommen andere ihr auto

play00:55

abgeben und so weiter so dass die

play00:57

ergebnisse unserer befragung schon

play00:58

veraltet werden bevor wir überhaupt

play01:00

fertig sind

play01:02

es gibt diesen mittelwert nun aber wir

play01:04

kennen ihn nicht würden wir alle

play01:06

datenpunkte kennen könnten wir den

play01:08

mittelwert ausrechnen in dem wir alle

play01:10

datenpunkte zusammenzählen und durch

play01:11

ihre anzahl teil also durch 40 millionen

play01:14

teilen mit unseren bescheidenen mitteln

play01:17

ist es aber unmöglich alle autofahrer zu

play01:19

befragen dieser weg schaltet aus was

play01:22

also können wir tun

play01:23

nun wir können den mittelwert zwar nicht

play01:25

exakt berechnen aber wir können ihn

play01:27

schätzen und wie machen wir das ganz

play01:31

einfach wir nehmen eine stichprobe wir

play01:34

nehmen eine stichprobe und berechnen den

play01:36

mittelwert der stichprobe und wir hoffen

play01:38

dass uns dieser mittelwert einen

play01:40

anhaltspunkt für den mittelwert aller

play01:41

autofahrer gibt und um unsere

play01:44

berechnungen einfach zu halten nehmen

play01:46

wir hier eine stichprobe vom umfang 6

play01:48

wir geben uns mühe dass unsere

play01:50

stichprobe möglichst repräsentativ für

play01:52

alle autofahrer ist natürlich wäre es

play01:55

besser eine größere stichprobe zu nehmen

play01:57

aber wir wollen nicht allzu viel rechnen

play01:59

und begnügen uns hier mit einer

play02:01

stichprobe von sechs auto fahren das ist

play02:03

unsere stichprobe und der umfang der

play02:06

stichprobe ist 6

play02:09

ist gleich sechs wir befragen also sechs

play02:12

autofahrer sagen wir der erste

play02:14

autofahrer ist letztes jahr 10.000

play02:16

kilometer gefahren und um uns etwas

play02:18

schreibarbeit zu ersparen wählen wir als

play02:20

einheit nicht kilometer sondern 1000

play02:23

kilometer der zweite autofahrer ist

play02:26

12.000 kilometer gefahren

play02:27

der dritte 5000 der vierte 8000 der

play02:33

fünfte 13.000 und der sechste 18.000 so

play02:40

das sind die werte unserer stichprobe

play02:42

welchen mittelwert bekommen wir für

play02:44

diese stichprobe und der mittelwert der

play02:47

stichprobe listig square und ick square

play02:51

ist gleich der summe geteilt durch die

play02:54

anzahl der damen punkte also gleich 10 +

play02:58

12 + 5 + 8 + 13 + 18 durch 6

play03:10

10 + 12 sind 22 + 5 sind 27 plus 8 sind

play03:15

35 13 sind 48 +18 sind 58 66 66 durch

play03:25

sechs gleich elf unser stichproben

play03:28

mittelwert icsc wer ist also gleich elf

play03:30

beziehungsweise 11.000 dieser

play03:33

stichproben mittelwert liegt uns jetzt

play03:36

als schätzung für den mittelwert mühe

play03:39

ist der mittelwert dieser 40 millionen

play03:42

und diese 40 millionen bezeichnen wir

play03:44

auch als grundgesamtheit grundgesamtheit

play03:49

wie ist der mittelwert der

play03:51

grundgesamtheit und ick square ist der

play03:53

mittelwert der stichprobe da wir den

play03:56

mittelwert mühlich kennen dient uns der

play03:58

stichproben mittelwert als schätzwert

play04:00

für mühe

play04:02

wir kennen den wert von nicht aber

play04:05

wenigstens haben wir jetzt ein

play04:06

schätzwert wir könnten noch einen

play04:07

besseren schätzwert kriegen wenn du mir

play04:09

eine größere stichprobe nehmen aber

play04:10

dieser schätzwert ist das beste das wir

play04:12

bisher haben wir haben also ein

play04:16

schätzwert für mühe für den mittelwert

play04:18

der grundgesamtheit manchmal wird die

play04:21

grundgesamtheit übrigens auch als

play04:23

population bezeichnet die

play04:26

grundgesamtheit ist die population

play04:28

grundgesamtheit und population ist

play04:30

dasselbe

play04:31

in der psychologie wird meistens der

play04:34

ausdruck population verwendet weil

play04:37

population bringt besser zum ausdruck

play04:39

dass man es mit einer grundgesamtheit

play04:40

von personen zu tun hat in der

play04:43

psychologie wenn eigentlich immer

play04:44

personen untersucht

play04:46

die statistische einheit in der

play04:48

psychologie der merkmals träger ist

play04:51

immer eine person und eine

play04:54

grundgesamtheit von person ist eine

play04:56

population also grundgesamtheit und

play04:59

population ist dasselbe

play05:00

das sind zwei synonyme für dieselbe

play05:03

sache icsc wer ist also der schätzwert

play05:07

für den mittelwert der grundgesamtheit

play05:09

oder für den mittelwert der population

play05:12

icsc wer ist der schätzwert für mühe

play05:16

eine andere interessante frage ist wie

play05:20

groß ist die varianz der grundgesamtheit

play05:23

wie groß ist sigma quadrat

play05:27

auch hier ist es wieder unmöglich den

play05:30

genauen wert zu kennen weil wir nicht

play05:32

alle daten punkte haben wir wissen die

play05:35

varianz ist die durchschnittliche

play05:36

quadrate abweichung würden wir alle

play05:40

datenpunkte kennen könnten wir sigma

play05:43

quadrat ausrechnen

play05:44

indem wir für jeden daten punkt die

play05:47

abweichung zum mittelwert der

play05:49

grundgesamtheit also die differenz zu

play05:53

nehmen

play05:54

diese differenz batterien alle

play05:57

differenzen aufsummieren und die summe

play05:59

aller dieser quadraten abweichungen

play06:01

durch die anzahl der grundgesamtheit

play06:03

also durch 40 millionen teil

play06:06

da wir aber weder alle daten punkte

play06:09

haben noch den genauen mittelwert nie

play06:11

kennen müssen wir uns auch hier wieder

play06:13

an unsere stichprobe halten

play06:15

wir berechnen also die varianz der

play06:17

stichprobe diese varianz die wir

play06:22

berechnen können kennen wir noch aus der

play06:24

deskriptiven statistik als es quadrat

play06:27

die varianz ist die durchschnittliche

play06:30

quadrate abweichung also für jeden daten

play06:34

punkt unserer stichprobe nehmen wir die

play06:37

abweichung also für den ersten daten

play06:40

punkt der erste daten punkt der

play06:42

stichprobe ist zäh - der mittelwert und

play06:46

gemeint ist der stich pro mittelwert

play06:49

square nicht der mittelwert müde

play06:51

grundgesamtheit den kennen wir ja nicht

play06:53

wir haben lediglich ein schätzwert für

play06:56

müll

play06:56

wir berechnen hier die varianz der

play06:59

stichprobe also nehmen wir auch den

play07:01

mittelwert der stichprobe also - icsc

play07:05

wer also - 11 zum quadrat plus 12 11 das

play07:12

ist die abweichung des zweiten

play07:13

datenpunkte zum quadrat plus der dritte

play07:18

daten punkt ist 511 zum quadrat plus 8

play07:23

11 zum quadrat

play07:25

+ 13 11 zum quadrat plus 18 11 zum

play07:31

quadrat

play07:32

das alles durch 6 10 -11 ist - einst zum

play07:40

quadrat ist +1 12 11 ist auch eins zum

play07:45

quadrat gleich 15 11 ist 6 zum quadrat

play07:50

ist 36 8 11 ist 3 zum quadrat gleich 9

play07:56

13 11 ist 2 zum quadrat gleich 48 10 11

play08:03

ist 7 zum quadrat das ist 49

play08:07

so eins plus eins ist 236 ist 38 +9 ist

play08:16

47 +4 ist 51

play08:20

+49 ist genau 100 durch sechs dass es

play08:27

gleich 100 geteilt durch sechs ist 16,7

play08:35

das ist die varianz es quadrat unserer

play08:39

stichprobe 16,7 das ist die

play08:43

durchschnittliche quadrate abweichung

play08:45

und diesen wert können wir auch als

play08:48

schätzwert für sigma quadrat nehmen für

play08:51

die varianz der grundgesamtheit das

play08:54

liegt natürlich nahe der mittel wird der

play08:57

stichprobe dient als schätzwert für den

play08:58

mittelwert der grundgesamtheit und die

play09:00

varianz der stichprobe dient als

play09:03

schätzwert für die varianz der

play09:04

grundgesamtheit das können wir so machen

play09:07

dass es kein schlechter schätzwert die

play09:10

frage ist ist es wirklich der beste

play09:13

schätzwert den wir haben und wie sich

play09:16

herausstellt gibt es für die varianz der

play09:18

grundgesamtheit tatsächlich noch einen

play09:21

besseren schätzwert und dieser bessere

play09:24

schätzwert ist nicht s quadrat sondern

play09:27

der beste schätzwert den wir mit der

play09:30

stichprobe ermitteln können ist es

play09:33

quadrat von minus 1

play09:36

was ist es quadrat von -1 es quadrat ist

play09:44

die summe der quadraten abweichungen

play09:49

geteilt durch m

play09:52

die durchschnittliche quadrate

play09:54

abweichung das ist bei uns 100 durch

play09:58

sechs das waren 16,7 es quadrat von -1

play10:05

ist die summe der quadraten abweichungen

play10:11

geteilt durch ein - 1 hier also 100

play10:18

durch fünf das ergebnis 16,7 sondern 20

play10:24

dieser wehrt diese 20 ist unser

play10:27

schätzwert für die varianz der

play10:29

grundgesamtheit diese 20 ist unser

play10:32

schätzwert für sigma quadrat

play10:35

das erscheint zunächst vielleicht etwas

play10:37

widersinnig wieso sollte das der bessere

play10:40

schätzwert sein

play10:41

wieso teil mir durch die n11 und nicht

play10:44

wm

play10:46

lasst uns zunächst festhalten dass es

play10:48

quadrat von -1 größer ist als es quadrat

play10:53

20 ist größer als 16,7 wenn der nenner

play10:57

kleiner wird und ein minus eins ist

play11:00

immer kleiner als n

play11:01

dann wird der gesamt ausdruck größer es

play11:05

quadrat von -1 ist also immer größer als

play11:08

es parat wenn wir also sagen dass es

play11:11

quadrat von -1 ein besserer schätzwert

play11:14

für sigma quadrat ist dann heißt das

play11:16

nichts anderes als wir gehen davon aus

play11:19

dass die durchschnittliche abweichung

play11:21

der grundgesamtheit größer ist als die

play11:23

durchschnittliche abweichung der

play11:25

stichprobe oder dass die streuung der

play11:28

grundgesamtheit größer ist als die strom

play11:30

mehr stichprobe die grundgesamtheit

play11:33

streut stärker bzw die stichprobe streut

play11:36

weniger warum sollte das so sein

play11:40

warum sträubt die stichprobe weniger nun

play11:44

das hängt damit zusammen wie wir die

play11:46

stichprobe nehmen natürlich werden wir

play11:48

uns immer bemüht bei der stichprobe

play11:50

möglichst repräsentative daten zu

play11:52

bekommen

play11:52

wir werden uns bemühen die sechs

play11:54

autofahrer möglichst zufällig

play11:56

auszuwählen aber egal wie viel mühe wir

play11:59

uns geben es gibt immer ein gewisses

play12:01

risiko dass diese sechs autofahrer nicht

play12:04

so ganz repräsentativ für alle

play12:06

autofahrer in deutschland sind nehmen

play12:09

wir mal ein einfaches beispiel nehmen

play12:11

wir an unsere grundgesamtheit besteht

play12:14

nicht aus 40 millionen sondern aus sechs

play12:17

autofahrer das ist der wertebereich und

play12:21

die absolvierte kilometerzahl unserer

play12:23

sechs autofahrer ist hier hier hier hier

play12:28

hier und hier

play12:31

der mittelwert der grundgesamtheit ist

play12:35

ungefähr hier jetzt nehmen wir zwei

play12:39

stichproben a3 daten elemente und um den

play12:43

sachverhalt zu veranschaulichen nehmen

play12:45

wir erst mal den ungünstigsten fall und

play12:47

sagen das ist unsere erste stichprobe

play12:50

und das ist unsere zweite stichprobe der

play12:55

mittelwert square der ersten stichprobe

play12:58

ist ungefähr hier und der mittelwert

play13:02

icsc wer zwei ist ungefähr hier die

play13:07

mittelwerte gleichen sich über mehrere

play13:09

stichproben wieder aus der durchschnitt

play13:12

dieser beiden stichproben mittelwerte

play13:14

ist hier ist das jetzt so weil die

play13:18

beiden stichproben alle werte der

play13:19

grundgesamtheit enthalten bei zwei

play13:21

anderen stichproben könnte das zwar

play13:23

anders sein aber wenn ich unendlich

play13:26

viele stichproben nehmen dann landen wir

play13:29

beim durchschnitt der mittelwerte am

play13:31

ende immer genau beim mittelwert müder

play13:33

grundgesamtheit der mittelwert der

play13:36

stichprobe ist erwartungsfroh so nennt

play13:39

man das

play13:40

aber für die varianz bekommen wir kein

play13:44

erwartungs tolles ergebnis

play13:46

die varianten beider stichproben sind

play13:49

kleiner als die varianz der

play13:51

grundgesamtheit die durchschnittlichen

play13:54

abweichungen zum jeweiligen stichproben

play13:56

mittelwert sind kleiner als die

play13:58

durchschnittliche abweichung der

play13:59

grundgesamtheit würden wir für jeden

play14:03

punkt der stichproben jeweils die

play14:04

abweichung zum mittelwert nehmen während

play14:07

die durchschnittliche abweichung aller

play14:08

stichproben zusammen wieder gleich der

play14:10

durchschnittliche abweichung der

play14:11

grundgesamtheit ist klar dann hätten wir

play14:14

genau die gleichen abweichungen aber die

play14:16

abweichungen zum jeweiligen stichproben

play14:18

mittelwert square sind anders die sind

play14:23

kleiner

play14:24

daher fällt die varianz einer stichprobe

play14:28

tendenziell also im durchschnitt aller

play14:30

stichproben kleiner aus als die varianz

play14:33

der grundgesamtheit das liegt jetzt

play14:37

nicht nur daran weil wir ein extremes

play14:38

beispiel haben nehmen wir an unsere

play14:41

erste stichprobe wäre hier hier und hier

play14:46

und die andere wäre hier hier und hier

play14:53

dann wäre der mittelwert der ersten

play14:55

stichprobe ein kleines bisschen links

play14:58

weil diese beiden punkte gleich weit von

play15:00

der mitte entfernt sind und dieser links

play15:03

ist und der mittelwert dieser stichprobe

play15:06

wäre recht

play15:07

auch hier ist der durchschnitt der

play15:10

varianten kleiner als die varianz der

play15:12

grundgesamtheit auch wenn mir unendlich

play15:16

viele stichproben nehmen wird der mittel

play15:18

wird einer jeden stichprobe fast immer

play15:21

ungleich mühsam weil der mittelwert der

play15:24

stichprobe selbst variabel ist wird die

play15:27

varianz der stichprobe tendenziell immer

play15:30

kleiner sein als die varianz der

play15:31

grundgesamtheit egal wie viel mühe wir

play15:34

uns geben eine repräsentative stichprobe

play15:36

zu wählen

play15:38

wichtig für uns ist nur dass die

play15:41

stichproben varianz nur dann

play15:43

erwartungsvoll ist wenn wir nicht durch

play15:46

n rechnen sondern durch n - 1 wir

play15:50

korrigieren die streuung des

play15:51

ich probe um einen erwartungsfrohen

play15:54

schätzwert zu bekommen wir rechnen durch

play15:56

ein minus 1 und der schätzwert wird

play15:59

dadurch ein klein wenig größer je größer

play16:03

man den umfang der stichprobe welt desto

play16:06

geringer ist der unterschied zwischen es

play16:08

quadrat und es quadrat von minus 1 je

play16:12

größer desto geringer der relative

play16:15

unterschied von ncm - 1 wenn ich eine

play16:18

stichprobe vom umfang eine million habe

play16:20

dann fällt der unterschied zwischen n

play16:22

und -1 kaum noch ins gewicht also der

play16:27

stichprobe mittelwert icsc wer ist unser

play16:31

schätzwert für den mittelwerte der

play16:33

grundgesamtheit und die stichproben

play16:36

varianz es quadrat von -1 ist unser

play16:40

schätzwert für die varianz der

play16:41

grundgesamtheit für sigma quadrat

Rate This

5.0 / 5 (0 votes)

Etiquetas Relacionadas
StatistikFahrleistungPKWDeutschlandStichprobeMittelwertVarianzDatenanalyseDeskriptivstatistikMustererhebung
¿Necesitas un resumen en inglés?