Deskriptive Statistik mit Excel
Summary
TLDRDieses Video bietet eine Einführung in deskriptive Statistik mit Excel, eine oft genutzte Software für die Analyse von Daten. Es erklärt Begriffe wie Stichprobe und deskriptive Statistik und zeigt, wie man mit Excel die Lage und Form von Daten mittels Mittelwert, Median und Standardabweichung beschreibt. Es wird ein Datensatz von Weinqualitätsdaten verwendet, um die Methoden zu demonstrieren, einschließlich Histogrammen und Boxplots. Der Fokus liegt auf der Anwendung von Excel für einfache statistische Analysen, bevor man sich für weiterführende Analysen auf R zurückgreift.
Takeaways
- 😀 Excel ist weit verbreitet und oft die erste Wahl für Datenanalyse, obwohl professionelle Statistikprogramme wie R existieren.
- 📊 Deskriptive Statistik ist ein Sammelbegriff für Verfahren zur Auswertung von Stichproben, die zur Hypothesenbildung und Beschreibung von Daten dienen.
- 📈 Eine Stichprobe ist eine repräsentative Teilmenge, die Merkmalsträger und deren Ausprägungen enthält, wie z.B. Geschlecht mit weiblich oder männlich.
- 📉 Deskriptive Statistik umfasst numerische Maße wie Mittelwert, Modus, Standardabweichung und grafische Verfahren wie Histogramme oder Boxplots.
- 📝 Die Skalierung der Merkmale ist entscheidend für die Wahl der deskriptiven Statistikmethoden; nominalskalierte Merkmale lassen keine Mittelwertbildung zu.
- 📋 Der Datensatz, der im Video verwendet wird, beinhaltet 99 Rotwein- und 4898 Weißweindaten mit 12 Merkmalen, darunter 'quality' für die Beurteilung durch Prüfer.
- 📊 Mittelwert, Median und Standardabweichung sind zentrale deskriptive Parameter, die mit Excel-Funktionen leicht berechnet werden können.
- 📈 Histogramme bieten einen visuellen Einblick in die Verteilung von Daten, wobei die Anzahl der Klassen und die Breite der Container angepasst werden können.
- 📉 Boxplots visualisieren die Verteilung von Daten und zeigen Ausreisser, die Median, Quartile und die Streuung.
- 🔍 Durch die Verwendung von Excel-Funktionen wie 'Teilergebnis' können Daten spezifischer Subgruppen analysiert werden, um z.B. den Restzuckergehalt nach Qualitätsbeurteilung zu untersuchen.
- 🎓 Der Modus ist ein nützlicher deskriptiver Parameter für ordinalskalierte Merkmale, um die häufigste Ausprägung zu identifizieren, wie z.B. die häufigste Qualitätsbeurteilung.
Q & A
Warum wird in dem Video Excel für die deskriptive Statistik anstatt eines professionellen Statistikprogramms wie R verwendet?
-Excel wird verwendet, weil es Teil des Microsoft Office Paketes ist und somit auf den meisten beruflich genutzten Computern installiert ist. Es ist oft die Software, mit der zuerst Daten analysiert werden.
Was ist deskriptive Statistik?
-Deskriptive Statistik ist ein Sammelbegriff für alle statistischen Verfahren, einschließlich grafischer Methoden, die zur Auswertung von Stichproben verwendet werden.
Was ist eine Stichprobe?
-Eine Stichprobe ist eine repräsentative Teilmenge der Grundgesamtheit, die Merkmalsträger enthält, wie z.B. Geschlecht, die mit bestimmten Merkmalen wie weiblich oder männlich ausgeprägt sind.
Welche deskriptive Statistik wird in dem Video anhand von Weinqualitätsdaten dargestellt?
-Das Video zeigt deskriptive Statistikverfahren wie Anzahl der Beobachtungen, Minimum, Maximum, Mittelwert, Median und Standardabweichung für das Merkmal Restzuckergehalt des Weins.
Wie wird die Anzahl der Beobachtungen in Excel ermittelt?
-In Excel wird die Anzahl der Beobachtungen mit der Funktion 'Anzahl' ermittelt, die in die Zelle neben der Spalte der Beobachtungen eingefügt wird.
Was sind die Lageparameter und Streuungsparameter in der deskriptiven Statistik?
-Lageparameter wie Mittelwert und Median beschreiben die zentrale Lage der Daten, während Streuungsparameter wie die Standardabweichung die Variabilität und Streuung der Daten darstellen.
Wie wird ein Histogramm in Excel erstellt?
-In Excel wird ein Histogramm erstellt, indem man die Daten auswählt und dann die Funktion für Histogramm aus dem Diagrammbereich aufruft. Man kann die Anzahl der Klassen oder die Containerweite anpassen, um die Darstellung zu optimieren.
Was ist ein Boxplot und wie wird er in Excel dargestellt?
-Ein Boxplot ist ein Diagramm, das die Verteilung von Daten zeigt, indem es die Median, Quartile und Ausreisser visualisiert. In Excel wird ein Boxplot als 'Kastengrafik' bezeichnet und kann aus dem Diagrammbereich erstellt werden.
Was ist die Bedeutung von 'Teilergebnis' in Excel?
-Die 'Teilergebnis'-Funktion in Excel ermöglicht es, die deskriptive Statistik für eine Teilmenge der Daten zu berechnen, indem man die Funktion für die gewünschten Parameter auf die ausgewählten Daten anwendet.
Welche Skalentypen werden im Video erwähnt und was bedeuten sie?
-Im Video werden nominal, ordinal, intervall und verhältnisskalierte Skalentypen erwähnt. Nominalskalierte Merkmale sind qualitative Merkmale, ordinalskalierte Merkmale können geordnet werden, intervalskalierte Merkmale haben definierte Abstände, und verhältnisskalierte Merkmale sind quantitativ und können als Quotient interpretiert werden.
Wie wird der Modus in Excel berechnet?
-Der Modus in Excel wird mit der Funktion 'MODE.SNGL' berechnet, die den am häufigsten vorkommenden Wert in einer Datenmenge findet.
Was ist der Zweck des Filters in Excel, wenn man die deskriptive Statistik für verschiedene Qualitätsbeurteilungen anschauen möchte?
-Der Filter ermöglicht es, die deskriptive Statistik für verschiedene Kategorien oder Qualitätsbeurteilungen zu analysieren, indem man die gewünschten Werte auswählt und die entsprechenden statistischen Parameter angezeigt werden.
Outlines
📊 Deskriptive Statistik mit Excel
Dieses Video erklärt, warum Excel für deskriptive Statistikanalysen anstatt eines professionellen Statistikprogramms wie R verwendet wird. Excel ist weit verbreitet, da es Teil des Microsoft Office Paketes ist. Das Video zeigt, wie man mit Excel die Erstanalyse von Daten durchführt und weist darauf hin, dass für erweiterte Analysen R besser geeignet ist. Deskriptive Statistik beinhaltet Verfahren zur Auswertung von Stichproben, um die Lage und Form der Verteilung zu beschreiben, z.B. durch Mittelwert, Modus, Histogramme oder Boxplots. Der Datensatz, der verwendet wird, enthält Weinqualitätsdaten und hat 12 Merkmale. Die deskriptive Statistik soll die Hypothesenbildung unterstützen, ohne eine detaillierte statistische Analyse durchzuführen.
📈 Anwendung von Excel-Funktionen für deskriptive Statistik
In diesem Abschnitt wird gezeigt, wie man mit Excel die deskriptive Statistik für den Restzuckergehalt in Weinen durchführt. Es werden die Funktionen 'Anzahl', 'Min', 'Max', 'Mittelwert', 'Median' und 'StDev' (Standardabweichung) verwendet, um die deskriptive statistischen Parameter für das Merkmal zu schätzen. Anschließend wird ein Histogramm und ein Boxplot erstellt, um die Verteilung der Daten zu visualisieren. Es wird auch erklärt, wie man mit Excel-Filtern die Daten nach Qualitätsbeurteilung aufteilt und die deskriptive Statistik für diese Untergruppen berechnet.
📉 Skalentypen und ihre Anwendung in der deskriptiven Statistik
Der letzte Absatz behandelt die Bedeutung der Skalentypen in der deskriptiven Statistik. Es werden vier Skalentypen erläutert: nominal, ordinal, intervall und verhältnisskaliert. Jeder Skalentyp hat einen anderen Informationsgehalt und bestimmt, welche deskriptive Statistikmethoden angemessen sind. Nominalskalierte Merkmale erlauben keine Mittelwertbildung, während ordinalskalierte Merkmale den Modus angeben können. Intervall- und verhältnisskalierte Merkmale erlauben eine umfangreichere deskriptive Analyse, einschließlich Mittelwert, Median und Standardabweichung. Das Beispiel des ordinalskalierten Merkmals 'Qualität' zeigt, wie man den Modus berechnet, um die häufigste Qualitätsbeurteilung zu ermitteln.
Mindmap
Keywords
💡Deskriptive Statistik
💡Stichprobe
💡Merkmale
💡Excel
💡Histogramm
💡Boxplot
💡Mittelwert
💡Standardabweichung
💡Qualitätsbewertung
💡Skalentypen
💡Modus
Highlights
Excel ist oft die Software, mit der Daten zuerst analysiert werden.
Deskriptive Statistik ist ein Sammelbegriff für statistische Verfahren zur Auswertung von Stichproben.
Stichprobe ist eine repräsentative Teilmenge der Grundgesamtheit.
Merkmale werden bezüglich ihrer Ausprägung mit statistischen Verfahren ausgewertet und beschrieben.
Die Verfahren der deskriptiven Statistik dienen zur Hypothesenbildung und Beschreibung der Verteilung.
Excel-Funktionen wie Mittelwert, Median und Standardabweichung werden verwendet, um deskriptive statistische Parameter zu schätzen.
Histogramme und Boxplot werden verwendet, um die Verteilung von Daten zu visualisieren.
Die Skalierung der Merkmale ist bei der Berechnung von deskriptiven Statistiken zu berücksichtigen.
Excel-Funktionen wie Anzahl, Min, Max, Mittelwert und Median werden verwendet, um deskriptive statistische Parameter zu schätzen.
Die Verwendung von Excel-Funktionen zur Darstellung von Daten in Tabellen und Grafiken wird demonstriert.
Die Anwendung von Excel-Funktionen zur Analyse von Weinqualitätsdaten wird gezeigt.
Die Bedeutung der Skalentyp bei der Berechnung von Lage- und Formparametern wird erläutert.
Der Modus als Lageparameter für ordinalskalierte Merkmale wird verwendet.
Die vier Skalentypen nominal, ordinal, Intervall und Verhältnisskalierter werden erklärt.
Die praktische Anwendung von Excel zur deskriptiven Statistik wird anhand von Weinqualitätsdaten veranschaulicht.
Die Verwendung von Excel-Funktionen zur Filterung und Analyse von Daten nach Kategorien wird gezeigt.
Die Bedeutung der Datenskalen für die Auswahl der richtigen statistischen Verfahren wird betont.
Das Video endet mit der Feststellung, dass die Qualitätsbeurteilung Note 5 am häufigsten vergeben wurde.
Transcripts
[Musik]
willkommen zum Video deskriptive
Statistik mit Excel se möglicherweise
die Frage warum für statistische
Auswertung Excel und nicht ein
professionelles Statistikprogramm wie
beispielsweise R verwendet wird nun
Excel ist Bestandteil des Microsoft
Office Paketes und somit auf den meisten
beruflich genutzten Computern
installiert dadurch ist es oft die
Software mit der zuerst die
vorliegendeen Daten analysiert werden
mit diesem Video möchte ich Sie bei der
Erstanalyse Ihrer Daten unterstützen ich
möchte aber auch darauf hinweisen dass
sie für weiterführende Analysen auf die
statistikumgebung R zurückgreifen
sollten bevor wir in die beschreibende
Datenanalyse einsteigen müssen einige
Begrifflichkeiten geklärt
werden deskriptive Statistik bedeutet
beschreibende Statistik sie ist ein
Sammelbegriff für alle statistischen
einschließlich grafischen Verfahren die
zur Auswertung von Stichproben verwendet
werden eine Stichprobe ist eine
repräsentative Teilmenge der grundgesamt
hat Menge aller Objekte die Teilmenge
enthält Merkmalsträger und die Merkmale
wie z.B Geschlecht sind ausgeprägt mit
mit z.B weiblich
männlich die Merkmale werden bezüglich
ihrer Ausprägung über die statistischen
Verfahren ausgewertet und dch
beschrieben die Auswertung dient dabei
nur zur
Hypothesenbildung die Verfahren dient
zur Beschreibung der Lage der Verteilung
z.B über den Mittelwert oder Modus Form
der Verteilung Streuung schiefe
insbesondere über Grafiken wie z.B das
Histogramm oder den Boxplot
bei der Verwendung der Verfahren ist
drauf zu achten dass die Skalierung der
Merkmale berücksichtigt
werden die Verfahren der deskriptiven
Statistik werden in diesem Video anhand
von erhobenen weinqualitätsdaten
dargestellt möchten Sie diese Verfahren
auf Basis dieses Datensatzes nachstellen
können Sie ihn über den eingeblendeten
Link downloaden noch ein letzter Hinweis
weiterführende Informationen und
Erklärungen finden Sie auf den
Internetseiten von
www.facede der zugrunde liegende
weindatensatz beinhaltet Qualitätsdaten
von Rot und Weißwein und eine
Beschreibung des
Datensatzes neben den nutzungshinweisen
und herkunftsinformationen werden die
einzelne Merkmale und deren Ausbringung
beschrieben die schprobe besteht aus99
Rotwein und
4898 weißweindaten der vinerde
weinvariante insgesamt besteht der
Datensatz aus 12 Merkmalen
das Merkmal quality stellt die
beurteilungchen Prüfer da als Beispiel
zur deskriptiven Statistik verwenden wir
das Merkmal residual sugar oder auch
Restzuckergehalt des Weins am Ende der
Tabelle legen wir die statistischen
Parameter zur Beschreibung der Lage und
Form des Merkmals ab zuerst die Anzahl
der
Beobachtungen dann den
kleinsten und größten Messwert
beobachteten wert
den Mittelwert und median als
lageparameter und die Standardabweichung
als streuungsparameter
als nächstes erfolgt ein wenig Kosmetik
das heißt die Zellen werden
formatiert nun fügen wir aus der
Kategorie Statistik die Funktion Anzahl
in der rechten Zelle neben Anzahl
Beobachtung für die gesamten mit Inhalt
gefüllten Zellen ein
danach wird die Funktion min für den
kleinsten Wert und Max für den größten
Wert in der entsprechenden Zelle
eingefügt
nun Max für den größten
Wert wieder für die gesamten
Inhalt als nächstes erfolgt die Funktion
Mittelwert
um es ganz genau zu nehmen für den
arithmetischen
Mittelwert formatieren die Darstellung
noch auf zwei Nachkommastellen
und fügen dann für die median die
Funktion median
ein als letzte Funktion wird die
Funktion Star ABW
da ist sie
ja zur Schätzung der Standardabweichung
ausgehend von einer Stichprobe
eingefügt zur Darstellung wird das nach
stellenformat der mittelwertzelle
übernommen damit haben wir die
beschreibenden statistischen Parameter
zu diesem Merkmal geschätzt der
Statistiker sagt geschätzt weil wir von
einer Stichprobe ausgehen und keine 100%
datenhebung durchgeführt
haben nun fügen wir eine Grafik
ein und zwar stellen wir die ausprügung
des Merkmal Restzucker als Histogramm
ein um uns immer Eindruck über die
Verteilung zu machen die dargestellte
Klassenzahl ist noch nicht
optimal und mit einem Mausklick bietet
uns Excel ein Menü zur Achsen Formation
ein excellent Klassen
Container was uns aber nicht weiter
stört und ändern die containerweite
beispielsweise auf 0,8 ab die
Darstellung ist noch nicht optimal aber
als nächstes vergeben wir trotz alledem
einen
diagrammtitel als Beispiel für ein
Histogramm soll es uns genügen und nun
verschaffen wir uns einen weiteren verte
überblick der Daten über einen Boxplot
in Excel wird der Boxplot kastengrafik
genannt hier
kastengrafik und das ist der
Boxplot die Verteilung wird sehr schön
dargestellt und sieht ein wenig durch
die Varianten mit einem sehr hohen
restzuckerwert extrem aus trotzdem l
sich der abgebild mit dem Medi mit dem
Medium in der Zelle recht gut
vergleichen was ja auch so sein
sollte kommen wir nun zu einer Excel
Stärke damit wir nicht den Überblick
verlieren fixieren wir die erste
Tabellenzeile und setzen einen Filter
für die
Merkmale nun schauen wir uns den
Restzuckergehalt in Abhängigkeit der
gewähten Qualitätsbeurteilung an wir
wählen beispielhaft die Note 5 aus und
springen in die letzte Zeile und stellen
fest dass weiterhin alle Beobachtungen
Werte berücksichtigt werden das war
nicht unser Plan um nur die Parameter
für den restzckergal zur qualitätsnote 5
dargestellt zu bekommen muss auf die
Excel Funktion Teilergebnis
zurückgegriffen werden diese Funktion
setzen wir für alle Parameter bis auf
den Median ein
hier die Teilfunktion für den kleinsten
Wert Max für den größten Wert
die Teilfunktion für den
Mittelwert für die median wird die
teilergebnisfunktion nicht angeboten
deswegen löschen wir die
Zeile und als
letztes Pass wir die Zelle an mit der
teilergebnisfunktion für die
Standardabweichung
die Darstellung entspricht nun unseren
Erwartungen wir haben 681 Ergebnisse
selektiert und wählen jetzt nun eine
andere Qualitätsbeurteilung aus und
stellen fest es funktioniert für die
Qualitätsbeurteilung 3 liegen nur 10eh
Beobachtungen vor
und auf diese zehn Beobachtungen wurden
die Werte die Parameter geschätzt das
ganze machen wir jetzt noch für die
Qualitätsbeurteilung
8 und hier liegen 18 Beobachtung vor und
die restlichen Parameter
dementsprechend wie eingangserwähnt ist
der skalentyp bei der Berechnung bzw
Schätzung der Lage und formparameter
wichtig es macht z.B keinen Sinn einen
arithmetischen Mittelwert für
nominalskalierte Merkmale zu
berechnen im Folgenden werden wir für
das ordinalskalierte Merkmal quality
also die Beurteilung durch den Tester
als lageparameter den Modus schätzen
vorher aber noch eine kurze Übersicht
über die verschiedenen skalentypen und
deren
Informationsgehalt diese Übersicht zeigt
die vier skalentypen nominal ordinal
Intervall und Verhältnis skaliert der
nominale Typ ist ein qualitatives
Merkmal und steht für ausbregung wie z.B
Geschlecht oder Farben eine
Mittelwertbildung oder Schätzung der
Standardabweichung macht für diesen
skalentyp keinen Sinn der originale Typ
ist ebenfalls ein qualitatives Merkmal
und steht für die Ausprägungen die
geordnet werden können wie z.B
Schulnoten Merkmale des Typs nominal
oder ordinal werden auch als kategoriale
Merkmale bezeichnet
intervallskalitetypen sind quantitative
Merkmale und stehen für Ausprägung wie
Abstände Reihenfolge wie z.B Temperatur
Zeiten und so weiter
verhältnisskalierte Typen runden die
skalentypen ab sie stehen für
quantitative intervallskalierte Merkmale
die z.B als quozient interpretierbar
sind Intervall und verhältnisskalierte
Typen werden auch als kardinalskalierte
oder metrische merkmalstypen
bezeichnet der Informationsgehalt der
Merkmale steigt von links nach rechts
an der Modus für das Merkmal quality
zeigt die Qualitätsbeurteilung mit der
häufigsten Ausprägung
also welche qualitätsnote am häufigsten
vergeben
wurde der vollständigkeitthalber
ermitteln wir auch die Anzahl der
Beobachtungen den kleinsten Wert und den
größten Wert der Ausbringung quality
dazu kopieren wir die drei Funktionen
unter die Spalte
quality wie gewohnt geben wir die
Bezeichnung des Parameters ein und dann
wählen wir die Funktion
modus.1 aus ein für
einfach so ein bisschen suchen
modus.1 und den
Wertebereich wir werden wieder alle
Werte der Spalte quality
auswählen und nach okay wird der
ermittelte Modus angezeigt die häufigst
vergebene Qualitätsbeurteilung ist die
Note 5 mit dieser Feststellung wird das
Video deskriptive Statistik mit Excel
beendet und ich freue mich wenn ich
Ihnen damit weiterhelfen kann ich freue
mich natürlich auch über jede Art der
Unterstützung vielen Dank für Ihre
Aufmerksamkeit
[Musik]
[Applaus]
[Musik]
Weitere ähnliche Videos ansehen
Statistik: Inferenzstatistik vs deskriptive Statistik - FernUni Hagen - Psychologie
Power BI Tutorial für Anfänger in 25 Minuten! (Deutsch / German)
Feed-forward method | Neural Style Transfer #5
Boxplots - Zeichnen, Interpretieren, Ausreißer - einfach erklärt
Online-Bewerbung – die 4️⃣ Arten, sich online zu bewerben
Crashkurs für Anfänger | Canva Tutorial Deutsch
5.0 / 5 (0 votes)