Unüberwachtes Lernen | Die Welt der KI entdecken 07
Summary
TLDRDieses Video führt durch die Welt der künstlichen Intelligenz, insbesondere in das Thema des überwachten Lernens. Es erklärt, wie Computer ohne vorherige Beschriftung von Daten lernen können, anhand des Beispiels eines Goldgrabens im Wilden Westen. Der Fokus liegt auf der Identifizierung von Mustern und Clustern in Daten, um Anwendungen wie die Marktanalyse, die Personalisierung von Werbung oder das Erkennen von Betrug zu ermöglichen. Das Video bietet einen Einblick in die Anwendung von Algorithmen, die ohne Beschriftung große Datenmengen analysieren und Muster erkennen können.
Takeaways
- 🧠 Überwachtes Lernen: Der Computer lernt aus einer großen Menge von beschrifteten Daten, was etwas ist.
- 🔍 Unbeschriftete Daten: In diesem Fall haben wir viele Daten, aber keine Beschriftung, um zu wissen, ob es ein guter Punkt zum Graben ist oder nicht.
- 🎲 Spiel als Beispiel: Das Beispiel des Goldgrabens im Wilden Westen veranschaulicht, wie man mit unbeschrifteten Daten umgehen kann.
- 📍 Datenpunkte: Berichte über Goldfunde mit x- und y-Koordinaten sind die Grundlage für die Analyse.
- 👷♂️ Grabungsteams: Die Positionierung der Grabungsteams mittig in einem Goldfeld ist das Ziel, um reich zu werden.
- 🗺️ Kartendarstellung: Eine Karte des Wilden Westens hilft, die Positionen der Goldfunde zu visualisieren.
- 🤖 Algorithmusentwicklung: Durch das Verarbeiten der Goldfunde nacheinander und die Identifizierung des nächsten geeigneten Grabungsteam entwickelt sich ein Algorithmus für überwachtes Lernen.
- 🔑 Ähnlichkeitsfindung: Der Algorithmus findet Ähnlichkeiten und Muster in den Eingabedaten, um Gruppen oder Cluster zu identifizieren.
- 📊 Clusteranalyse: In Marketing kann Clusteranalyse dazu verwendet werden, Kundengruppen zu identifizieren und gezielt anzusprechen.
- 🛒 Anwendungsbeispiel: Online-Shop-Daten, wie der durchschnittliche Preis und die Anzahl der Käufe pro Kunde, können mit ähnlichen Methoden analysiert werden.
- 📚 Topic Modeling: Überwachtes Lernen kann auch für das Finden von Themen in Textdokumenten verwendet werden, indem ähnliche Wörter gruppiert werden.
- 🚨 Betrugserkennung: Überwachtes Lernen hilft auch beim Erkennen von Anomalien, wie z.B. atypische Kreditkartentransaktionen.
Q & A
Was haben wir in der heutigen Station der Reise durch die Welt der künstlichen Intelligenz gelernt?
-Wir haben gelernt, wie ein überwachtes Lernverfahren mit unbeschrifteten Daten umgehen kann, indem es Ähnlichkeiten in großen Datenmengen findet, um Muster und Gruppen zu identifizieren.
Was ist das Ziel des Spiels im Video?
-Das Ziel ist es, durch die Positionierung von Grabungsteams im Wilden Westen nach Gold zu graben und so reich zu werden.
Wie viele Grabungsteams stehen im Spiel zur Verfügung?
-Im Spiel stehen drei Grabungsteams zur Verfügung, die durch Münzen symbolisiert werden.
Wie viele Goldfunde dürfen sich gleichzeitig anschauen?
-Im Spiel dürfen sich immer nur einen Goldfund gleichzeitig anschauen.
Was repräsentieren die Berichte über Goldfunde?
-Die Berichte über Goldfunde enthalten Informationen über die jeweiligen x- und y-Koordinaten, die die Position des Goldfundes beschreiben.
Wie wird die Position eines Grabungsteames im Spiel festgelegt?
-Die Position eines Grabungsteames wird durch das Hinlegen einer Münze auf der Karte des Wilden Westens festgelegt.
Was ist der Unterschied zwischen unbeschrifteten und beschrifteten Daten?
-Beschriftete Daten enthalten zusätzliche Informationen oder Kategorien, während unbeschriftete Daten nur die Grundinformationen ohne zusätzliche Klassifizierung bieten.
Was ist das Ziel des Algorithmus im Goldrausch-Beispiel?
-Das Ziel ist es, Gruppen von Goldfunden zu identifizieren und die Grabungsteams entsprechend zu positionieren, um die effizientesten Goldadern zu finden.
Wie kann das überwachte Lernen in der Praxis eingesetzt werden?
-Überwachtes Lernen kann eingesetzt werden, um Muster in Daten zu erkennen, z.B. für die Kundendatenanalyse, um Werbung und Aktionsangebote individuell anzupassen.
Was ist Clusteranalyse im Marketing?
-Clusteranalyse im Marketing ist die Einteilung von Kunden in verschiedene Gruppen, um jede Zielgruppe individuell und effektiver anzusprechen.
Was ist Topic Modeling?
-Topic Modeling ist die Erkennung von Themen in Textdokumenten durch das Finden von Gruppen ähnlicher Wörter, die bestimmte Themen repräsentieren.
Was ist der Unterschied zwischen überwachtem und unüberwachtem Lernen?
-Überwachtes Lernen verwendet beschriftete Daten, um Muster zu erkennen und zu lernen, während unüberwachtes Lernen ohne Beschriftung arbeitet und Muster oder Ausreißer in den Daten selbst findet.
Was ist der letzte Einsatzbereich für maschinelles Lernen, der im Video erwähnt wird?
-Der letzte Einsatzbereich ist die Betrugserkennung durch das Finden von Anomalien in Daten, z.B. bei Kreditkartentransaktionen.
Outlines
🤖 Einführung in das überwachte Lernen
Dieses Kapitel stellt das Konzept des überwachten Lernens vor, indem es ein Spiel als Einführungspunkt nutzt. Das Ziel ist es, durch das Sammeln von Gold im Wilden Westen, ein Verständnis für das Lernen aus großen Mengen von Daten zu entwickeln, ohne dass diese Daten vorher beschriftet sind. Es wird ein einfaches Modell vorgestellt, bei dem man auf der Grundlage von Goldfundberichten und Koordinaten mithilfe von Grabungsteams (Symbolisiert durch Münzen) versucht, die besten Positionen zu finden. Der Prozess umfasst das Identifizieren von Mustern und das Bewegen der Teams in Richtung neuer Fundorte, um die effektivsten Positionen zu ermitteln.
🔍 Identifizierung von Muster und Clustern
In diesem Abschnitt wird erklärt, wie ein Computer ähnlichkeitsmuster in unbeschrifteten Daten erkennen kann. Es wird ein Algorithmus beschrieben, der es ermöglicht, Gruppen von Goldfunden zu identifizieren, indem er ähnliche Muster in den Eingabedaten sucht. Der Roboter vergleicht die Daten und versucht, ähnliche Muster zu finden, basierend auf der Anzahl und Ecken, ähnlich wie bei der Identifizierung von Goldfunden mit ähnlichen Koordinaten. Durch das Finden dieser Muster können Cluster oder Ausreißer identifiziert werden, was für verschiedene Anwendungen, wie z.B. die Analyse von Kundendaten in einem Onlineshop, nützlich ist.
📚 Anwendungen des überwachten Lernens
Dieser letzte Abschnitt diskutiert verschiedene Anwendungsbereiche des überwachten Lernens, wie z.B. die Clusteranalyse in Marketing, um Kundengruppen zu identifizieren und gezielt anzusprechen, oder das Thema von Textdokumenten mit Hilfe von Textmining zu erkennen. Es wird auch auf die Anwendung in der Betrugserkennung durch das Finden von Ausreißern in Daten eingegangen. Der Abschnitt zeigt, wie überwachtes Lernen dazu beitragen kann, Muster in großen Datenmengen zu erkennen und diese für verschiedene Zwecke zu interpretieren, ohne dass der Computer die Daten vorher mit Beschriftungen versehen muss.
Mindmap
Keywords
💡Künstliche Intelligenz
💡Überwachtes Lernen
💡Unbeschriftete Daten
💡Cluster
💡Goldgraben
💡Muster
💡Algorithmus
💡XY-Koordinaten
💡Maschinelles Lernen
💡Anomalien
Highlights
Begrüßung und Einführung in die Welt der künstlichen Intelligenz (KI).
Überblick über das Konzept des überwachten Lernens und dessen Anwendungen.
Erklärung der Herausfordere, die auftreten, wenn viele Daten ohne Beschriftung vorliegen.
Einführung in ein Spiel als Analogie, um das Konzept des überwachten Lernens zu veranschaulichen.
Beschreibung des Goldgrabens im Wilden Westen als Beispiel für das überwachte Lernen.
Erklärung der Bedeutung einer guten Positionierung von Grabungsteams für Reichtum.
Darstellung der Verwendung von Berichten über Goldfunde und deren Koordinaten.
Beschreibung des Prozesses, bei dem nur einen Goldfund gleichzeitig angesehen werden darf.
Die Vorgehensweise, bei der die Positionen der Grabungsteams mit Münze symbolisiert werden.
Die Anwendung eines Algorithmus, um Goldfunde zu verarbeiten und Teams zu positionieren.
Das Konzept der Clustererkennung bei der Analyse von Goldfunden.
Die Erstellung eines Algorithmus für überwachtes Lernen auf Basis von ungebeschrifteten Daten.
Die Anwendung von Clusteranalysen im Marketing, um Kundendaten zu segmentieren.
Die Vorstellung von Anwendungsfällen für überwachtes Lernen in der Textanalyse und Thema-Modellierung.
Die Erklärung, wie ein Computer Ähnlichkeiten in Textdokumenten erkennen kann.
Das Konzept der Betrugserkennung durch das Finden von Anomalien in Daten.
Die Zusammenfassung der Vorteile von überwachtem Lernen für die Analyse große Datenmengen.
Aussicht auf die Implementierung des Lernverfahrens in Snap und die Gegenüberstellung der drei Arten des maschinellen Lernens.
Transcripts
hallo und herzlich willkommen zur
heutigen station auf unserer reise durch
die welt der künstlichen intelligenz in
den letzten zwei einheiten haben wir
überwachtes lernen kennen gelernt dabei
lernt einem computer aus einer großen
menge von beschrifteten daten was ist
aber wenn wir zwar viele daten zur
verfügung haben aber keine beschriftung
heute wollen wir lernen wie eine
überwachte lernverfahren mit solchen
daten umgehen und erneut wollen wir mit
einem spiel anfangen
wir wollen reich werden und zwar indem
wir den wilden westen nach gold graben
dazu haben wir viele daten in form von
berichten von goldfunden und drei
grabungsteams zur verfügung
dieses grabungsteams sind durch eine
münze symbolisiert natürlich wollen wir
unsere grabungsteams so gut wie möglich
positionieren um so reich wie möglich zu
werden
doch wann ist ein grabungsteam gut
positioniert das ist es dann wenn es
möglichst mittig in einem gold fällt
liegt so wie hier
was wir nun zur verfügung haben ist eine
reihe von berichten über goldfunden mit
den jeweiligen ickx und y koordinaten
und eine karte des wilden westens die
regeln sind dass sich immer nur einen
der goldfunde gleichzeitig anschauen
darf und als hilfsmittel eben nur meine
drei münzen also grabungsteams zur
verfügung habe
nachdem ich alle goldfunde verarbeitet
habe muss ich die finalen grabungs
positionen meiner drei teams festlegen
und kann dann anfangen zu graben den
ersten golf und habe ich nun schon
gezogen
der lag bei x9 und oops i lon 8
nun gut diese position können wir uns
merken indem wir eine der münzen dort
hinlegen
okay nun der zweite gold fund der liegt
bei ex 23 und y 12 noch einmal kann ich
mir die position mit einer münze merken
das funktioniert jetzt auch ein drittes
mal
aber was jetzt wenn du selber damit
experimentieren willst haustiere das
video und eröffnet den link in der
beschreibung
dort kannst du deine eigenen ideen
ausprobieren die drei münzen werden
dabei zunächst zufällig platziert ich
werde für meine nächsten gold fund
einfach das nächste team auswählen und
ein wenig ungefähr die hälfte in
richtung des neues des neuen golf bundes
bewegen
auch für den nächsten gold fund gehe ich
genauso vor
ich bestimme den nächsten prototyp und
bewege ihn die hälfte der strecke in
richtung des neuen gold fundes genauso
verarbeiten wir alle weiteren goldfunde
[Musik]
ok jetzt kommt ein moment der wahrheit
haben wir unsere grabungs position
grabungsteams gut positioniert
ok zwei teams liegen passt fast perfekt
mittig in einem der goldfelder das
dritte team ist hier ein wenig zu weit
rechts
fassen wir unser spiel also noch mal
zusammen wir hatten einen haufen
eingabedaten in der form von berichten
über goldfunde und wir haben diese
goldfunde nacheinander verarbeitet und
für jeden einzelnen das jeweils nächste
grabungsteam identifiziert und es dann
ungefähr die hälfte der strecke in die
richtung des neuen golf und es bewegt
dieser algorithmus ermöglicht es uns
gruppen von goldfunden zu identifizieren
und damit haben wir tatsächlich einen
algorithmus für ein überwachtes lernen
entwickelt als eingabe haben wir eine
menge unbeschriftete daten erhalten also
bericht über goldfunde und deren
entsprechende xy koordinaten
was wir aber nicht hatten waren
informationen darüber ob das jetzt ein
guter punkt zum graben ist oder nicht
auch unser roboter der mittlerweile
kennt hat hier eine menge unbeschriftete
eingaben geometrische formen
nur diesmal ohne beschriftungen wie a b
oder c
die wir bei überwachten lernen ja noch
hatten der roboter vergleicht nun die
daten und versucht ähnlichkeit nun
muster innerhalb der eingabedaten zu
finden
im schaubild hat er beispielsweise
ähnlichkeiten auf basis der anzahl und
ecken gefunden
genauso haben wir goldfunde mit
ähnlichen ickx und y koordinaten
identifiziert basierend auf diesen
ähnlichkeiten nun mustern können nun
gruppen oder wir sprechen noch manchmal
von clustern bzw
ausreißer identifiziert werden konkret
konnte der roboter gruppen wie formel
mit dreiecken oder ausreißer wie
beispielsweise den kreis identifizieren
mit unseren grabungsteams konnten wir
vorhin goldadern also gruppen von
goldfunden identifizieren
mit dem grabungsteams hatten wir
außerdem für jedes dieser cluster eine
große fügung also eine beschreibung
davon wie ein typisches mitglied der
entsprechenden gruppe aussieht passen
wir das ganze noch einmal zusammen beim
in überwachten lernen
der unbeschriftete eingabedaten aus
denen eine gewisse struktur ableiten
wollen indem wir einfach die beziehung
zwischen den verschiedenen datenpunkten
betrachten wir können zwar angeben wie
viele gruppen wir vermuten können aber
nicht vorab spezifizieren welche gruppen
befinden wollen genauso wenig können wir
feedback darüber geben ob das trainierte
modell das gelernte gut ist oder eben
nicht genau deshalb sprechen wir auch
von überwachten lernen und überwachte
lernverfahren sind relativ ähnlich zu
statistik und werden häufig zu
statistischen zwecken eingesetzt und in
der praxis wollen wir vermutlich eher
weniger gruppen von goldfunden im wilden
westen finden sondern zum beispiel
kundendaten analysieren unsere daten
sind in diesem fall die kunden unseres
onlineshops anstatt von xy koordinate
haben wir nun den durchschnittlichen
preis eines einkaufs und die anzahl der
käufe pro kunde in diesem kleinen
beispiel datensatz sehen wir zwei
cluster in unseren daten
wenn wir als menschen diese zwei cluster
genauer analysieren würden wir das eine
cluster als diejenigen kunden die wenige
apa teure einkauf tätigen beschreiben
und das andere cluster besteht aus
kunden die viele aber günstiger
einkaufen
wie können uns diese information als
besitzer des online shops nun helfen
na ja wir könnten unsere werbung und
aktionsangebote auf die bedürfnisse der
kunden zuschneiden
für das erste cluster könnten wir einen
rabatt ab einem bestimmten einkaufspreis
anbieten für das andere cluster könnten
wir einen zwei produkte von zum preis
von einem rabatt anbieten
das ziel von sogenannter cluster analyse
im marketing ist es die kunden möglichst
genau in verschiedene gruppen
einzuteilen und jede zielgruppe
individuell anzusprechen
meistens haben wir dabei aber viel mehr
daten zur verfügung als nur die anzahl
und den durchschnittspreis der
bisherigen einkäufe
wir haben beispielsweise das alter sagt
waren sie registriert sind
oder wenn sie zum beispiel unsere firmen
kreditkarte nutzen sogar das einkommen
und so weiter der kunden zur verfügung
mit diesen vielen verschiedenen werten
ist es nicht einfach zu visualisieren
wie ähnlich sich jetzt zwei kunden sind
das funktioniert prinzipiell aber
genauso wie wir unseren goldfunden nur
in diesem beispiel fünf statt zwei
dimensionen und in diesen fünf
dimensionen ist es für uns menschen
extrem schwer wenn nicht unmöglich
gruppen in abertausenden kundendaten zu
finden der und überwachte algorithmus
den wir für das goldrausch beispiel
entwickelt haben macht aber genau dass
wir als menschen können diese gefundenen
gruppen dann analysieren und darauf
aufbauend zum beispiel auswählen welche
werbung für welche kundengruppe
angezeigt werden soll
wir können und überwachte lernverfahren
aber auch dazu verwenden gruppen in
zeitungsartikeln oder ganz allgemein
textdokumenten zu finden
das nennen wir auch topic modeling
schauen wir uns diesen text an
wir als menschen erkennen natürlich dass
das thema dieses textes sport zu sein
scheint aber wie kann ein computer das
machen erneut vergleich der computer die
daten dieses mal eben die verschiedenen
textdokumente sind und versucht
ähnlichkeiten zu finden die
textdokumente bestehen dabei aus
verschiedenen wörtern und manche dieser
wörter haben jetzt mehr aussagekraft für
das thema eines textes als andere daher
ignoriert wir wörter wie der didas und
oder so weiter je ähnlicher sich die
wörter für zwei texte sind das heißt je
mehr gleiche wörter sie enthalten desto
ähnlicher sind sich die themen dieser
texte wenn wir nun bereits eine große
menge texte verglichen haben
wir verbinden wir bereits gewisse wörter
mit einem wissen thema wörter wie meist
spiele oder mannschaft kommen vor allem
mit einer gruppe von texten vor
wir nennen diese gruppe für den moment
gelbes thema wörter wie krankenhaus
verletzungen oder spital gehören
dahingegen anderen texten an und damit
einem anderen thema und so weiter für
jedes dieser worte können wir einen wert
berechnen der ausdruck wie stark die
verbindung zwischen diesem wort und dem
jeweiligen thema ist das und überwachte
lernverfahren weist nun basierend auf
der häufigkeit und gewichtung der
verschiedenen worte den text ein thema
zu in diesem beispiel das gelbe thema
wie im menschen können nun anhand der
relevantesten wörter desselben themas
daraus schließen dass sie in diesen
texten desselben themas wohl um sport
geht
und in den texten des roten clusters um
krankheiten bei überwachten lernen
konnte diese zuzahlung zur beschriftung
sport direkt der computer übernehmen
ein anderer einsatzbereich von ihm
überwachten lernen ist die
betrugserkennung durch das finden von
anomalien anstatt sich auf gruppen wie
ähnliche wörter zu konzentrieren
interessieren uns hier die ausreißer
wenn ein kunde mit seiner kreditkarte
einkauf tätig der komplett aus den
bisherigen schema fällt also zum
beispiel eine viel höhere summe in einem
anderen land zu einer anderen uhrzeit
als normalerweise kann das erkannt
werden und entsprechende schritte zum
schutz vor kreditkartenbetrug
eingeleitet werden heute haben wir damit
unseren letzten einsatz für maschinelles
lernen kennen gelernt und überwacht das
lernen im gegensatz zu überwachten
lernen haben wir unbeschriftete daten
die auf ähnlichkeiten in hinsicht auf
zum beispiel die xy koordinaten wie bei
uns schon goldrausch beispiel
kundendaten wie die anzahl und der
durchschnittliche preis eines einkaufs
oder die verwendeten wörter in einem
text hin analysiert werden
diese ähnlichkeiten erlauben es dem
algorithmus gruppen zu finden oder aber
ausreißer zu erkennen die von uns
menschen interpretiert werden können
damit können wir goldfelder finden
werbung personalisieren oder das thema
eines textes herausfinden ohne ihn
überhaupt gelesen zu haben
morgen wollen wir wie gewohnt dieses
verfahren auch in snap implementieren
und zum abschluss der woche die drei
arten von maschinellem lernen
gegenüberstellen
bis dann
Browse More Related Video
Hinter den Kulissen: Überwachtes Lernen | Die Welt der KI entdecken 06
Überwachtes Lernen | Die Welt der KI entdecken 05
Hinter den Kulissen: Verstärkendes Lernen | Die Welt der KI entdecken 03
Wie Künstliche Intelligenz funktioniert | Philip Häusser
Was ist KI? | Die Welt der KI entdecken 01
Frag Fred: Was sind Cookies? | Kindervideos | SRF Kids
5.0 / 5 (0 votes)