Unüberwachtes Lernen | Die Welt der KI entdecken 07

Tilman Michaeli
15 Feb 202314:07

Summary

TLDRDieses Video führt durch die Welt der künstlichen Intelligenz, insbesondere in das Thema des überwachten Lernens. Es erklärt, wie Computer ohne vorherige Beschriftung von Daten lernen können, anhand des Beispiels eines Goldgrabens im Wilden Westen. Der Fokus liegt auf der Identifizierung von Mustern und Clustern in Daten, um Anwendungen wie die Marktanalyse, die Personalisierung von Werbung oder das Erkennen von Betrug zu ermöglichen. Das Video bietet einen Einblick in die Anwendung von Algorithmen, die ohne Beschriftung große Datenmengen analysieren und Muster erkennen können.

Takeaways

  • 🧠 Überwachtes Lernen: Der Computer lernt aus einer großen Menge von beschrifteten Daten, was etwas ist.
  • 🔍 Unbeschriftete Daten: In diesem Fall haben wir viele Daten, aber keine Beschriftung, um zu wissen, ob es ein guter Punkt zum Graben ist oder nicht.
  • 🎲 Spiel als Beispiel: Das Beispiel des Goldgrabens im Wilden Westen veranschaulicht, wie man mit unbeschrifteten Daten umgehen kann.
  • 📍 Datenpunkte: Berichte über Goldfunde mit x- und y-Koordinaten sind die Grundlage für die Analyse.
  • 👷‍♂️ Grabungsteams: Die Positionierung der Grabungsteams mittig in einem Goldfeld ist das Ziel, um reich zu werden.
  • 🗺️ Kartendarstellung: Eine Karte des Wilden Westens hilft, die Positionen der Goldfunde zu visualisieren.
  • 🤖 Algorithmusentwicklung: Durch das Verarbeiten der Goldfunde nacheinander und die Identifizierung des nächsten geeigneten Grabungsteam entwickelt sich ein Algorithmus für überwachtes Lernen.
  • 🔑 Ähnlichkeitsfindung: Der Algorithmus findet Ähnlichkeiten und Muster in den Eingabedaten, um Gruppen oder Cluster zu identifizieren.
  • 📊 Clusteranalyse: In Marketing kann Clusteranalyse dazu verwendet werden, Kundengruppen zu identifizieren und gezielt anzusprechen.
  • 🛒 Anwendungsbeispiel: Online-Shop-Daten, wie der durchschnittliche Preis und die Anzahl der Käufe pro Kunde, können mit ähnlichen Methoden analysiert werden.
  • 📚 Topic Modeling: Überwachtes Lernen kann auch für das Finden von Themen in Textdokumenten verwendet werden, indem ähnliche Wörter gruppiert werden.
  • 🚨 Betrugserkennung: Überwachtes Lernen hilft auch beim Erkennen von Anomalien, wie z.B. atypische Kreditkartentransaktionen.

Q & A

  • Was haben wir in der heutigen Station der Reise durch die Welt der künstlichen Intelligenz gelernt?

    -Wir haben gelernt, wie ein überwachtes Lernverfahren mit unbeschrifteten Daten umgehen kann, indem es Ähnlichkeiten in großen Datenmengen findet, um Muster und Gruppen zu identifizieren.

  • Was ist das Ziel des Spiels im Video?

    -Das Ziel ist es, durch die Positionierung von Grabungsteams im Wilden Westen nach Gold zu graben und so reich zu werden.

  • Wie viele Grabungsteams stehen im Spiel zur Verfügung?

    -Im Spiel stehen drei Grabungsteams zur Verfügung, die durch Münzen symbolisiert werden.

  • Wie viele Goldfunde dürfen sich gleichzeitig anschauen?

    -Im Spiel dürfen sich immer nur einen Goldfund gleichzeitig anschauen.

  • Was repräsentieren die Berichte über Goldfunde?

    -Die Berichte über Goldfunde enthalten Informationen über die jeweiligen x- und y-Koordinaten, die die Position des Goldfundes beschreiben.

  • Wie wird die Position eines Grabungsteames im Spiel festgelegt?

    -Die Position eines Grabungsteames wird durch das Hinlegen einer Münze auf der Karte des Wilden Westens festgelegt.

  • Was ist der Unterschied zwischen unbeschrifteten und beschrifteten Daten?

    -Beschriftete Daten enthalten zusätzliche Informationen oder Kategorien, während unbeschriftete Daten nur die Grundinformationen ohne zusätzliche Klassifizierung bieten.

  • Was ist das Ziel des Algorithmus im Goldrausch-Beispiel?

    -Das Ziel ist es, Gruppen von Goldfunden zu identifizieren und die Grabungsteams entsprechend zu positionieren, um die effizientesten Goldadern zu finden.

  • Wie kann das überwachte Lernen in der Praxis eingesetzt werden?

    -Überwachtes Lernen kann eingesetzt werden, um Muster in Daten zu erkennen, z.B. für die Kundendatenanalyse, um Werbung und Aktionsangebote individuell anzupassen.

  • Was ist Clusteranalyse im Marketing?

    -Clusteranalyse im Marketing ist die Einteilung von Kunden in verschiedene Gruppen, um jede Zielgruppe individuell und effektiver anzusprechen.

  • Was ist Topic Modeling?

    -Topic Modeling ist die Erkennung von Themen in Textdokumenten durch das Finden von Gruppen ähnlicher Wörter, die bestimmte Themen repräsentieren.

  • Was ist der Unterschied zwischen überwachtem und unüberwachtem Lernen?

    -Überwachtes Lernen verwendet beschriftete Daten, um Muster zu erkennen und zu lernen, während unüberwachtes Lernen ohne Beschriftung arbeitet und Muster oder Ausreißer in den Daten selbst findet.

  • Was ist der letzte Einsatzbereich für maschinelles Lernen, der im Video erwähnt wird?

    -Der letzte Einsatzbereich ist die Betrugserkennung durch das Finden von Anomalien in Daten, z.B. bei Kreditkartentransaktionen.

Outlines

00:00

🤖 Einführung in das überwachte Lernen

Dieses Kapitel stellt das Konzept des überwachten Lernens vor, indem es ein Spiel als Einführungspunkt nutzt. Das Ziel ist es, durch das Sammeln von Gold im Wilden Westen, ein Verständnis für das Lernen aus großen Mengen von Daten zu entwickeln, ohne dass diese Daten vorher beschriftet sind. Es wird ein einfaches Modell vorgestellt, bei dem man auf der Grundlage von Goldfundberichten und Koordinaten mithilfe von Grabungsteams (Symbolisiert durch Münzen) versucht, die besten Positionen zu finden. Der Prozess umfasst das Identifizieren von Mustern und das Bewegen der Teams in Richtung neuer Fundorte, um die effektivsten Positionen zu ermitteln.

05:03

🔍 Identifizierung von Muster und Clustern

In diesem Abschnitt wird erklärt, wie ein Computer ähnlichkeitsmuster in unbeschrifteten Daten erkennen kann. Es wird ein Algorithmus beschrieben, der es ermöglicht, Gruppen von Goldfunden zu identifizieren, indem er ähnliche Muster in den Eingabedaten sucht. Der Roboter vergleicht die Daten und versucht, ähnliche Muster zu finden, basierend auf der Anzahl und Ecken, ähnlich wie bei der Identifizierung von Goldfunden mit ähnlichen Koordinaten. Durch das Finden dieser Muster können Cluster oder Ausreißer identifiziert werden, was für verschiedene Anwendungen, wie z.B. die Analyse von Kundendaten in einem Onlineshop, nützlich ist.

10:05

📚 Anwendungen des überwachten Lernens

Dieser letzte Abschnitt diskutiert verschiedene Anwendungsbereiche des überwachten Lernens, wie z.B. die Clusteranalyse in Marketing, um Kundengruppen zu identifizieren und gezielt anzusprechen, oder das Thema von Textdokumenten mit Hilfe von Textmining zu erkennen. Es wird auch auf die Anwendung in der Betrugserkennung durch das Finden von Ausreißern in Daten eingegangen. Der Abschnitt zeigt, wie überwachtes Lernen dazu beitragen kann, Muster in großen Datenmengen zu erkennen und diese für verschiedene Zwecke zu interpretieren, ohne dass der Computer die Daten vorher mit Beschriftungen versehen muss.

Mindmap

Keywords

💡Künstliche Intelligenz

Künstliche Intelligenz (KI) ist das Fachgebiet der Informatik, das sich mit der Schaffung von Systemen befasst, die menschliche kognitive Fähigkeiten wie das Lernen, Problemlösen und Entscheidungsfindung nachahmen können. Im Video wird die KI im Kontext des maschinellen Lernens vorgestellt, das heißt, wie Computer aus Daten lernen, ohne direkten menschlichen Einfluss.

💡Überwachtes Lernen

Überwachtes Lernen ist eine Methode des maschinellen Lernens, bei der ein Computer aus einer großen Menge von beschrifteten Daten lernt. Die beschrifteten Daten enthalten Informationen darüber, welcher Eingabe welche Ausgabe entspricht. Im Video wird dieses Konzept verwendet, um zu demonstrieren, wie ein Algorithmus Goldfunde mit Hilfe von Daten und Koordinaten erkennen kann.

💡Unbeschriftete Daten

Unbeschriftete Daten sind Daten, bei denen es keine direkten Anweisungen oder Kategorien gibt, wie sie in beschrifteten Daten der Fall wäre. Im Video wird gezeigt, dass auch aus unbeschrifteten Daten, wie Berichten über Goldfunde ohne klare Zuordnung zu Goldminen, durch das Finden von Mustern und Ähnlichkeiten sinnvolle Informationen gewonnen werden können.

💡Cluster

Ein Cluster ist eine Gruppe von Datenpunkten, die aufgrund ihrer Ähnlichkeit in der Nähe zueinander liegen. Im Video wird das Konzept des Clusterings verwendet, um Goldfunde zu gruppieren und so die Position von Grabungsteams zu optimieren, um reiche Goldadern zu finden.

💡Goldgraben

Goldgraben ist ein metaphorischer Begriff im Video, der verwendet wird, um das Ziel des maschinellen Lernens zu illustrieren: die Suche nach Mustern in Daten, die es ermöglichen, wertvolle Informationen zu extrahieren, vergleichbar mit dem Finden von Gold im Wilden Westen.

💡Muster

Muster sind wiederkehrende Strukturen oder Abläufe in Daten, die durch das maschinelle Lernen erkannt und genutzt werden können, um Entscheidungen zu treffen oder Vorhersagen zu treffen. Im Video werden Muster in den Goldfunddaten genutzt, um die Positionierung der Grabungsteams zu verbessern.

💡Algorithmus

Ein Algorithmus ist eine abstrakte Schritt-für-Schritt-Anleitung, die einem Computer zeigt, wie er eine Aufgabe ausführen soll. Im Video wird ein Algorithmus entwickelt, um Goldfunde zu analysieren und Grabungsteams entsprechend zu positionieren.

💡XY-Koordinaten

XY-Koordinaten sind ein System zur Positionsbestimmung in einem zweidimensionalen Raum. Im Video werden sie genutzt, um die Position von Goldfunden im Wilden Westen zu beschreiben und diese Daten für das maschinelle Lernen zu verwenden.

💡Maschinelles Lernen

Maschinelles Lernen ist ein Bereich der KI, bei dem Computeralgorithmen entwickelt werden, die aus Daten lernen und Entscheidungen treffen können. Im Video werden verschiedene Anwendungen von maschinellem Lernen, wie das Finden von Goldadern, die Analyse von Kundendaten oder das Thema von Texten, vorgestellt.

💡Anomalien

Anomalien sind Datenpunkte, die sich von den übrigen unterscheiden und oft auf ungewöhnliche oder unerwartete Ereignisse hindeuten. Im Video wird das maschinelle Lernen verwendet, um Anomalien in Kundenverhalten, wie Kreditkartenbetrug, zu erkennen.

Highlights

Begrüßung und Einführung in die Welt der künstlichen Intelligenz (KI).

Überblick über das Konzept des überwachten Lernens und dessen Anwendungen.

Erklärung der Herausfordere, die auftreten, wenn viele Daten ohne Beschriftung vorliegen.

Einführung in ein Spiel als Analogie, um das Konzept des überwachten Lernens zu veranschaulichen.

Beschreibung des Goldgrabens im Wilden Westen als Beispiel für das überwachte Lernen.

Erklärung der Bedeutung einer guten Positionierung von Grabungsteams für Reichtum.

Darstellung der Verwendung von Berichten über Goldfunde und deren Koordinaten.

Beschreibung des Prozesses, bei dem nur einen Goldfund gleichzeitig angesehen werden darf.

Die Vorgehensweise, bei der die Positionen der Grabungsteams mit Münze symbolisiert werden.

Die Anwendung eines Algorithmus, um Goldfunde zu verarbeiten und Teams zu positionieren.

Das Konzept der Clustererkennung bei der Analyse von Goldfunden.

Die Erstellung eines Algorithmus für überwachtes Lernen auf Basis von ungebeschrifteten Daten.

Die Anwendung von Clusteranalysen im Marketing, um Kundendaten zu segmentieren.

Die Vorstellung von Anwendungsfällen für überwachtes Lernen in der Textanalyse und Thema-Modellierung.

Die Erklärung, wie ein Computer Ähnlichkeiten in Textdokumenten erkennen kann.

Das Konzept der Betrugserkennung durch das Finden von Anomalien in Daten.

Die Zusammenfassung der Vorteile von überwachtem Lernen für die Analyse große Datenmengen.

Aussicht auf die Implementierung des Lernverfahrens in Snap und die Gegenüberstellung der drei Arten des maschinellen Lernens.

Transcripts

play00:04

hallo und herzlich willkommen zur

play00:06

heutigen station auf unserer reise durch

play00:09

die welt der künstlichen intelligenz in

play00:12

den letzten zwei einheiten haben wir

play00:13

überwachtes lernen kennen gelernt dabei

play00:17

lernt einem computer aus einer großen

play00:19

menge von beschrifteten daten was ist

play00:22

aber wenn wir zwar viele daten zur

play00:24

verfügung haben aber keine beschriftung

play00:27

heute wollen wir lernen wie eine

play00:29

überwachte lernverfahren mit solchen

play00:31

daten umgehen und erneut wollen wir mit

play00:35

einem spiel anfangen

play00:36

wir wollen reich werden und zwar indem

play00:39

wir den wilden westen nach gold graben

play00:42

dazu haben wir viele daten in form von

play00:44

berichten von goldfunden und drei

play00:47

grabungsteams zur verfügung

play00:49

dieses grabungsteams sind durch eine

play00:51

münze symbolisiert natürlich wollen wir

play00:54

unsere grabungsteams so gut wie möglich

play00:56

positionieren um so reich wie möglich zu

play00:58

werden

play00:59

doch wann ist ein grabungsteam gut

play01:02

positioniert das ist es dann wenn es

play01:05

möglichst mittig in einem gold fällt

play01:07

liegt so wie hier

play01:10

was wir nun zur verfügung haben ist eine

play01:14

reihe von berichten über goldfunden mit

play01:16

den jeweiligen ickx und y koordinaten

play01:17

und eine karte des wilden westens die

play01:27

regeln sind dass sich immer nur einen

play01:29

der goldfunde gleichzeitig anschauen

play01:30

darf und als hilfsmittel eben nur meine

play01:33

drei münzen also grabungsteams zur

play01:36

verfügung habe

play01:37

nachdem ich alle goldfunde verarbeitet

play01:40

habe muss ich die finalen grabungs

play01:42

positionen meiner drei teams festlegen

play01:44

und kann dann anfangen zu graben den

play01:47

ersten golf und habe ich nun schon

play01:49

gezogen

play01:49

der lag bei x9 und oops i lon 8

play01:54

nun gut diese position können wir uns

play01:57

merken indem wir eine der münzen dort

play01:59

hinlegen

play02:05

okay nun der zweite gold fund der liegt

play02:13

bei ex 23 und y 12 noch einmal kann ich

play02:18

mir die position mit einer münze merken

play02:25

das funktioniert jetzt auch ein drittes

play02:27

mal

play02:40

aber was jetzt wenn du selber damit

play02:44

experimentieren willst haustiere das

play02:46

video und eröffnet den link in der

play02:48

beschreibung

play02:49

dort kannst du deine eigenen ideen

play02:51

ausprobieren die drei münzen werden

play02:53

dabei zunächst zufällig platziert ich

play02:58

werde für meine nächsten gold fund

play02:59

einfach das nächste team auswählen und

play03:02

ein wenig ungefähr die hälfte in

play03:05

richtung des neues des neuen golf bundes

play03:07

bewegen

play03:19

auch für den nächsten gold fund gehe ich

play03:21

genauso vor

play03:30

ich bestimme den nächsten prototyp und

play03:35

bewege ihn die hälfte der strecke in

play03:38

richtung des neuen gold fundes genauso

play03:43

verarbeiten wir alle weiteren goldfunde

play03:49

[Musik]

play04:21

ok jetzt kommt ein moment der wahrheit

play04:24

haben wir unsere grabungs position

play04:26

grabungsteams gut positioniert

play04:39

ok zwei teams liegen passt fast perfekt

play04:42

mittig in einem der goldfelder das

play04:44

dritte team ist hier ein wenig zu weit

play04:46

rechts

play04:48

fassen wir unser spiel also noch mal

play04:50

zusammen wir hatten einen haufen

play04:52

eingabedaten in der form von berichten

play04:54

über goldfunde und wir haben diese

play04:57

goldfunde nacheinander verarbeitet und

play04:59

für jeden einzelnen das jeweils nächste

play05:02

grabungsteam identifiziert und es dann

play05:05

ungefähr die hälfte der strecke in die

play05:07

richtung des neuen golf und es bewegt

play05:09

dieser algorithmus ermöglicht es uns

play05:12

gruppen von goldfunden zu identifizieren

play05:15

und damit haben wir tatsächlich einen

play05:18

algorithmus für ein überwachtes lernen

play05:20

entwickelt als eingabe haben wir eine

play05:23

menge unbeschriftete daten erhalten also

play05:26

bericht über goldfunde und deren

play05:28

entsprechende xy koordinaten

play05:30

was wir aber nicht hatten waren

play05:32

informationen darüber ob das jetzt ein

play05:34

guter punkt zum graben ist oder nicht

play05:36

auch unser roboter der mittlerweile

play05:39

kennt hat hier eine menge unbeschriftete

play05:41

eingaben geometrische formen

play05:43

nur diesmal ohne beschriftungen wie a b

play05:46

oder c

play05:46

die wir bei überwachten lernen ja noch

play05:49

hatten der roboter vergleicht nun die

play05:52

daten und versucht ähnlichkeit nun

play05:54

muster innerhalb der eingabedaten zu

play05:56

finden

play05:56

im schaubild hat er beispielsweise

play05:58

ähnlichkeiten auf basis der anzahl und

play06:00

ecken gefunden

play06:01

genauso haben wir goldfunde mit

play06:04

ähnlichen ickx und y koordinaten

play06:06

identifiziert basierend auf diesen

play06:09

ähnlichkeiten nun mustern können nun

play06:11

gruppen oder wir sprechen noch manchmal

play06:13

von clustern bzw

play06:16

ausreißer identifiziert werden konkret

play06:20

konnte der roboter gruppen wie formel

play06:22

mit dreiecken oder ausreißer wie

play06:25

beispielsweise den kreis identifizieren

play06:27

mit unseren grabungsteams konnten wir

play06:30

vorhin goldadern also gruppen von

play06:32

goldfunden identifizieren

play06:34

mit dem grabungsteams hatten wir

play06:36

außerdem für jedes dieser cluster eine

play06:40

große fügung also eine beschreibung

play06:42

davon wie ein typisches mitglied der

play06:44

entsprechenden gruppe aussieht passen

play06:48

wir das ganze noch einmal zusammen beim

play06:50

in überwachten lernen

play06:52

der unbeschriftete eingabedaten aus

play06:54

denen eine gewisse struktur ableiten

play06:56

wollen indem wir einfach die beziehung

play06:58

zwischen den verschiedenen datenpunkten

play07:00

betrachten wir können zwar angeben wie

play07:03

viele gruppen wir vermuten können aber

play07:05

nicht vorab spezifizieren welche gruppen

play07:08

befinden wollen genauso wenig können wir

play07:10

feedback darüber geben ob das trainierte

play07:13

modell das gelernte gut ist oder eben

play07:16

nicht genau deshalb sprechen wir auch

play07:18

von überwachten lernen und überwachte

play07:23

lernverfahren sind relativ ähnlich zu

play07:25

statistik und werden häufig zu

play07:28

statistischen zwecken eingesetzt und in

play07:31

der praxis wollen wir vermutlich eher

play07:32

weniger gruppen von goldfunden im wilden

play07:34

westen finden sondern zum beispiel

play07:36

kundendaten analysieren unsere daten

play07:40

sind in diesem fall die kunden unseres

play07:42

onlineshops anstatt von xy koordinate

play07:46

haben wir nun den durchschnittlichen

play07:48

preis eines einkaufs und die anzahl der

play07:50

käufe pro kunde in diesem kleinen

play07:54

beispiel datensatz sehen wir zwei

play07:56

cluster in unseren daten

play07:57

wenn wir als menschen diese zwei cluster

play08:00

genauer analysieren würden wir das eine

play08:03

cluster als diejenigen kunden die wenige

play08:06

apa teure einkauf tätigen beschreiben

play08:09

und das andere cluster besteht aus

play08:13

kunden die viele aber günstiger

play08:15

einkaufen

play08:17

wie können uns diese information als

play08:20

besitzer des online shops nun helfen

play08:22

na ja wir könnten unsere werbung und

play08:25

aktionsangebote auf die bedürfnisse der

play08:27

kunden zuschneiden

play08:28

für das erste cluster könnten wir einen

play08:31

rabatt ab einem bestimmten einkaufspreis

play08:33

anbieten für das andere cluster könnten

play08:36

wir einen zwei produkte von zum preis

play08:38

von einem rabatt anbieten

play08:41

das ziel von sogenannter cluster analyse

play08:45

im marketing ist es die kunden möglichst

play08:47

genau in verschiedene gruppen

play08:48

einzuteilen und jede zielgruppe

play08:50

individuell anzusprechen

play08:53

meistens haben wir dabei aber viel mehr

play08:55

daten zur verfügung als nur die anzahl

play08:58

und den durchschnittspreis der

play09:00

bisherigen einkäufe

play09:01

wir haben beispielsweise das alter sagt

play09:04

waren sie registriert sind

play09:05

oder wenn sie zum beispiel unsere firmen

play09:07

kreditkarte nutzen sogar das einkommen

play09:09

und so weiter der kunden zur verfügung

play09:12

mit diesen vielen verschiedenen werten

play09:15

ist es nicht einfach zu visualisieren

play09:17

wie ähnlich sich jetzt zwei kunden sind

play09:19

das funktioniert prinzipiell aber

play09:21

genauso wie wir unseren goldfunden nur

play09:24

in diesem beispiel fünf statt zwei

play09:26

dimensionen und in diesen fünf

play09:29

dimensionen ist es für uns menschen

play09:32

extrem schwer wenn nicht unmöglich

play09:34

gruppen in abertausenden kundendaten zu

play09:37

finden der und überwachte algorithmus

play09:40

den wir für das goldrausch beispiel

play09:42

entwickelt haben macht aber genau dass

play09:44

wir als menschen können diese gefundenen

play09:47

gruppen dann analysieren und darauf

play09:50

aufbauend zum beispiel auswählen welche

play09:53

werbung für welche kundengruppe

play09:54

angezeigt werden soll

play09:57

wir können und überwachte lernverfahren

play09:59

aber auch dazu verwenden gruppen in

play10:02

zeitungsartikeln oder ganz allgemein

play10:04

textdokumenten zu finden

play10:06

das nennen wir auch topic modeling

play10:09

schauen wir uns diesen text an

play10:30

wir als menschen erkennen natürlich dass

play10:33

das thema dieses textes sport zu sein

play10:35

scheint aber wie kann ein computer das

play10:38

machen erneut vergleich der computer die

play10:41

daten dieses mal eben die verschiedenen

play10:44

textdokumente sind und versucht

play10:46

ähnlichkeiten zu finden die

play10:48

textdokumente bestehen dabei aus

play10:50

verschiedenen wörtern und manche dieser

play10:52

wörter haben jetzt mehr aussagekraft für

play10:54

das thema eines textes als andere daher

play10:58

ignoriert wir wörter wie der didas und

play11:00

oder so weiter je ähnlicher sich die

play11:04

wörter für zwei texte sind das heißt je

play11:06

mehr gleiche wörter sie enthalten desto

play11:09

ähnlicher sind sich die themen dieser

play11:11

texte wenn wir nun bereits eine große

play11:15

menge texte verglichen haben

play11:17

wir verbinden wir bereits gewisse wörter

play11:19

mit einem wissen thema wörter wie meist

play11:24

spiele oder mannschaft kommen vor allem

play11:27

mit einer gruppe von texten vor

play11:29

wir nennen diese gruppe für den moment

play11:31

gelbes thema wörter wie krankenhaus

play11:35

verletzungen oder spital gehören

play11:37

dahingegen anderen texten an und damit

play11:40

einem anderen thema und so weiter für

play11:43

jedes dieser worte können wir einen wert

play11:46

berechnen der ausdruck wie stark die

play11:48

verbindung zwischen diesem wort und dem

play11:50

jeweiligen thema ist das und überwachte

play11:55

lernverfahren weist nun basierend auf

play11:57

der häufigkeit und gewichtung der

play11:59

verschiedenen worte den text ein thema

play12:01

zu in diesem beispiel das gelbe thema

play12:04

wie im menschen können nun anhand der

play12:07

relevantesten wörter desselben themas

play12:09

daraus schließen dass sie in diesen

play12:12

texten desselben themas wohl um sport

play12:15

geht

play12:15

und in den texten des roten clusters um

play12:18

krankheiten bei überwachten lernen

play12:22

konnte diese zuzahlung zur beschriftung

play12:24

sport direkt der computer übernehmen

play12:30

ein anderer einsatzbereich von ihm

play12:31

überwachten lernen ist die

play12:33

betrugserkennung durch das finden von

play12:35

anomalien anstatt sich auf gruppen wie

play12:39

ähnliche wörter zu konzentrieren

play12:41

interessieren uns hier die ausreißer

play12:44

wenn ein kunde mit seiner kreditkarte

play12:46

einkauf tätig der komplett aus den

play12:49

bisherigen schema fällt also zum

play12:51

beispiel eine viel höhere summe in einem

play12:53

anderen land zu einer anderen uhrzeit

play12:54

als normalerweise kann das erkannt

play12:57

werden und entsprechende schritte zum

play12:59

schutz vor kreditkartenbetrug

play13:00

eingeleitet werden heute haben wir damit

play13:06

unseren letzten einsatz für maschinelles

play13:08

lernen kennen gelernt und überwacht das

play13:10

lernen im gegensatz zu überwachten

play13:13

lernen haben wir unbeschriftete daten

play13:16

die auf ähnlichkeiten in hinsicht auf

play13:19

zum beispiel die xy koordinaten wie bei

play13:22

uns schon goldrausch beispiel

play13:24

kundendaten wie die anzahl und der

play13:27

durchschnittliche preis eines einkaufs

play13:28

oder die verwendeten wörter in einem

play13:31

text hin analysiert werden

play13:33

diese ähnlichkeiten erlauben es dem

play13:35

algorithmus gruppen zu finden oder aber

play13:38

ausreißer zu erkennen die von uns

play13:40

menschen interpretiert werden können

play13:42

damit können wir goldfelder finden

play13:44

werbung personalisieren oder das thema

play13:47

eines textes herausfinden ohne ihn

play13:48

überhaupt gelesen zu haben

play13:51

morgen wollen wir wie gewohnt dieses

play13:53

verfahren auch in snap implementieren

play13:55

und zum abschluss der woche die drei

play13:57

arten von maschinellem lernen

play13:58

gegenüberstellen

play13:59

bis dann

Rate This

5.0 / 5 (0 votes)

Related Tags
Künstliche IntelligenzGoldgräberCluster-AnalyseDatenanalyseMaschinelles LernenÜberwachtes LernenKundendatenTextanalyseTopic ModelingBetrugserkennung
Do you need a summary in English?