How on Earth Does Shazam Recognize Songs

doof
4 Mar 202404:25

Summary

TLDRShazam, créé au début du 21ème siècle, est une application capable de reconnaître des millions de chansons en quelques secondes. Elle utilise le microphone de votre téléphone pour enregistrer une chanson sous forme de spectrogramme, qui est ensuite transformé en 'empreintes digitales'. Grâce à une base de données de hachage, Shazam compare ces empreintes avec des milliers de chansons pour identifier celle que vous écoutez, même dans un environnement bruyant.

Takeaways

  • 🎵 Shazam peut reconnaître des millions de chansons en quelques secondes.
  • 📱 Shazam a existé depuis le début du 21ème siècle, bien avant l'ère des smartphones modernes.
  • 📞 Initialement, Shazam fonctionnait en appelant un numéro spécifique sur des téléphones Nokia pour envoyer le nom de la chanson par SMS.
  • 🔍 Shazam a gagné en popularité après avoir été racheté par Apple en 2017.
  • 🎧 La technologie derrière Shazam repose sur l'enregistrement audio par le microphone du téléphone.
  • 🌈 Shazam utilise des spectrogrammes pour visualiser la fréquence audio du son enregistré.
  • 🔍 Shazam simplifie les spectrogrammes en 'empreintes digitales' pour faciliter la reconnaissance des chansons.
  • 👂 Malgré le bruit d'ambiance, Shazam peut reconnaître les chansons en enregistrant toutes les fréquences sonores.
  • 🗄️ Shazam utilise des bases de données 'hash' pour stocker et faire correspondre les 'empreintes digitales' avec les chansons existantes.
  • 🔎 Shazam compare les séquences d'empreintes digitales pour identifier la chanson en temps réel.
  • 📈 Le processus de reconnaissance de Shazam est basé sur la correspondance de séquences de fréquences plutôt que de points spécifiques.

Q & A

  • Qu'est-ce que Shazam ?

    -Shazam est une application qui peut reconnaître des millions de chansons en quelques secondes.

  • Depuis quand existe Shazam ?

    -Shazam existe depuis le début du 21ème siècle, bien avant que de nombreuses personnes n'aient vécu.

  • Comment pouvait-on utiliser Shazam avant l'époque des smartphones ?

    -Avant l'époque des smartphones, on pouvait utiliser Shazam en composant un numéro spécifique sur un téléphone Nokia pour recevoir le nom de la chanson par SMS.

  • Pourquoi Shazam n'était-il pas populaire avant l'achat par Apple en 2017 ?

    -Shazam n'était pas populaire avant l'achat par Apple car il n'avait pas encore été largement diffusé ou utilisé par le grand public.

  • Quelle est la première étape pour Shazam lorsqu'il reconnaît une chanson ?

    -La première étape est d'utiliser le microphone du téléphone pour enregistrer l'audio de la chanson.

  • Enregistre-t-on l'audio avec Shazam dans un format standard comme le MP3 ?

    -Non, Shazam enregistre l'audio sous forme de spectrogramme qui représente la fréquence audio sur le temps.

  • Qu'est-ce qu'un spectrogramme et comment est-il utilisé par Shazam ?

    -Un spectrogramme est une représentation graphique des fréquences sonores en fonction du temps. Shazam l'utilise pour simplifier les fréquences sonores en points ou 'empreintes' pour la reconnaissance.

  • Comment Shazam fait-il face au bruit de fond et aux sons parasites ?

    -Shazam enregistre tous les sons, y compris les bruits parasites, mais il peut avoir des difficultés à reconnaître une chanson s'il y a trop de bruit.

  • Quelle est la technique utilisée par Shazam pour simplifier les spectrogrammes ?

    -Shazam utilise une technique pour réduire les parties principales et brillantes du spectrogramme en points simples ou 'empreintes'.

  • Comment Shazam compare-t-il les 'empreintes' pour trouver la chanson correspondante ?

    -Shazam utilise une base de données de hachage pour faire correspondre les 'empreintes' en séquence avec les chansons existantes dans sa base de données.

  • Quel est le rôle de la base de données de hachage dans le processus de reconnaissance de Shazam ?

    -La base de données de hachage permet à Shazam de stocker et de rechercher迅速 et efficacement les chansons en fonction des similarités entre les 'empreintes'.

  • Qu'arrive-t-il après que Shazam ait obtenu les 'empreintes' d'une chanson ?

    -Shazam recherche une correspondance entre la séquence des 'empreintes' et les chansons dans sa base de données pour identifier la chanson.

Outlines

00:00

🎵 Comment Shazam reconnaît des millions de chansons

Le script parle de l'application Shazam qui peut reconnaître des millions de chansons en quelques secondes. Shazam a été créée au début du 21ème siècle et a gagné en popularité après avoir été achetée par Apple en 2017. Le fonctionnement de Shazam repose sur l'utilisation du microphone du téléphone pour enregistrer le son sous la forme d'un spectrogramme, qui représente la fréquence du son en fonction du temps. Shazam simplifie ensuite les spectres en 'empreintes digitales' pour les comparer à sa base de données de chansons. Grâce à une base de données à hachage, Shazam peut rapidement identifier la chanson en correspondant la séquence d'empreintes à celle des titres enregistrés.

Mindmap

Keywords

💡Shazam

Shazam est une application de reconnaissance musicale qui peut identifier des millions de chansons en quelques secondes. Elle est au cœur du sujet de cette vidéo qui explique son fonctionnement et son histoire. Dans le script, Shazam est décrit comme un programme inventé pour aider les gens à identifier des chansons qu'ils n'arrivent pas à se rappeler.

💡Spectrogramme

Le spectrogramme est une représentation graphique de la fréquence des sons enregistrés par Shazam. Il est essentiel pour le processus de reconnaissance car il convertit les sons en un format visuel qui peut être analysé par l'application. Dans le script, l'auteur explique comment Shazam utilise le spectrogramme pour enregistrer et analyser les sons.

💡Fréquence audio

La fréquence audio fait référence à la hauteur du son, qui est enregistrée par Shazam sous forme de spectrogramme. Elle est importante pour identifier la musique car elle aide à créer un modèle unique pour chaque chanson. Dans le script, il est mentionné que Shazam enregistre la fréquence audio et la convertit en spectrogramme.

💡Fingerprints

Les 'empreintes' sont des points censés représenter les parties les plus sonores et distinctives de l'audio. Shazam les utilise pour identifier une chanson parmi les millions enregistrées dans sa base de données. Dans le script, l'auteur explique comment Shazam réduit les parties lumineuses du spectrogramme en points simples, appelés empreintes.

💡Hash database

La base de données 'hash' est utilisée par Shazam pour stocker et organiser les empreintes des chansons. Elle permet à l'application de faire des recherches efficaces en fonction des empreintes. Dans le script, l'auteur compare une base de données hash à une bibliothèque où les livres sont classés par similitudes.

💡Réconnaissance de la musique

La reconnaissance de la musique est le processus par lequel Shazam identifie une chanson en fonction des données enregistrées. C'est le sujet principal du script qui explique comment l'application utilise divers outils et techniques pour identifier rapidement les chansons. Dans le script, l'auteur décrit en détail comment Shazam parvient à identifier une chanson.

💡Microphone

Le microphone est l'outil utilisé par Shazam pour enregistrer le son de la chanson. Il est mentionné dans le script comme la première clé du succès de Shazam. L'auteur explique que Shazam utilise le microphone du téléphone pour enregistrer le son de la chanson.

💡Bruit de fond

Le bruit de fond fait référence aux sons indésirables qui peuvent interférer avec le processus de reconnaissance de la musique par Shazam. Dans le script, l'auteur explique comment Shazam enregistre tous les sons, y compris les bruits de fond, ce qui peut rendre la reconnaissance plus difficile si le bruit est trop important.

💡Apple

Apple est mentionné dans le script comme l'entreprise qui a racheté Shazam en 2017, ce qui a contribué à sa popularité. Apple a joué un rôle clé dans la reconnaissance de Shazam puisqu'elle a permis à l'application de toucher un public plus large.

💡SMS

SMS signifie 'Short Message Service' et fait référence aux messages texte. Dans le script, l'auteur mentionne que Shazam pouvait envoyer le nom d'une chanson envoie un SMS, ce qui indique comment l'application fonctionnait avant l'ère des applications mobiles modernes.

Highlights

Shazam can recognize millions of songs in seconds.

Shazam has been around since the early 21st century.

Initially, Shazam required calling a number from a Nokia phone to identify songs.

Shazam's popularity surged after Apple's acquisition in late 2017.

The technology behind Shazam is based on recording audio through a phone's microphone.

Shazam uses spectrograms to represent audio frequency over time.

Brighter colors on a spectrogram indicate louder sounds.

Shazam simplifies spectrograms by reducing main bright parts to single points or fingerprints.

Shazam can struggle with background noise, as it picks up all recorded sounds.

The spectrogram is used to simplify the recognition process by reducing complex data to dots.

Shazam matches these audio fingerprints with existing songs in its database.

Shazam uses a hash database to efficiently match fingerprints with the correct song.

The hash database organizes songs by similarities, similar to books in a library.

Shazam searches for songs based on the sequence of frequencies in the fingerprints.

Once enough dots match, Shazam identifies and displays the song on the screen.

Shazam's process allows for instant song identification.

Transcripts

play00:00

you ever heard a song on the radio and

play00:02

just couldn't remember what the name of

play00:03

the song is for the longest time ever

play00:06

well shazan can recognize millions and

play00:08

millions of songs in a matter of seconds

play00:10

but how did we invent this I mean if you

play00:13

as a person can't even remember the song

play00:16

how did we just invent a program that

play00:18

can many of you don't know this but

play00:20

Shazam has been a thing for more time

play00:22

than many of you have even been living

play00:24

on this world I was surprised myself

play00:26

because Shazam has been here since the

play00:28

early 21st century well you still needed

play00:31

the call a number 2580 on your Nokia

play00:34

phone but it could do the thing and send

play00:36

you the SMS of the name of the song So

play00:39

if Shazam existed for such a long time

play00:41

why did no one even myself know about it

play00:44

I mean it's a genius idea right a simple

play00:46

answer Apple yeah Shazam literally

play00:49

gained popularity after Apple bought it

play00:51

in late 2017 but if you come to the

play00:54

original question how did the people

play00:55

that invented chazam well just do it you

play00:58

might say that the technology behind

play01:00

Shazam is difficult but it's really not

play01:02

your phone probably has a microphone

play01:04

that can record audio that's the first

play01:06

key to shazam's recognition and success

play01:09

when you press on that little logo in

play01:11

the middle Shazam will use the phone's

play01:13

microphone to record audio in that case

play01:15

the song but the recording won't be Sav

play01:17

to do standard MP3 or whatever format

play01:20

for audio we use today to listen to

play01:22

music Shazam has a specific thing that

play01:24

it records the audio on called the

play01:26

spectrogram Shazam records audio or

play01:28

so-called audio frequency and that

play01:31

frequency then gets put on this color

play01:33

looking spectrogram as a frequency over

play01:36

time the colors the brighter the color

play01:38

the more loud the sounds are the higher

play01:41

the frequency the higher the tones will

play01:43

be put higher on the spectrogram this

play01:45

professor Julia Smith explains it based

play01:47

on the sound of the whistle as you can

play01:49

see when the whistle goes down the

play01:51

frequency goes down as well but because

play01:53

these spectrograms are too long and

play01:55

difficult to process and predict Shazam

play01:57

uses this technique to simplify the main

play02:00

bright Parts down to single points or as

play02:02

they call them the fingerprints okay but

play02:05

what if you're just in a coffee shop and

play02:06

drawing your coffee and suddenly the

play02:08

song pops up obviously if you Shazam it

play02:11

Shazam will also pick the meaningless

play02:13

sounds to the music like the outside

play02:15

noise or the coffee machine maker or the

play02:17

other people talking but because Shazam

play02:19

isn't human it won't be able to

play02:21

differentiate these sounds from the song

play02:23

so it's going to pick all of the

play02:25

recorded sounds and record it on the

play02:27

spectrogram this is also why if you have

play02:29

too much noise and zero background

play02:31

Shazam won't be able to recognize the

play02:33

song simply because there's just too

play02:35

many meaningless thoughts then as I

play02:38

mentioned earlier the spectrogram will

play02:40

convert these bright sounds down to

play02:41

single dots to make it simpler to

play02:43

recognize a song okay so now what what

play02:46

does Shazam do with these recorded dots

play02:48

or called fingerprints well it then

play02:51

basically tries to match these dots in a

play02:53

Time sequence with all of the other

play02:55

existing songs it has in its storage but

play02:58

again there are like millions of song

play03:00

and its storage so it would take forever

play03:02

to find the right sequence of the song

play03:04

right that's why Shazam uses the thing

play03:07

called the hash database to match the

play03:09

fingerprints with the right song Take

play03:11

hash database as a library of the songs

play03:13

or to make it simpler the books stored

play03:16

in the library to make it sure each book

play03:18

in this case is stored with the other

play03:20

books by the similarities these books

play03:23

have then those books will be marked

play03:25

with a letter under a single group for

play03:27

example all of the books that start with

play03:29

the word thee then obviously each book

play03:32

in that group will be marked with the

play03:34

extra symbol number or letter by itself

play03:37

so the books don't collide with each

play03:38

other that's basically how Shazam

play03:41

differentiates the different songs

play03:43

stored in its Library back to the

play03:45

recognition once Shazam gets the

play03:47

fingerprints is going to try to search

play03:49

for a song primarily based on the

play03:51

different frequencies of all the

play03:53

fingerprints in that sequence like it's

play03:55

not going to go and try to match each

play03:57

dot with each one specifically but it's

play03:59

going to take that entire sequence of

play04:01

the dots and match all of the dots at

play04:04

the same time once it gets enough dots

play04:06

match with the sequence of the right

play04:08

song it's going to show up which song it

play04:10

is on the screen so yeah this is

play04:12

basically how you can instantly find a

play04:14

song the more you

play04:16

[Music]

play04:24

know

Rate This

5.0 / 5 (0 votes)

Ähnliche Tags
ShazamMusiqueTechnologieReconnaissanceHistoireInnovationAppleMorceauxSpectrogrammeHashBase
Benötigen Sie eine Zusammenfassung auf Englisch?