Comment fonctionne un moteur de recherche ?
Summary
TLDRDans cette vidéo, Thomas Kubel expose en détail le fonctionnement d'un moteur de recherche, en se concentrant sur les erreurs courantes des débutants. Il clarifie les mécanismes d'indexation et d'analyse des requêtes de Google, démystifiant ainsi le processus qui permet de proposer des résultats pertinents. Kubel insiste sur l'importance de la pré-indexation, l'exploration du web par Google et l'utilisation d'algorithmes pour déterminer la pertinence et la popularité des pages. La vidéo est un guide précieux pour ceux qui cherchent à comprendre les coulisses du référencement naturel et à éviter les pièges fréquents.
Takeaways
- 🔎 Le moteur de recherche fonctionne par indexation et non par analyse en temps réel de chaque requête.
- 🕳 Les débutants pensent souvent que les moteurs de recherche parcourent l'ensemble du web à chaque recherche, ce qui n'est pas le cas.
- 📚 Google a déjà effectué un travail considérable d'indexation avant que l'utilisateur ne tape une requête.
- 🗂️ L'index est une immense bibliothèque numérique contenant des copies et des annotations de documents trouvés sur le web.
- 🔍 Lors de la recherche, Google tient compte de facteurs tels que le compte Google de l'utilisateur, son historique de recherche et son comportement sur les sites.
- 👀 Google ne surveille pas l'ensemble des activités des utilisateurs, mais il peut prendre en compte des données telles que les clics et la durée de visite pour affiner les résultats.
- 🌐 Le référencement naturel est différent de la publicité payante; le premier est basé sur la pertinence et la popularité, tandis que le second est financé.
- 🤖 Les algorithmes de recherche de Google analysent la requête, cherchent des correspondances dans l'index et classent les pages en fonction de divers critères.
- 🛠️ Google utilise divers algorithmes, tels que ceux de pertinence, de comportement et de popularité, pour déterminer les résultats les plus pertinents.
- ♻️ Google est en constante évolution, améliorant l'expérience utilisateur en intégrant des vidéos, des images et d'autres fonctionnalités pour enrichir les pages de résultats.
- 🚫 Les algorithmes anti-spam de Google filtrent le contenu de mauvaise qualité et les liens manipulés pour assurer la qualité des résultats de recherche.
Q & A
Quel est le piège dans lequel tombent souvent les débutants lorsqu'ils comprennent le fonctionnement d'un moteur de recherche?
-Les débutants ont tendance à croire que les moteurs de recherche parcourent l'ensemble du web en temps réel pour afficher les résultats. En réalité, les moteurs de recherche ont déjà effectué un travail important d'indexation avant même que la requête soit tapée.
Quelle est la première étape du fonctionnement d'un moteur de recherche tel que Google, selon le script?
-La première étape est l'exploration et l'indexation. Google utilise un crawler pour trouver de nouvelles pages web et un scraper pour récupérer des informations de ces pages.
Comment Google stocke-t-il les informations récupérées sur le web?
-Google stocke les informations récupérées dans une immense bibliothèque virtuelle appelée index. Il prend des notes et organise les documents de manière intelligente pour pouvoir les retrouver efficacement.
Quel est le rôle du scraper dans le processus de recherche de Google?
-Le scraper est un programme informatique qui récupère des informations des pages web telles que les titres, le contenu, les images, etc., et les envoie dans l'index via l'indexeur.
Que fait Google après avoir indexé les informations?
-Après l'indexation, lorsque l'utilisateur tape une requête, Google analyse cette requête et les documents dans l'index qui pourraient correspondre à cette demande, puis il restitue les résultats les plus pertinents.
Quels sont les différents types de résultats que Google peut afficher en réponse à une requête?
-Google peut afficher des résultats naturels, basés sur la pertinence et l'utilité, ainsi que des résultats sponsorisés, qui sont des publicités payantes.
Quel est l'objectif des algorithmes de recherche de Google?
-Les algorithmes de recherche de Google ont pour objectif d'analyser la requête de l'utilisateur, de déduire le contexte et de chercher les documents dans l'index les plus pertinents pour restituer aux utilisateurs.
Quels sont les critères pris en compte par les algorithmes de pertinence de Google?
-Les algorithmes de pertinence analysent des centaines de critères tels que le contenu du titre de la page, la structure du contenu, et la qualité générale pour déterminer si un site ou un contenu est pertinent pour une requête donnée.
Comment Google utilise-t-il les algorithmes comportementaux pour améliorer les résultats de recherche?
-Les algorithmes comportementaux analysent l'interaction de l'utilisateur avec les résultats de recherche, comme le temps passé sur une page ou le nombre de clics, pour affiner et personnaliser les résultats.
Quel est le rôle des algorithmes de calcul de popularité dans le classement des pages web par Google?
-Les algorithmes de calcul de popularité déterminent si un site ou une page est populaire en se basant sur le nombre de citations et de liens entrants d'autres sites web, similaire à la notion de popularité dans les livres ou les citations académiques.
Quels sont les filtres anti-spam que Google utilise pour améliorer la qualité des résultats de recherche?
-Google utilise des filtres anti-spam tels que Google Panda et Google Penguin pour pénaliser les sites web de mauvaise qualité et les liens de mauvaise qualité, respectivement.
Outlines
🔎 Comment fonctionne un moteur de recherche ?
Thomas Kubel introduit le sujet de la vidéo en expliquant qu'il va dévoiler le fonctionnement d'un moteur de recherche, en particulier les erreurs courantes des débutants. Il mentionne que les gens ont tendance à croire que les moteurs de recherche, comme Google, fonctionnent de manière logique et rationnelle, mais en réalité, ils ont un fonctionnement spécifique. Il propose ensuite de se tourner vers la documentation de Google pour clarifier ces idées. Il explique que Google a déjà effectué un travail considérable d'indexation avant même que l'utilisateur ne tape une requête, en se basant sur des annotations et des informations recueillies sur le web pour fournir des résultats pertinents.
📚 L'importance de l'indexation et du référencement naturel
Dans ce paragraphe, l'auteur entre dans les détails du rôle d'un moteur de recherche, en se concentrant sur l'indexation et le référencement naturel. Il invite les spectateurs à consulter la documentation de Google pour mieux comprendre ces concepts. Il décrit le processus par lequel Google explore le web, enregistre des informations pertinentes et les stocke dans un index. L'auteur souligne que Google a créé une bibliothèque numérique bien plus grande que toutes les bibliothèques du monde réunies, mettant ainsi en évidence l'ampleur de l'information organisée par Google.
🤖 Les mécanismes de crawler, scraper et indexeur de Google
Ici, l'auteur explique les mécanismes techniques utilisés par Google pour indexer le web. Il décrit le crawler comme un programme informatique qui trouve de nouvelles pages web à explorer, tandis que le scraper récupère des informations sur ces pages. Ces informations sont ensuite envoyées à un indexeur qui les stocke dans l'index de Google. L'auteur insiste sur le fait que ces processus sont continus et complexes, impliquant de nombreux sous-programmes qui travaillent en coulisses pour maintenir l'index à jour.
🧐 Les algorithmes de recherche et la pertinence des résultats
Dans ce paragraphe, l'auteur se concentre sur les algorithmes de recherche utilisés par Google pour déterminer la pertinence des pages web par rapport à une requête de l'utilisateur. Il mentionne que Google analyse de nombreux critères, tels que la structure du contenu, le titre de la page, et le contexte géographique de l'utilisateur. L'auteur explique également le rôle des algorithmes comportementaux et de popularité, qui étudient le comportement des utilisateurs sur les pages et la popularité des sites web, respectivement.
🛡 Les filtres anti-spam et la qualité du contenu
L'auteur termine la vidéo en abordant les mesures prises par Google pour assurer la qualité du contenu et lutter contre le spam. Il décrit les algorithmes anti-spam, tels que Google Panda et Penguin, qui ont pour but de pénaliser les sites web de mauvaise qualité ou qui utilisent des techniques de manipulation pour améliorer leur classement. L'auteur souligne que ces processus sont continus et s'adaptent constamment pour garantir que les utilisateurs reçoivent des résultats pertinents et utiles.
Mindmap
Keywords
💡Moteur de recherche
💡Index
💡Crawler
💡Scraper
💡Algorithme de recherche
💡Pertinence
💡Popularité
💡Comportement des utilisateurs
💡Anti-spam
💡Référencement naturel
Highlights
Explication du piège commun sur le fonctionnement d'un moteur de recherche.
Clarification que Google ne recherche pas en temps réel mais utilise un index pré-existant.
Importance du travail en amont de Google pour indexer le web.
Rôle crucial de l'index dans la recherche et comment il est constitué.
Utilisation des comportements utilisateurs passés pour affiner les résultats de recherche.
Différence entre les résultats naturels et les résultats sponsorisés.
Impact de l'expérience utilisateur et des algorithmes comportementaux sur les résultats de recherche.
Fonctionnement des algorithmes de pertinence pour déterminer la qualité des résultats.
Algorithmes de calcul de popularité et leur importance dans le classement des pages.
Le rôle des filtres antispam comme Google Panda et Google Pingouin pour maintenir la qualité des résultats.
Importance de la documentation de Google pour comprendre le fonctionnement des moteurs de recherche.
Processus de crawling, scraping et indexation expliqué en détail.
Utilisation de l'index pour trouver les résultats pertinents et utiles à chaque recherche.
Evolution constante des fonctionnalités de Google pour améliorer l'expérience utilisateur.
Référence à l'analogie du bibliothécaire pour expliquer le rôle de Google.
Transcripts
bonjour à tous c'est thomas kubel les
bienvenus dans une nouvelle vidéo
aujourd'hui je vous propose de découvrir
comment fonctionne un moteur de
recherche
donc je vais vous expliquer aujourd'hui
déjà le piège dans lequel tous les
débutants et néophytes tombe en ce qui
concerne le fonctionnement d'un moteur
de recherche on a tendance à penser
parfois que ça fonctionne d'une certaine
manière parce que c'est rationnel parce
que c'est logique et pourtant un moteur
de recherche un fonctionnement bien
spécifique donc on va voir ce piège dans
lequel tous les débutants et néophytes
tombe
et puis ensuite on ira justement dans la
documentation de google qui explique
comment fonctionne un moteur de
recherche parce qu'elle est très claire
et elle va vous permettre d'avoir
peut-être un petit peu plus de clarté et
une vision un petit peu moins floue du
fonctionnement d'un moteur de recherche
donc passons tout de suite sur google et
nous allons donc parler de ce fameux
piège dont je vous parlais les gens ont
tendance à croire quand il commence à
s'intéresser au fonctionnement d'un
moteur de recherche que un moteur de
recherche comme google et bien
globalement on tape une requête
admettons recettes de gâteaux au
chocolat voilà que quand je tape
vraiment sur la touche entrée
voilà et bien ce moment là précisément
google a analysé mark est étalé sur
l'ensemble des sites du monde qui parle
du gâteau au chocolat et de la
pâtisserie et compagnie pour essayer de
me renvoyer des résultats et en fait on
a tendance à penser que parce que google
est une machine que
google est ultra puissant que google et
efficace que google c'est une société
qui est valorisé à plusieurs milliards
de dollars
et bien que ça marche comme ça alors
c'est tout à fait rationnel tout à fait
logique et tout à fait brasser vraiment
logique voilà qu'on puisse se dire ça
fonctionne comme ça parce que on creuse
pas et parce que on se dit ouais
peut-être que moi j'aurais fait comme ça
si j'étais un créateur de moteurs de
recherche
or cela fonctionne pas comme ça voilà ce
n'est pas je tape une requête et google
là va parcourir tout le web en un
instant 0,60 et une seconde comme c'est
écrit ici pour vous faire un classement
parfait pour que vous puissiez avoir
réponse à votre question votre demande
non ça ne fonctionne pas comme ça c'est
plutôt google
il a fait un travail déjà énorme avant
que vous tapiez votre recherche
il a parcouru le maximum du harel
maximum de pages possible qu'il a
rencontré en naviguant à travers le web
à travers internet etc
il a récupéré tout un tas d'informations
il a fait une copie de certains
documents notamment tout ce qui n'est
pas du spam voilà il à stocker tout ça
dans une immense bibliothèque qui
s'appelle un index où il a mis des
annotations il a pris des petites notes
il a essayé de d'organiser tous
parfaitement de manière très
intelligente pour pouvoir lorsque vous
tapez une requête est bien trouver les
documents qui sont les plus adaptés à
votre recherche et à ce moment là juste
à ce moment là lorsque vous tapez la
roquette
il va peut-être prendre en compte votre
compte google il ya peut-être prendre en
compte ce que vous allez rechercher
auparavant avant cette requête
il va peut-être essayer de saisir
qu'est-ce qui est pour vous le
classement à avoir
et après ça et après ça parce que j'ai
parlé de ce qui est fait en amont avant
la roquette j'ai parlé de ce qui a été
fait pendant après ça après votre
requête
eh bien il va encore faire des calculs
puisqu'il va essayer de saisir bas
voilà quelle peut-être a été votre
comportement vis-à-vis de cette requête
sur les sites que vous avez visité
admettons j'ai tapé recettes gâteau au
chocolat je suis allé sur le premier
voilà la recette est trop longue je n'ai
pas le temps tiens je vais aller sur la
deuxième qui est ici / ouest-france et
puis la troisième sur journal des femmes
point fr bref je vais rester peut-être
cinq secondes sur l'a 13 secondes sur
l'autre je vais peut-être revenir en
arrière et voire même peut-être je vais
reformuler ma recherche
je vais marquer vegan parce que je
suivais galles voilà c'est comme ça que
fonctionnent les internautes que vous
fonctionnez puisque vous êtes aussi des
utilisateurs de google
et même si google ne peut pas voilà tout
noté je m'adresse notamment aux
complotistes quand je parle de tout ça
mais google ne va pas traquer tout ce
que vous faites avec votre téléphone
google ne va pas traquer tout ce que
vous faites avec votre google chrome
google ne va pas traquer tout ce que
vous faites avec google maps il va pas
mesuré la position de votre curseur il
ne va pas c'est trop gourmand ça demande
trop de ressources il va éventuellement
prendre certaines moyenne
il va essayer de voir peut-être vous
cliquer un peu plus
il va essayer de voir qu'est ce que vous
aimez que ce coût est ce que vous êtes
positionnés géographiquement oui il
récupère des choses on va pas s'en
cacher mais tous noté ce n'est pas
possible ça serait trop gourmand en
ressources
et google ne peut pas le faire même si
c'est une société valorisée à plusieurs
milliards non il ne peut pas le faire
mais ceci dit sur le principe général
voilà ce n'est pas je tape une requête
et j'ai des résultats qui sont proposés
par ce que là je viens tout juste sur le
vif d'aller naviguer sur le web ce n'est
pas ça d'accord un moteur de recherche
c'est le moteur de recherche a parcouru
tout un tas de sites et cetera il a noté
des choses il a créé une immense
bibliothèque avec
des documents web etc le web qu'il aime
si je puis dire pour ensuite en
analysant votre requête en analysant
votre profil vous donner des résultats
qui correspondent à cette recherche ont
carrément un processus avant pendant et
après votre recherche
et c'est ce que nous allons voir
maintenant en détail en allant voir la
documentation de google qui parle très
bien du fonctionnement d'un moteur de
recherche de google en lui-même est
également de la mission le rôle d'un
moteur de recherche donc passons
maintenant sur un autre et quand je vous
invite à aller tout en bas de google et
vous allez sur info consommateurs vous
allez tomber sur cette page si donc
informations pour les consommateurs dans
la recherche google donc si vous
intéresser aux moteurs de recherche et
notamment au référencement naturel pour
acquérir plus de visibilité
eh bien il peut être utile que vous
lisiez tout ça parce que ça va vous
permettre de savoir à qui vous avez
affaire parce que google voilà met en
place beaucoup de choses mais en place
des résultats naturels mais bien en
place aussi de la pub mais aussi en
place tout un tas de fonctionnalités
chaque année ils ne cessent d'évoluer
pour essayer d'être un moteur de réponse
un véritable assistant personnel c'est
ce dont on parle ces dernières années et
pour le coup il peut être intéressant de
lire toutes ces choses là tous les liens
que vous voyez parce que c'est assez
bien expliqué et ça permet vraiment
d'avoir la bonne vision de balard c'est
quoi le rôle de google
finalement comme je l'expliqué dans une
certaines vidéos sur comment il a fait
pour la rechercher et qu'est ce qu'un
moteur de recherche
on a des demandes on a des offres des
sites et au centre finalement on a un
service de recherche qui est si on fait
une analogie globalement le rôle un peu
d'un ou une bibliothécaire on a des gens
qui arrivent au comptoir ils veulent des
informations tient parce qu'on vous
connais parce que on a de l'expérience
parce qu'on a lu beaucoup parce qu'on
est cultivé parce qu'on sait gérer notre
bibliothèque
eh bien on sait précisément quels livres
vont vous correspondre bon bah c'est
pareil avec google sauf que c'est un
un niveau inimaginable donc allez sur
information consommateurs cliquez sur le
premier lien ici là de la liste comment
fonctionnent les algorithmes de
recherche et vous allez tomber sur cette
page et donc si on va dans cette
présentation générale d'être une vue
d'ensemble de fond comment fonctionne la
recherche google on a quand même
plusieurs choses intéressantes
et puis ensuite on va aller un petit peu
plus en détails et je vais vous parler
bas de caisse qu'un crawler qu'est ce
qu'un scraper un indexeurs et c'est donc
déjà comment fonctionne la recherche
google de manière générale pour chacune
de vos recherches il existe des milliers
voire des millions de pages web
contenant des informations susceptibles
de vous intéresser
et là vous vous demandez comment
identifier les résultats les plus
pertinents
et bien c'est comme ça que google a
réussi à devenir un géant en essayant
déjà avance ce café fait déjà des
moteurs de recherche constitué une
immense bibliothèque un immense index
donc finalement pour poopy adoption
voilà ce qu'il a fait auparavant c'est
organiser le contenu sur le web
donc il a navigué sur tout un tas de
sites ils à crolles et tout un tas
d'adressent url il à scrap et récupérer
des informations
des documents du web des pages web titre
comptex les images le texte les contenus
bref tout un tas de choses et puis il a
classé tout ça il ya un indexeurs dans
un index dans une immense bibliothèque
un peu sous cette forme
voilà on veut au dessus on avait quelque
chose en rapport avec poppy adoption
voilà d'opter un poopy je pense que
c'est un beau pays mais bon moi ça va
être un chien je suppose eh bien on va
aller par exemple dans la lémance
bibliothèque qui a été créé auparavant
parce que j'ai exploré etc va chercher
voilà ce bouquin la bleue la dog parce
que c'est pas de l'art dont on parle
c'est pas de la science dont on parle
c'est pas non plus des maths dont parle
la géométrie non ces deux dogues donc je
sais que là mon rayon là il ya dog chien
et je sais que mes documents avec le bal
manque pour répondre à cette question
poppy abdou kion le chien là c'est ce
truc bleus-là ces dogues
donc c'est comme ça que fonctionne
google c'est une machine encore une fois
c'est pas d'imagés comme ça il n'y a pas
un robot qui va dans un rayon et prendre
un classeur mais informatiquement
c'est ce fonctionnement là que nous
avons donc avant même que nous
saisissions notre requête google a
organisé des informations disponibles
bas dans des pages web dans leur index
de recherche confirmant un index google
avec une copie des pages web des
contenus qu'on trouve peut trouver sur
le web et notamment sur son autre site
par exemple si on est éditeur créateurs
de sites donc c'est un deck s'apparente
à une bibliothèque comme je viens de le
dire
et donc
c'est important de dire que ça contient
beaucoup plus d'informations que toutes
les bibliothèques du monde réunis et
c'est là l'idée en fait c'est que google
a toujours voulu faire le maximum par
rapport à ça on avait des années 90-2000
d'exemple si copé dit bien connue alors
je crois que c'était en kart à des
choses comme ça c'était rien c'était
rien c'est déjà énorme mais c'était rien
à côté de ce que google aujourd'hui
google aujourd'hui quand on prend du
recul et c'est important d'en parler
c'est énorme c'est énorme de se dire que
auparavant devaient aller voir un
spécialiste on devait téléphoner à des
gens spécialisés
on devait aller voir des bouquins dans
des bibliothèques à paris où je ne sais
quoi pour trouver des informations
essentielles est très très précise et
aujourd'hui en fait non ben on a
d'autres smartphones
on a tablet on a un but un ordinateur de
bureau on va sur google on tape quelque
chose on a des informations c'est énorme
c'est énorme qui aurait cru il ya 30 ans
ou 40 ans que ça ça aurait pu exister
personne personne et ça c'est important
de le dire et c'est important d'en
prendre conscience surtout si vous
intéresser aux moteurs de recherche est
aussi référence donc voilà on a une
requête qui est tapé on à google qui a
déjà fait un bon travail d'indexer des
documents d'explorer le web et tout ça
danalyse machin et quand vous avez tapez
votre requête
il va passer au crible des centaines de
milliards de pages web qui sont dans son
annexe pour essayer de trouver les
résultats les plus pertinents et utiles
en réponse à votre requête ce qui permet
ensuite d'avoir des supers résultats
avec plein de couleurs des images google
maps un itinéraire d information bref
tout un tas de choses en fonction de
votre requête ça peut ça peut changer et
c'est un peu ça que propose google
aujourd'hui c'est sa promesse est
derrière tout ça nous avons d'autres
types de résultats nous n'avons pas des
résultats que naturel donc qu'ils sont
vraiment fait à partir de la pertinence
de
de ce qui est proposé et c'est non on a
aussi de la publicité qui l'a
globalement on paye voilà et on a un
encart publicitaire un endroit donc
c'est nous qui choisissons ou est-ce
qu'on veut être
publiés ou est-ce qu'on veut mettre la
publicité mais au final voilà on peut
avoir un très très mauvais contenu étant
complet et ben voilà on peut tout à fait
être visible donc c'est vraiment deux
choses distinctes qu'on a à la fois
résultats naturels et les résultats
sponsorisés les résultats publicitaires
et les résultats naturels c'est vraiment
là dessus que le fonctionnement du
moteur de recherche et est intéressant
autre chose d'intéressant à dire c'est
que google ne cesse d'améliorer votre
expérience notre expérience en bougeant
les lignes en mettant des couleurs des
vidéos en essayant d'enrichir ses pages
avant on avait dit le lien bleu avec un
peu de publicité aujourd'hui on a plein
de vidéos d'image même des petites box
qui nous répondent directement
c'est vraiment super finalement comme
programme donc voilà pour la
présentation générale de google et donc
si on va dans le détail de chaque étape
donc on a une première partie qui se
passe donc avant votre recherche
on à l'exploration et l'indexation et
l'exploration indexation donc si cet
onglet là comment la recherche google
organise des informations donc on a des
milliards de pages qui existe voilà sûr
quand on va sur internet manière
générale et le réseau internet et que on
navigue sur le web donc tout ce qui est
accessible avec un navigateur ou autre
globalement on a tout un tas de
l'adresse lavoyer generes qui finit par
crawling indexing si je vais sans
information consommateurs j'ai une autre
adresse si je vais ici une autre adresse
et pour votre site ou pour votre copain
potes qui a un site ou pour n'importe
quelle entreprise etc
on a aussi une adresse principale la
page d'accueil nom de domaine google.com
point fr et ensuite on a différentes
adresses
globalement on a un premier programme et
là je rentre un peu dans le détail on a
un problème
un premier programme pardon qui
s'appelle un crawler un crawler c'est
quoi c'est un programme informatique qui
va explorer son but c'est de trouver des
url c'est à dire des nouvelles pages à
explorer ce crawler fonctionne
étroitement avec ce qu'on appelle aussi
un scraper un scraper c'est un programme
informatique encore mais qui ne va pas
juste chercher des nouveaux liens comme
les liens qui sont ici ça c'est de
crawler qui le fait le scra peur non lui
c'est vraiment récupérer des
informations donc ça récupérer les
titres et qui est contenue récupérer des
images bref tout dépend du scra peur
qu'on a configuré
mais globalement ça récupère de
l'information ça peut copier tout un
document entier ça peux tu perds et
simplement que les titres bref ça dépend
du scraper encore une fois donc on a le
crawler qui explore et trouvent des
nouveaux liens et globalement en
parallèle on a un scraper qui va
récupérer des informations faire des
copies de certaines choses pour ensuite
les envoyer dans l'index via un
indexeurs et l'index heures c'est donc
un autre programme informatique un autre
processus qui permet de créer un axe et
de gérer aussi l'index donc on a
vraiment plusieurs phases
bien sûr il ya des sous programme du
crawler des sous programme du scra peur
on a des tas de choses qui se passe en
coulisses et c'est chez google
mais si vous devez retenir peut-être ou
avec quatre choses avant de parler de la
roquette s'est on a un crawler qui
explorent des url
en parallèle le scraper récupéra des
informations sur ces url ca va ces pages
voilà ces informations sont copiés
ensuite dans un index via l'aide d'un
indexeurs et ensuite vous avez votre
requête qui rentrent en ligne de compte
c'est à dire que l'exploration c'est un
processus continu
ils ont organisé des informations lors
de l'indexation et ensuite vous avez des
algorithmes de recherche qui vont
essayer d'étudier votre requête
vous avez par exemple quelque chose qui
va analyser les termes de recherche
quelque chose qui va chercher des
correspondances vous avez quelque chose
qui va classer les pages selon leur
utilité
vous avez encore un autre algorithme qui
va afficher des meilleurs résultats
selon certains critères et c'est à leur
popularité machin la vitesse la sécurité
et vous avez aussi tout un tas de choses
qui vont prendre en compte le contexte
c'est à dire où vous situer
géographiquement parlant qui soulève
vraiment voulu dire qu'est ce qu'on peut
vous proposer l'instant t veut dire vous
prenez par exemple en ce moment on a un
contexte bon jour où j'enregistre cette
vidéo en tout cas on entend encore
parler
de la crise sanitaire du coronavirus bon
bah si vous tapez virus aujourd'hui
peut-être qu'en actualité vous allez
avoir coronavirus si vous tapez coheed
ça va pas être juste une page wikipédia
qui va expliquer ce que c'est le comice
vous avez aussi toutes les indications
concernant les chiffres concernant le
coc vide donc tout ça c'est de l'analyse
de contexte et s'est proposé aux
internautes une expérience des données
pertinentes des données utiles qui vont
vous permettre d'avoir des réponses
voilà donc globalement vous avez
l'exploration et l'indexation avec un
crawler un scraper un indexeurs qui
globalement vous récupérer une bonne
partie du web exclure tout ce qui leur
intérêt ce pas pour mettre dans l'index
et quand vous faites une recherche
google va l'analyser va essayer de
déduire le contexte va essayer d'aller
chercher document dans son index pour
vous les restituer je m'arrête sur
quelques singles rythme important
tout d'abord les algorithmes de
pertinence les algorithmes de pertinence
c'est un ensemble de critères en fait
qui sont analysés sur les pages qui
permettent de voir si une page un site
un contenu et pertinents pour une
requête recette de gâteau au chocolat si
je ne parle pas de chocolat et je parle
que de citron ce n'est pas pertinent
il ya peut-être un gâteau il ya
peut-être une recette mais il n'y a pas
de chocolat
donc ce n'est pas pertinent ou ce sera
peu pertinents il ya tout un tas
critères on a des centaines d'un
centaines et des centaines qui vont
analyser globalement votre titre de page
comment est structuré contenu laisse
pense le maire général voilà qu'est ce
que vous allez donner comme contenu
qu'est-ce qui est ce que c'est pertinent
voilà ça ce sont les aveugles de
pertinence vous avez aussi les
algorithmes comportementaux donc là
c'est plus lié à lui x c'est à dire
est-ce que voilà
on arrive à travailler avec votre site
taper une requête on arrive sur votre
site votre pas l'autre résultat est ce
que je lis un pigment est ce que je
reste souvent sur cette page là est-ce
que j'ai accéder à l'information
simplement bref c'est tout ce qui est
algorithmes comportementale et ensuite
vous avez les algorithmes de calcul de
popularité qui sont les algorithmes qui
vont globalement essayer de voir si le
site où la page et populaires pour tel
ou tel pour monter tout sur tel ou tel
page de résultat pour nous rien donné ça
c'est lié à se situe le site où la page
sur le web c'est à dire globalement si
on part sur la formule de base du
pagerank c'est l'algorithme qui a créé
notamment les deux fondateurs de google
et qui ont fait d'ailleurs la renommée
en partie de google plus on est cité
plus on est populaire c'est un peu comme
dans les livres si vous voyez souvent le
même nom était cité basse et peut-être
que cette personne est populaire bon bah
c'est un peu pareil avec que google
c'est à dire que lui il va regarder
toutes les pages du web
il va voir comment sont faits les
citations aujourd'hui tout le monde site
facebook tout le monde site amazon tout
le monde parle de ces deux sites donc ce
sont des gros sites qui monte très haut
pourquoi wikipedia monte très haut parce
que ben c'est une encyclopédie acquis
énormément d'informations utiles et
globalement wikipedia monte quand même
souvent sur beaucoup de requêtes
et bien c'est pareil quand vous parlez
de cdiscount quand vous parlez de tel ou
tel site e-commerce la fnac ou haute
pourquoi ils sont toujours en haut parce
que ce sont les sites qui sont
populaires que ce sont ceux sont des
sites qui sont beaucoup cité sur le web
donc vous avez des algorithmes notamment
la douane de pagerank
il ya d'autres sous algorithmes et
d'autres alternatives et d'autres trucs
qui rentrent en ligne de compte bien
entendu mais globalement les algorithmes
de calcul de popularité permettent de
savoir si un site est populaire vous
avez des algorithmes de pertinence
vous avez des aveugles comportementaux
vous avez des algorithmes de calcul de
popularité donc ça c'est la plupart des
abris pour saisir qu'est-ce qu'on donne
et où est-ce que s'est positionné
dans le temps et également vous avez un
autre truc qui est super intéressant qui
est vraiment les algorithmes un anti
spam ou globalement au fur et à mesure
que google explore le web et indexe le
web
eh bien il ya des choix qui sont faits
est-ce que ce site est ce pas est-ce que
ce site et passe pas ça c'est peut-être
lors de l'exploration déjà il va écarter
énormément de spam et on va avoir
toujours une toute petite partie de sidi
sont un petit peu spam ils sont pas top
top et que google va essayer de filtrer
au phare à mesure du temps et nous avons
notamment des filtres antispam
aujourd'hui des filtres qui sont mis sur
la sur le contenu sur sur les liens sur
des techniques de manipulation des
choses que font certaines personnes pour
pouvoir tricher est monté ou parfois
juste parce qu'ils ne savent pas faire
et donc google
s'il détecte du contenu de mauvaise
qualité ben le filtre antispam peut
sanctionner ce résultat ce site si
google détecte qu'il a eu des techniques
de manipulation pour avoir trop de
citations etc
bon bah pareil vous avez le filtre
antispam qui peut sanctionner ce site
voilà donc le filtre qui était très
connu auparavant c'était google panda
l'appui sans un bouton et globalement ça
sanctionner une partie du web qui avait
un mauvais contenu ou encore une
mauvaise qualité et on avait aussi
google pingouins de l'autre côté qui
sanctionnait tout ce qui était net
linking les liens de mauvaise qualité
les citations spam qui sont
manipulateur tout simplement du du
classement et aujourd'hui ce sont des
processus continuel qui fonctionne voilà
toute l'année et qui qui essayent de
pénaliser de sanctionner les contenus de
mauvaise qualité et les liens de
mauvaise qualité
donc voilà pour cette grosse explication
sur comment fonctionne un moteur de
recherche j'essaie de donner des détails
j'ai essayé de vous expliquer le plus
simplement possible
c'est un métier à part entière il faut
le dire moi même je ne suis pas
concepteur de moteurs de recherche et il
ya peut-être certains jargon voilà que
je n'ai pas et mais voilà cette vidéo
est là pour les personnes qui sont
désireuses d'apprendre de trouver des
informations sur les moteurs de
recherche
et j'espère que ça a été clair et que
vous avez un petit peu mieux compris
comment ça fonctionne et donc n'oubliez
pas en conclusion que ce n'est pas je
tape une requête et google va chercher
là tout de suite à un instant t sur le
vif des documents pour notre quête ça
serait trop gourmand en ressources ne
serait pas possible ce sera extrêmement
lent nom dans google fait de
l'exploration essaye de détecter
qu'est-ce qui est spam récupère que ce
qui est vraiment utile va ensuite mail
indexer tout ça dans un index donc toute
cette partie là c'est crowley scrap est
indexé dans un index et ensuite on à la
roquette qui est tapé on analyse la
roquette on analyse les documents dans
l'index qui pourrait correspondre à la
demande de la personne utilisatrice du
moteur de recherche
et on va lui restituer vienne interface
utilisateur est bien ensemble de
résultats utiles et selon un classement
qui est définie parce que les pages ont
été analysés avec des algorithmes de
pertinence avec des algorithmes de
calcul de popularité et des algorithmes
de comportement voilà tout simplement
voilà sur ce et bien je vous souhaite
une très bonne continuation je vous dis
à très bientôt pour une nouvelle vidéo
n'hésitez pas à liker vous abonner
déclencher la cloche des notifications
et je vous dis à bientôt
bye
5.0 / 5 (0 votes)