Comment retrouver n'importe qui sur Internet ?
Summary
TLDRCette vidéo explore les risques de partager des informations personnelles en ligne, mettant l'accent sur la vulnérabilité de la reconnaissance faciale et la traçabilité des données. L'auteur partage son expérience d'enquête sur des disques durs anciens et souligne l'importance de prendre des précautions dès le départ. Il présente également des outils de protection de la vie privée comme Proton, et met en lumière les avancées technologiques qui rendent les méthodes de dissimulation obsolètes, montrant que même des images floues peuvent être utilisées pour identifier et localiser des individus.
Takeaways
- 🔒 Il est conseillé de ne pas partager son nom de famille sur Internet pour préserver la vie privée.
- 🕵️♂️ Les outils de recherche en ligne peuvent rendre inutile l'utilisation de pseudonymes ou d'initiales pour cacher son identité.
- 🔍 Les métadonnées des images, comme les données EXIF, peuvent contenir des informations précieuses sur l'emplacement et l'appareil utilisé.
- 🌐 Internet n'oublie jamais : même les contenus supprimés peuvent être retrouvés à l'aide de divers outils.
- 🛡️ ProtonMail et d'autres services Proton sont réputés pour la protection de la vie privée grâce à leur architecture Open Source et chiffrée de bout en bout.
- 🔎 La reconnaissance faciale agressif peut identifier une personne même à partir d'une photo floue ou mal cadrée.
- 🌐 Les moteurs de recherche de visage comme PimEyes peuvent analyser et stocker des empreintes faciales à partir d'images trouvées sur Internet.
- 🔍 La recherche d'images inversée peut être utilisée pour détecter des arnaques ou pour identifier des personnes à partir de photos.
- 🌐 Les avancées technologiques ont permis aux agences gouvernementales et aux entreprises privées d'accéder à des outils de reconnaissance faciale précurseurs.
- 🔒 Utiliser des adresses e-mail uniques pour chaque service peut empêcher le traçage et la corrélation des données personnelles.
- 🚨 Les cybercriminels peuvent se faire démasquer à l'aide de la reconnaissance faciale et de la surveillance constante des réseaux sociaux et des sites web.
Q & A
Pourquoi est-il conseillé de ne pas publier son nom de famille sur Internet ?
-Il est conseillé de ne pas publier son nom de famille sur Internet pour éviter que des informations personnelles ou des contenus embarrassants ne soient facilement accessibles, notamment par de futurs employeurs, ce qui pourrait nuire à votre réputation.
Quels services Proton offre-t-il pour la protection de la vie privée ?
-Proton offre plusieurs services axés sur la protection de la vie privée, incluant Proton Mail pour les emails sécurisés, ProtonVPN pour la navigation anonyme, Proton Calendar pour la gestion d'agenda privée, et Proton Drive pour le stockage sécurisé des fichiers.
Comment les données EXIF peuvent-elles être utilisées pour retrouver des informations sur une photo ?
-Les données EXIF peuvent inclure des informations telles que la date et l'heure de prise de vue, le type d'appareil utilisé, et parfois les coordonnées GPS. Ces informations peuvent aider à retrouver l'origine d'une photo ou le lieu où elle a été prise.
Qu'est-ce que la triangulation avec les étoiles et comment a-t-elle été utilisée ?
-La triangulation avec les étoiles est une méthode d'analyse des positions des étoiles pour déterminer un emplacement géographique. Elle a été utilisée par des internautes pour localiser un drapeau en analysant les étoiles visibles dans un live stream.
En quoi la reconnaissance faciale change-t-elle la donne concernant la protection de la vie privée sur Internet ?
-La reconnaissance faciale permet d'identifier des individus sur des photos avec une précision élevée, rendant les pseudonymes ou les précautions classiques insuffisantes pour protéger l'anonymat et la vie privée sur Internet.
Quels sont les avantages et les risques associés à l'utilisation de bases de données biométriques ?
-Les avantages incluent une meilleure sécurité et la facilité d'identification des personnes. Les risques concernent les atteintes à la vie privée, le potentiel abusif de surveillance et la possibilité de fausses identifications.
Quelle méthode spécifique de reconnaissance faciale a été mentionnée et comment fonctionne-t-elle ?
-La méthode mentionnée est la triplette loss, qui apprend à un algorithme à reconnaître des visages en lui fournissant trois images à la fois : deux images de la même personne et une d'une autre, permettant de distinguer les similitudes et différences.
Comment les évolutions technologiques ont-elles impacté le coût et l'accessibilité de la reconnaissance faciale ?
-Les avancées technologiques, notamment dans les réseaux à convolution et la puissance de calcul des GPU, ont considérablement réduit le coût et augmenté l'accessibilité de la reconnaissance faciale, la rendant disponible pour une utilisation plus large.
Quel exemple montre l'efficacité de la reconnaissance faciale dans les enquêtes criminelles ?
-L'arrestation de Andrès Viola, un pédocriminel argentin, illustre l'efficacité de la reconnaissance faciale. Le FBI a utilisé Clearview AI pour le retrouver grâce à un selfie accidentellement capturé en arrière-plan dans une salle de sport.
Quelle fonctionnalité de Proton est recommandée pour éviter le traçage par email ?
-Simple Login, une fonctionnalité de Proton, est recommandée pour éviter le traçage par email. Elle permet de créer des adresses email uniques et anonymes, réduisant ainsi le risque de traçage et de corrélations par les data brokers.
Outlines
🔍 Importance de la protection de la vie privée en ligne
Le paragraphe souligne l'importance de ne pas partager son nom de famille sur Internet pour éviter que des futurs employeurs ou d'autres personnes ne trouvent des informations indésirables sur vous. Il est également mentionné que malgré les efforts pour supprimer ces informations, elles peuvent rester accessibles en ligne. L'auteur propose l'utilisation de pseudonymes ou d'initiales pour protéger sa vie privée. Il introduit ensuite les services de Proton, une entreprise spécialisée dans la protection de la vie privée, et son produit le plus connu, Proton Mail, ainsi que d'autres outils comme ProtonVPN, Proton Calendar et Proton Drive.
🕵️♂️ Enquête sur les disques durs achetées sur Leboncoin
L'auteur relate une expérience où il a acheté des disques durs sur Leboncoin pour enquêter sur les propriétaires potentiels. Malgré des recherches approfondies, il n'a pas trouvé d'informations personnelles sur le vendeur, ce qui l'a motivé à poursuivre l'enquête. Il a utilisé des outils pour analyser les métadonnées des photos sur les disques, mais n'a trouvé que peu d'informations utiles. Il mentionne également que certaines photos ont été perdues en raison des méthodes utilisées pour extraire les données des disques durs.
🌐 Utilisation de la géolocalisation et de la reconnaissance faciale
Dans ce paragraphe, l'auteur explique comment il a utilisé des données EXIF pour déterminer la date et l'heure d'une photo prise, ce qui a permis de localiser la position géographique de la prise de vue. Il mentionne également l'utilisation de la reconnaissance faciale pour identifier des visages dans les photos. Il décrit le processus d'entraînement d'un algorithme d'IA pour reconnaître des visages, en utilisant des triplettes d'images pour apprendre à distinguer des visages similaires de ceux qui ne le sont pas. Il mentionne également l'utilisation de modèles d'IA pré-entraînés pour identifier des visages dans des photos.
🕵️♀️ Révélation de l'identité du vendeur grâce à l'IA
L'auteur raconte comment il a utilisé une IA pour identifier l'identité du vendeur des disques durs. Il a utilisé un outil de reconnaissance faciale pour comparer des photos et a réussi à trouver une correspondance avec un blog personnel. Il souligne la facilité avec laquelle des outils de reconnaissance faciale peuvent être utilisés pour identifier des personnes en ligne, même sans leur consentement. Il mentionne également des cas où des personnes ont été localisées et arrêtées grâce à des images trouvées sur Internet, mettant en lumière les implications de la surveillance en ligne et la perte de la vie privée.
Mindmap
Keywords
💡Protection de la vie privée
💡Internet et identité
💡Métadonnées
💡Reconnaissance faciale
💡Données biométriques
💡Traçage par email
💡Données clients
💡Cybercriminalité
💡Open Source
💡Architecture 0 access
💡Data brokers
Highlights
Il est conseillé de ne pas partager son nom de famille sur Internet pour des raisons de sécurité.
Les outils en ligne peuvent rendre inutile la protection de l'anonymat en ligne.
ProtonMail, ProtonVPN, Proton Calendar et Proton Drive sont des services réputés pour la protection de la vie privée.
Les outils de Proton sont open source et cryptés de bout en bout.
L'architecture 0 access de Proton empêche l'accès à vos données.
Les données EXIF des photos peuvent révéler des informations importantes comme les coordonnées GPS.
Les réseaux sociaux effacent souvent les données EXIF lors de la publication.
La recherche de photos de coucher de soleil peut aider à identifier l'emplacement de la prise de vue.
La reconnaissance faciale peut être utilisée pour identifier des personnes sur Internet.
Les algorithmes d'IA peuvent apprendre à reconnaître des visages à partir d'exemples.
Les triplettes de reconnaissance faciale aident à apprendre à distinguer des visages similaires.
Les bases de données de reconnaissance faciale comme Labeled Faces in the Wild et MS Celeb ont permis des avancées significatives.
Les GPU et les puces dédiées au machine learning ont réduit le coût de l'entraînement des IA.
Clearview AI a plus de 3 milliards de photos dans sa base de données.
Pimize, un moteur de recherche de visage, a été créé par deux étudiants polonais et est très efficace.
L'IA peut identifier des visages malgré les changements de luminosité et les situations extrêmes.
Les outils de reconnaissance faciale sont accessibles et peuvent être utilisés par n'importe qui.
Les données client peuvent être utilisées pour traquer les individus en ligne.
Simple Login de Proton peut empêcher le traçage par email.
Les cybercriminels peuvent se faire démasquer par leur utilisation d'email unique partout.
Transcripts
si vous avez eu des parents prudents ils
vous ont peut-être dit qu'il ne fallait
jamais au grand jamais écrire son nom de
famille sur Internet et effectivement ça
sonne comme une bonne idée si votre
futur recruteur tape votre nom dans
Google et vous voit arracher à votre
assaut étudiante ou tombe sur les postes
gênants que vous faisiez au collège
c'est pas terrible vous pouvez toujours
tenter de les faire supprimer mais comme
on dit internet n'oublie jamais il y a
tellement d'outils pour retrouver des
contenus sensés avoir disparu qu'il est
plutôt prudent de prendre un maximum de
précaution notamment dès que possible
utilisez un pseudo ou au moins les
initiales à la place de son nom de
famille et effectivement c'était une
bonne idée à une certaine époque
d'Internet a un certain stade de la
technologie ce que j'aimerais vous
montrer dans cette vidéo c'est que
depuis relativement récemment c'est
devenu parfaitement
inutile et que s'il reste quelques
photos dossiers de vous sur Internet
vous avez du souci à vous faire
[Musique]
vous l'avez compris on va parler en
quête en partenariat avec proton proton
c'est un ensemble de services
multiplateformes qui sont très réputés
et précurseurs sur les technologies
liées à la protection de la vie privée
leur produit phare c'est le fameux
proton mail mais ils ont aussi protonvpn
et plus récemment proton calendar et
proton drive leurs outils sont Open
Source chiffrées de bout en bout avec
une architecture 0 access ce qui veut
dire qu'il leur est littéralement
impossible d'accéder à vos mails les
serveurs sont en Suisse pour bénéficier
du cadre légal très favorable sur la
protection des données vraiment l'X et
incroyable pas une pub regardez-moi
comme c'est clean l'offre gratuite est
déjà top et si vous aimez vous pouvez
prendre proton unlimited avec tout ça
pour moins de 10 euros par mois toute
cette histoire a commencé il y a
quelques mois j'ai sorti une vidéo sur
ma chaîne Youtube qui en apparence
pouvait sembler parfaitement anodine j'y
commande des disques durs en masse sur
leboncoin pour en trouver qui sont mal
formatés et desquels on peut extraire
des vieilles photos et fichiers
intéressants comme l'idée c'était de
faire un peu de prévention on s'était
mis en tête d'utiliser ces sources pour
mener des petites enquêtes sur internet
sur les propriétaires des disques
histoire de simuler ce que pourrait
faire des cybercriminels dans un
débarras d'entreprises par exemple sauf
que on a rien trouvé dans le sens où
après des heures de recherche on avait
même pas son prénom comme on vous dire
que je commençais à être un peu vexé on
est censé avoir quelques skills quand
même et là on est même pas foutu de
trouver un nom et un prénom d'une
personne random du coup on en a fait une
affaire personnelle et je vous préviens
on est parti loin mais ça nous a permis
de découvrir des outils dingues dont il
fallait absolument que je vous parle
alors rappelle des conditions de
l'exercice on a à notre disposition un
dossier de photos tout ce qu'il y a de
plus classique on va évidemment flouter
ça au maximum notamment parce que cette
vidéo va être analysée par un gardien de
la paix de la préfecture de police ah
c'est un peu loin et vous expliquer je
vous raconte ça après malheureusement à
cause des méthodes qu'on a utilisées
pour les extraire des disques durs la
plupart des des fichiers et des dossiers
originaux ont été perdus un premier truc
cependant qu'on peut regarder ce sont
les données exifs des photos ce sont des
informations en plus qui seront
sauvegardées avec des images on voit par
exemple que cette photo a été prise en
2012 et sans flash sur internet c'est
rare qu'on est accès à ça car les
réseaux sociaux efface ce jour ces infos
au moment de publier mais nous on a un
disque donc tout est encore là dans ces
métadonnées il peut notamment y avoir
des coordonnées GPS les smartphones
enregistrent souvent ça ce serait pas
mal pour nous aider à retrouver
l'identité du vendeur on pourrait
retrouver son adresse ou son travail et
ensuite fouiller dans les PagesJaunes
pour avoir son nom mais après avoir
scanner l'ensemble des images
malheureusement il y a que dalle
l'ensemble des photos et des vidéos ont
l'air d'avoir été prise avec un appareil
photo pas un smartphone j'en ai quand
même profité pour regarder s'il y avait
pas des détails intéressants sur les
photos elles-mêmes évidemment il n'y a
aucune photo il se prend un selfie
devant sa résidence principale avec le
nom et le numéro de sa rue dans le cadre
ce serait trop simple mais vous allez
voir qu'en réalité c'est loin d'être
nécessaire je sais pas si vous avez déjà
entendu l'histoire de l'acteur Shia
Leboeuf et d'un drapeau anti Trump
planté au milieu de la campagne
américaine aussi improbable que ça
puisse paraître ça ressemble vachement à
notre problème on est en 2017 juste
après l'élection de Donald Trump Shia
lebuff un acteur et humoriste américain
décide de diffuser un live de
protestataire depuis une rue de New York
24 heures sur 24 pendant 4 ans il invite
les gens à s'exprimer et à reprendre le
slogan du projet
[Musique]
cependant après quelques altercations il
est arrêté par la police et la caméra
est éteinte pour trouble à l'ordre
public chia décide alors de remplacer le
live par la diffusion d'un simple
drapeau avec le slogan imprimé dessus
sauf que la localisation de ce drapeau
est maintenue secrète fin de l'histoire
a priori vu le peu d'information visible
à l'écran je ne vois pas comment
quelqu'un pourrait retrouver son
emplacement n'est-ce pas et bah ce n'est
pas la vie du forum Fortun dont les
membres adorent les chasses au trésor de
ce genre ils analysent méthodiquement
les avions qui traversent le ciel
derrière le drapeau il surveille les
réseaux sociaux pour suivre les
déplacements de l'acteur ils sont
carrément aller jusqu'à faire de la
triangulation avec les étoiles qui
étaient visibles la nuit en moins de 24
heures ils avaient la position exacte du
drapeau au fin fond du Tennessee un des
membres il va en voiture klaxonne
jusqu'à ce qu'on l'entende dans le live
jusqu'à capturer comme dans un jeu vidéo
le drapeau qu'il ne manquera pas de
remplacer par une casquette à l'effigie
de Trump et un t-shirt pépé de frog
evidemment alors moi je n'ai pas trouvé
de photos d'avions mais il y a peut-être
d'autres détails qui pourraient nous
aider tout d'abord il y a cette photo
avec un superbe coucher de soleil
peut-être qu'il a pris depuis sa chambre
les données exifs indiquent qu'elle a
été prise le 9 août 2012 à 20h20 vous
allez peut-être me dire qu'est-ce que ça
peut bien nous [ __ ] et ben en fait si
on y réfléchit bien il y a peu
d'endroits sur la planète où on voit le
soleil juste au-dessus de l'horizon
simultanément en fait on peut même
tracer une ligne autour du globe avec
tous les endroits qui sont actuellement
en coucher de soleil c'est exactement ce
que fait un site que j'ai trouvé qui
s'appelle suncalque à l’origine il est
vachement utilisé par des architectes ou
des urbanistes pour voir les mouvements
du soleil et des ombres sauf que c'est
aussi très pratique dans des enquêtes
regardez actuellement par exemple si
quelqu'un poste un coucher de soleil sur
Internet on sait qu'il est forcément
dans cette zone et si on modifie la date
et l'heure avec notre photo voilà ce que
ça donne on sait que notre photographe
se trouvait probablement par ici ensuite
on va pouvoir essayer de recouper ça
avec d'autres photos qu'on a extrait du
disque dur regardez bien celle-ci est-ce
que vous voyez ce que je vois en zoomant
on aperçoit des drapeaux cachés dans le
fond un peu trop pixelisé pour les
reconnaître mais si on les compare avec
les drapeaux des quelques pays qu'on a
isolés un seul drapeau a l'air de
correspondre celui du Togo pas mal mais
peut-être qu'il nous faudrait un indice
supplémentaire je suis notamment tombé
sur cette photo où on voit un stade de
foot et en vrai il doit pas non plus y
en avoir des milliers et des gros stades
de foot au Togo du coup j'ai
littéralementé stade Togo dans Google
Images et après avoir scroller un peu
Ingo regardez celui-là c'est parfait
même horloge même poto d'éclairage c'est
sur celui acheter très content mais en
vrai quand on y réfléchi il y a quand
même peu de chances que notre vendeur
habite là-bas à part s'il a fait un
aller-retour Togo Porte de Champerret
pour me vendre un disque dur peu
probable cette histoire bon pour le
moment on a rien trouvé qui permettent
de relier ces photos avec l'identité de
notre mystérieux vendeur on a rien
découvert dans les métadonnées
impossible de déduire l'adresse à partir
des photos je vous épargne les autres
tentatives infructueuses qu'on a fait
pour essayer de trouver des éléments qui
reliraient ces photos à une présence sur
Internet ce qui partant c’est que ça
nous a amené à considérer une dernière
possibilité utilisez de la
reconnaissance faciale vous connaissez
peut-être la recherche d'images inversée
sur Google c'est très pratique pour
retrouver une photo qui apparaît à
d'autres endroits sur internet je vois
pour détecter des arnaques de
dropshipping par exemple cette fonction
de google intègre notamment de
l'intelligence artificielle pour décrire
la composition de l'image si on fournit
une photo de ce monsieur barbu par
exemple il va effectivement retrouver de
nombreuses images de Messieurs barbus
avec une pause et un décor similaire
c'est pas mal le problème c'est que
c'est pas le bon barbu la pose et le
décor en réalité nous on s'en fout nous
on a besoin de faire de la vraie
reconnaissance faciale surtout que le
vendeur a peut-être changé si ça se
trouve il s'est mis à apporter des
lunettes ou c'est laisser pousser une
grosse moustache parce que je vous
rappelle que les données qu'on a date de
2012 alors comment
identifier un visage qu'est-ce qui fait
l'essence de votre tête finalement vous
allez voir c'est hyper intéressant
intuitivement on pourrait proposer un
système qui fait des mesures de visage
un peu partout genre la distance entre
les deux yeux entre le la bouche la
hauteur et la largeur du visage etc et
on pourrait comparer proportionnellement
cette distance avec d'autres visages sur
d'autres photos et bah dites-vous que ça
c'est exactement ce que faisait la
police scientifique dans les années 60
avec une règle et un crayon pour
démontrer que deux visages appartenaient
à la même personne ils avaient une
vingtaine de points de référence qui
constituaient une empreinte à peu près
unique d'un visage le problème de cette
approche c'est que c'est un peu bancal
notamment dès que la personne n'est pas
pile de face ou de profil heureusement
depuis on a trouvé beaucoup mieux en
fait plutôt que faire un listing manuel
le fait de donner énormément d'exemples
un algorithme c'est lui qui va lui-même
faire sa propre sélection en fait on
peut donc entraîner une intelligence
artificielle pour qu'elle apprenne
d'elle-même à analyser et reconnaître
des visages on va prendre un exemple
pour tester si ça marche vraiment si
bien vous voyez cette photo et bien
malheureusement j'ai un immense trou de
mémoire et je n'arrive plus à me
souvenir de qui est cette charmante
personne on va donc essayer de coder un
outil pour retrouver son identité sur
Internet la première chose à faire c'est
extraire des détails intéressants de
l'image grâce à ce qu'on appelle des
filtres de convolution on peut vraiment
voir ça comme comme le fait de passer
différents filtres sur une image comme
si tu essayes de passer un filtre
passeport
que tu essayes d'extraire simplement les
ans les contours la granularité de ta
peau grâce à ce traitement lia va être
capable de repérer des détails
intéressants dans une image ce principe
là il faut en fait qu'on l'applique à
des milliers de photos d'exemples pour
que il y a apprennent petit à petit à
différencier un visage d'un autre en
pratique il existe en fait une infinité
de façon d'entraîner une IA analyser des
images donc il faut choisir la méthode
la plus adaptée à notre problème de
reconnaissance faciale réfléchir en fait
dans votre cas particulier la triplette
gloss c'est vraiment quick le plus
l'idée de la triplette los c'est de
fournir à une IA des séries de trois
images avec à chaque fois un visage déjà
connu une autre photo de la même
personne et quelqu'un d'autre qui ne lui
ressemble pas du tout de cette manière
notre algorithme va apprendre trouver
des similitudes entre les visages qui se
ressemblent et à l'inverse a bien
distinguer ce qui sont différents pour
gagner du temps j'ai trouvé un modèle
d'ya qui a déjà été entraîné de cette
manière j'ai fait un petit script pour
importer ça et lui donner des images à
analyser et avec la photo qu'on cherche
à identifier voilà ce qu'on obtient bon
d'accord c'est parfaitement
incompréhensible et pas vraiment ce à
quoi on pourrait s'attendre mais pour
l'IA ce sont 128 valeurs qui
représentent en fait les traits uniques
du visage c'est une sorte d'emprunt
digitale unique qui permet d'identifier
la personne mais que nous on comprend
pas du tout à partir de ça pour savoir
si il s'agit du même visage sur une
autre photo il suffit de générer cette
empreinte et de les comparer si les deux
vecteurs sont mathématiquement
suffisamment proches c'est que ça la
même personne et si on prend les visages
de 10000 célébrités pour voir si on peut
y retrouver notre mystérieux personnage
ça ressemble à ça voilà il y a des
photos de différentes personnalités bien
rangées dans des dossiers avec leur nom
et leur visage on calcule toutes les
signatures on les compare avec notre
photo et
ça peut dit
évidemment c'est une forte
simplification de la réalité puisque
comme dans tous les modèles de Deep
learning sa qualité dépend directement
de la qualité du corpus de données qui a
servi à l'entraînement ici on a
notamment veillé à ce que dit Caprio
apparaissent bien dans l'échantillon
d'entraînement et que notre photo est
été prise dans des conditions
d'éclairage similaire à l'originale pour
faire la même chose à l'échelle d'un
pays où du monde entier c'est une autre
paire de manches et pendant très
longtemps c'était extrêmement coûteux et
réservé à un cercle assez restreint des
agences gouvernementales ou des
entreprises privées qui donnaient accès
à leur technologie que pour des usages
très restreints en quête judiciaires
anti-terrorisme recherche de personnes
disparues etc entre temps il s'est passé
pas mal de choses l'invention des
réseaux à convolution dont on a déjà
parlé qui permet aux Ia de déterminer
elle-même les attributs des visages mais
également d'immenses compétitions
ouvertes comme le imaginet lorsqu'elle
visual rec une challenge qui ont motivé
les chercheurs à perfectionner encore et
toujours les modèles si bien qu'on a vu
des avancées majeures dans le monde
académique pour
identifier un visage malgré les
changements de luminosité l'occlusion et
les situations extrêmes il y a aussi eu
la création de Data 7 gigantesque comme
labeldfest in the wild ou MS célèbre am
qui contiennent plus de 10 millions de
photos labellisées et enfin et ce n'est
pas négligeable on a assisté à une
amélioration phénoménale de la puissance
de calcul des GPU et à l'apparition de
puces qui sont conçus spécifiquement
pour le machine learning tellement que
en tenant compte des nombreux
améliorations logicielles qui ont aussi
eu lieu le coût d'entraînement des IA
diminue actuellement 50 fois plus
rapidement que la loi de Moore les
services américains prochent du
gouvernement restent encore probablement
les plus performants notamment le
terrifiant clear view hayai qui aurait
plus de 3 milliards de photos dans sa
base de données base de données qui leur
a valu une amende de 20 millions d'euros
pour violation du rgpd il y a quelques
mois mais qui sert probablement
actuellement à décorer le bureau du CIO
étant donné qu'ils ont ni client ni
structure juridique en Europe cependant
beaucoup d'autres services se sont
développés en parallèle qui sont eux
extrêmement faciles d'accès et donne à
n'importe qui comme vous et moi des
outils comparables au plus grandes
agences d'espionnage et vous allez voir
c'est probablement encore plus
terrifiant en fait le plus connu de ces
nouveaux moteurs de recherche de visage
s'appelle pimize pour picture matching
eyes il est écrit en 2017 par deux
polonais alors étudiant en informatique
malgré la jeunesse du projet et de leur
créateurs ils obtiennent très vite des
résultats impressionnants pourtant ils
ont pas d'accès privilégié à des bases
de données biométriques du gouvernement
leur secret ils ont compris que pour
constituer une base de données
monumentales de visage il suffisait de
se pencher et d'utiliser les mêmes
outils que les moteurs de recherche pour
scanner constamment internet et les
réseaux sociaux que leur robot crawler
croise ce qui ressemble à un visage sur
une photo il analyse et stocke
l'empreinte mathématique dans ton parler
tout à l'heure ces robots sont tellement
partout que si vous avez un site il est
fort probable que vous puissiez les voir
passer régulièrement dans vos logs
l'outil est déconcertant de faciliter
vous glissez une photo il l'analyse et
il vous donne l'ensemble des URL sur
lesquels un visage similaire a été
détecté alors il y a parfois des faux
positifs et il y a pas tant de résultats
que ça qui viennent des réseaux sociaux
mais franchement la première fois que
vous l'essayez c'est terrifiant il m'a
ressorti des dossiers dont je ne
connaissais même pas l'existence
et si on lui fournit l'image de notre
mystérieux vendeur bingo
joie juste pour avoir retrouvé un vieux
skyblog d'un inconnu ça vous paraît un
peu disproportionné mais si on y
réfléchit une seconde c'est quand même
complètement fou ce skyblog random ne
contient que des photos et des blacks
gênants on y trouve aucun nom de famille
aucun élément distinctif pour faire des
corrélations la seule chose qui a permis
de le retrouver c'est une photo un peu
floue et pas bien cadrée sur laquelle
son visage apparaît point barre il est
absolument impossible de trouver cet
endroit avec Google ce qui fait que
selon toute probabilité son auteur
lui-même a complètement oublié son
existence on peut donc en déduire deux
choses déjà si nous on peut faire ça
avec des images d'Internet imaginez la
gueule des outils actuels des
gouvernements avec toutes les données
supplémentaires qui peuvent obtenir
ensuite il faut se rendre à l'évidence
on peut plus considérer qu'on évolue
encore dans l'Internet d'avant le temps
ou un simple pseudo vous garantissez
d’être à peu près tranquille et
définitivement révolue et si vous pensez
qu'il s'agit simplement d'une histoire
de faire attention aux photos que vous
publiez sachez que ça va en fait bien
plus loin que ça est-ce que vous avez
déjà entendu parler de Andrès Viola
c'est un pédocrinel Argentin dont
l'arrestation est particulièrement
fascinante et donne un goût très réel à
ces histoires de science-fiction en 2019
le FBI investige sur son cas ils n'ont
comme élément d'enquête que quelques
images trouvées sur le Dark web montrant
une enfant victime d'abus sexuel la base
de données du FBI ne donne rien de ses
photos mais l'enquêteur à l'idée
d'utiliser clear view hayai et il
obtient un résultat est-ce que son
permis de conduire a été scanné quelque
part est-ce qu'il a eu la mauvaise idée
de mettre sa tête sur les réseaux
sociaux et ben même pas c'est un couple
de sportif qui a posté un selfie dans
une salle de sport près de Las Vegas et
ils l'ont pris par mégarde en
arrière-plan un pur hasard le FBI se
rend sur place et réalise que il s'agit
bien du bon gars il remonte le fil via
son facebook et l’arrête à mon avis il a
dû être bien surpris surpris car il n'y
a pas eu besoin qu'il fasse d'erreur pas
eu besoin qui soit filmé par des caméras
de surveillance ou contrôlés par la
police il a juste été attrapé par l'une
des milliards de petites caméras qui
aujourd'hui film diffuse tout le temps
et partout et du coup la raison pour
laquelle cette vidéo va très
probablement être scrutée par la
préfecture de police c'est que suite à
notre première vidéo sur les disques
durs on s'est pris un petit coup de
pression par le propriétaire du disque
dur qu'on avait acheté en fait vu que
nous on avait tout flouté à fond on
s'était pas imaginé une seconde que ça
pouvait poser problème mais à mon avis
quand il a réalisé que il avait des
données clients dans la nature il a eu
un petit coup de stress et
préventivement il a instantanément
escaladé le truc du coup j'ai eu un
petit coup de fil de la police voilà pas
extrêmement rassurant au final il y aura
pas de problème
et c'est pas très utile parce que
évidemment on détruit toujours les
données qu'on trouve pour finir je vous
propose de prendre une habitude très
simple après cette vidéo grâce à une
fonction très peu connue de protons qui
s'appelle simple login on a parlé de
traçage par visage mais en réalité avant
ça il y a quelque chose d'encore plus
dévastateur c'est le traçage par email
le fait d'avoir un mail un identifiant
unique que vous utilisez partout c'est
le meilleur moyen pour les Data brokers
de vous pister à la trace et de faire
des corrélations d'ailleurs c'est
souvent comme ça que les cybercriminels
se font démasquer avec simple login vous
pouvez inventer une adresse mail genre
n'importe quand qui sera valide c'est un
peu comme le proxy Apple mais encore
plus puissant et moins fermé évidemment
il y a une variante qui consiste à
mettre plus quelque chose à la fin de
son mail mais ça marche pas tout le coup
je vous laisse voir ça dans la
description et nous on se dit à très
bientôt
[Musique]
Browse More Related Video
Partage privé ou public sur Internet : une frontière floue
CEJM - Th4 Chap3 : Le numérique dans l'entreprise et la protection des personnes
Les clés pour réviser intelligemment et passer moins de temps à étudier
Skills-Based Organization: What Works, And Twitter vs. Threads
On parle de pornographie
L'UNIQUE vidéo à voir pour VENDRE SUR AMAZON en 2024 !
5.0 / 5 (0 votes)