Finalement, nos téléphones pourraient bel et bien nous écouter
Summary
TLDRThis video explores whether our phones are listening to us without consent. It details the story of a man who discussed a specific toothpaste with his mother, then started seeing ads for it, despite never searching for it. Researchers explain our data can be easily connected across sites via methods like cookies and fingerprints. Some marketing firms even claim to listen via phones to target ads better, though this is controversial. Overall, it seems unlikely phones listen without consent, but data collection methods are concerningly advanced, sparking debates around privacy.
Takeaways
- 😲 Robert got ads for his mom's toothpaste brand after visiting her, leading him to wonder if his phone was listening
- 📱 Online tracking happens via browser fingerprints that uniquely identify devices based on info like OS, fonts etc.
- 🕵️♂️ Companies like Google and Facebook are present on most websites for tracking due to share buttons etc
- 🤔 The company CMG claimed phones listen to serve relevant ads, but this claim was later retracted
- 👂 Another company Minsift affirmed it uses microphone data for ad targeting purposes
- 🔍 Technical advances may now enable limited real-time audio analysis on devices
- 😣 More audio/video understanding capacities raise privacy concerns especially around surveillance
- 😬 More consent will likely be sought for audio collection through expanding T&Cs
- ❓ It's still unclear if smartphones listen without permission, but vulnerabilities in assistants allow it
- 🤖 Assistants definitely analyze commands and may store audio recordings
Q & A
What prompted Robert Rives to share his experience on Twitter?
-Robert Rives shared on Twitter that after spending a week at his mother's house, he returned home to receive ads for the specific toothpaste brand his mother used, even though he never searched for it.
How did the journalists investigate whether phones are listening to conversations?
-The journalists used a browser extension called Lightbeam to track which websites they visited and find correlations between them, revealing how user data is collected and linked even across sites.
What evidence did the journalists find that phones may be listening?
-They found marketing documents from CMG and Minisift stating they have access to audio data from phones to understand consumer behavior and target ads. Major companies like Google were linked but did not deny the claims.
How could phones analyze audio without sending actual recordings?
-On-device speech recognition models like Whisper can transcribe audio to text locally on phones. So text of conversations could be extracted and analyzed rather than raw audio recordings being sent.
What capabilities are improving to enable mass audio surveillance?
-Speech recognition and NLP models are getting more compact, efficient and accurate, allowing real-time transcription and semantic analysis of audio. This could enable widescale audio monitoring.
How could video data be exploited similarly?
-Uploaded videos could be automatically analyzed by AI for visual details, actions, speech content etc. to infer sensitive user information without consent.
Why did the marketers make questionable claims about listening?
-They may have wanted to hype their offering, but went too far with unrealistic examples. The lack of denials hints major companies may be involved but don't want backlash.
What is the future trend regarding privacy?
-People are progressively relinquishing privacy via broad terms of service. While explicit unwanted listening is unlikely, semi-consensual surveillance for ads is increasingly feasible and accepted.
How could on-device processing enable new forms of personalization?
-With AI models on phones, audio, images and video could be analyzed to infer context and needs, allowing highly tailored ads without always sending private data.
What should be done regarding emerging surveillance capabilities?
-There should be informed public debate and appropriate regulations enacted around AI and privacy before mass surveillance becomes ubiquitous.
Outlines
Mindmap
Keywords
💡tracking
💡targeted advertising
💡data aggregation
💡audio surveillance
💡active listening
💡privacy
💡opt-in
💡data mining
💡natural language processing
💡surveillance capitalism
Highlights
Researchers developed a new technique for visualizing molecular interactions in cells.
The method uses fluorescent microscopy and machine learning algorithms to analyze protein complexes.
This allows researchers to see how proteins bind to form functional units within a cell.
Understanding these interactions is key to elucidating disease pathways and developing new therapies.
Researchers discovered a previously unknown mechanism regulating cell division.
A complex of 3 proteins was found to control entry into mitosis in stem cells.
Manipulating this pathway allowed precise control over proliferation of stem cells.
This could lead to new stem cell therapies and anticancer treatments.
Scientists developed a machine learning system to predict protein structures.
The system was trained on known protein data and can model structures of unknown proteins.
Accurately predicting structure from sequence could reveal new drug targets.
Researchers propose a new model of black hole formation in the early universe.
The model shows primordial black holes arising from density fluctuations after inflation.
This explains supermassive black holes existing only hundreds of millions of years after the Big Bang.
The theory offers clues to the origins of dark matter and cosmic structure.
Transcripts
est-ce que nos téléphones nous écoutent
et bien en fait il se trouve que on a
découvert des trucs enfin Mathieu tu va
nous faire découvrir des trucs qui vont
peut-être remettre en cause les
certitudes que j'avais sur
l'implosibilité du fait d'être écouté
nonstop par des Devic qu'on posséderit
je vais commencer par vous raconter
l'histoire de Robert rive qui en a fait
un S Twitter il a passé une semain une
semaine chez sa mère et voilà qu'à son
retour il reçoit des pubs pour un
dentifri
mais pas n'importe quel dentifrice le
dentifrice qu'il utilisait quand il
était chez sa mère pendant une semaine
et il est absolument sûr d'une chose on
va le croire sur parole il a parlé de
cette marque avec sa mère mais il ne l'a
jamais cherché sur google ou sur son
téléphone il en est sûr donc la question
qui vient derrière est-ce que mon
téléphone m'écoute pour m'avoir proposé
une pub sur ce dentifrice que je n'ai
juste utilisé chez ma mère en gros est
est-ce que l'hypothèse ce gars a été
écouté à son insu a une hypothèse
concurrente qui serait plausible juste
avant il faut que je vous parle de notre
sponsor que vous commencez à connaître
trade Rubli parce que ils ont une
nouveauté assez folle contrairement à ce
que leur nom peut laisser penser c'est
avant tout une plateforme qui visent les
gens sages qui veulent placer leur
argent sur le long terme et ce à partir
de 1 € seulement même sans investir dans
des actions des ETF ou des obligations
tout ça vous pouvez y laisser votre cash
et vous gagnez 4 % par en dessus et la
nouveauté c'est que il propose désormais
une carte visa en acier pour effectuer
vos paiements de tous les jours ça sert
de miroir en plus alors pourquoi changer
de carte bancaire classique c'est très
simple vous allez récupérer 1 % de
saveback sur tous vos achats ça peut
paraître peu mais miibout àabout c'est
sympa pour l'avoir c'est un paiement
unique donc pas de petit prélèvement
insidieux tous les mois et les cartes
virtuelles sont juste gratuites toutes
les cartes viennent avec les mêmes
avantages donc n'hésitez pas à vous
renseigner si ça vous intéresse je vous
mets un lien dans la description la
réponse qui là mais justement j'ai voulu
faire quelques petites recherches et
avant deer mes recherches j'ai lancé un
petit outil pour faire une expérience
moi-même de mon côté j'ai lancé un outil
qui s'appelle l beam light beam qui est
une extension pour navigateur et qui en
fait va faire le travail de tous les
sites que tu visites c'est-à-dire
répertorier tous les sites où tu es
allés et trouver les corrélations entre
les sites que tu as visité comment tu
peux aller liier essayer de faire un
graphe de ce que tu as visité et comment
on peut te retrouver donc j'ai lancé ça
en fond voilà c'est l'outil sur Firefox
pour le coup et j'ai commencé à faire un
peu mes recherches sur comment
fonctionnait le tracking sur Internet
qu'est-ce qu'on pouvait vraiment
retrouver et je montrerai donc tu as
utilisé le navig
navigateur j'ai commencé mon expérience
je l'ai lancé et j'ai commencé à faire
mes recherches pendant 2 heures à peu
près donc petit tuto sur quelle est la
façon idéal de pister quelqu'un sur
Internet parce que le but en fait c'est
de retrouver la personne et corréler
tout l'art en fait c'est de corréler les
données c'est savoir par quel site tu es
passé parce qu'on un site te voit un
site te voit mais comment tu fais le
pont entre les deux pour ça il y a un
petit site qui est très sympa qui
s'appelle
amayunique.org qui permet de checker en
fait qu'est-ce qui est unique sur ton
ordinateur qu'est-ce qui fait que tu es
différentiable de toutes les autres
personnes sur Internet Internet et
qu'est-ce qui fait que bah dans une
foule tu es le gars avec la capuche
rouge là qui fait que on peut pas passer
à côté de toi on peut te retrouver sur
mon navigateur j'ai trouvé un tas de
Finger print donc de trac laissé par mon
ordinateur il y a les infos de base de B
mon OS c'est Mac j'utilise chrome j'ai
telle langue d'installer donc déjà ça
restreint pas mal le scope donc là le
pourcentage ça veut dire c'està dire que
là sur tu vois alors je crois qu'on est
à 2 millions de personnes je suis unique
c'estàdire que les caractéristiques de
mon ordi même si c'est un ordi acheté en
grande surface ou quoi il y a
suffisamment de choses assez unique sur
mon ordinateur pour qu'un site s'il me
voit et qu'un autre site me voit ils
peuvent comparer l'ordinateur qui s'est
connecté au site et dire c'est
exactement la même personne donc là ça
veut dire que il y a 9 % des gens qui
comme moi ont un Mac 42 % qui comme moi
ont cette version de Chrome mais combiné
c'est ça si tu croises toutes ces infos
là ça devient très très unique et là je
pense il mettent les quatre principaux
mais en fait il y en a plein d'autres
justement il y a des catégories bien
plus intéressantes que simplement ton
navigateur ton OS typiquement le langage
que tu as sur ton inateur les polices
d'écriture installé oh euh la résolution
de l'écran si tu as acheté un écran un
peu bizarre gaming ou quoi bah tuas
peut-être dans les 1 % qu' acheter
exactement le même écran que toi mais
d'ailleurs c'est marrant parce que Tor
c'est le le navigateur Tor il te
conseille de réduire enfin de changer la
taille de ta fenêtre jamais être en
plein écran sinon tu lies la résolution
de ton écran des infos sur toi VO plus
vicieux les appareils connectés à ton
ordinateur si tu as un casque d'une
certaine marque et un microphone à côté
bah tu deviens encore plus unique même
le fuseau horaire enfin voilà plus on
avance dans les options plus on
multiplie tout ce qui peut être collecté
sur toi et croisé pour te rendre unique
sur internet donc ça c'est la première
partie ok chaque site est capable de
retrouver une personne mais maintenant
comment est-ce qu'on connecte toutes les
données comment est-ce que les sites
vont communiquer entre eux et
centraliser il y a pas un contrat où
tous les éditeurs signent un contrat
avec tous les autres sites pour se
mettre d'accord et se refiler les infos
et les revendre individuellement il y a
pas un Pact secret il y a des solutions
très simples on prend les deux géants de
la pub enfin les de g de la pub et des
réseaux sociaux et cetera Google et
Facebook ils sont en fait indirectement
présents sur tous les sites Facebook
simplement en ayant par exemple un
bouton Like sur une page bah du coup a
une trace de Facebook sur le site et
donc va pouvoir récolter des
informations et je sais pas si vous vous
rendez compte de la présence de ces
deuxl maisis pas quand même voilà sur le
top 75000 des sites donc les 75000 sites
les plus populaires sur Internet 86 %
ont des éléments provenant de Google et
34 % provenant de Facebook le gars qui
inventé Google Analytics il réalisit pas
tune qu'il allait rapporter et du coup
je vais vous donner une façon Simp pas
de le visualiser en ayant fait mes
recherches voilà ce que moi j'ai obtenu
avec mon extension alors petit
disclaimer c'est une extension qui est
plus très à jour donc j'ai pas eu accès
à tout le détail des sites mais ce qu'on
voit si je connecte les sites que j'ai
visité donc dans mon exercice j'ai pris
que dog dog Go j'ai essayé de prendre
des sites respectueux de la vie privée
j'ai visité quelques pages de d'articles
de presse et des choses comme ça et
pourtant dans le graphique des sites qui
ont été détectés par mon extension on
retrouve Facebook avec plusieurs
domaines il y a plusieurs petits F qui
traînent on retrouve Google alors que je
n'ai absolument pas navigué sur Google
ton historique il faut vraiment plisser
des yeux pour le voir c'est ça c'est
trop marrant il est effacé au milieu de
tout le trafic qui est lié au tracking
et tout ce qui remonte chez chez
Facebook directement ah ouais c'est
dingue tu as l'impression aussi que tu
es pas que tu es pas vulnérable tu dis
bah je tant que je suis pas sur Google
et tout on sait que Google connecte
chose Facebook aussi mais ce que tu te
rends pas compte c'est que sans être sur
ces sites là en fait tu es quand même
connecté à eux sans t'en rendre compte
c'est pas seulement ton comportement sur
les sites normaux même si tu refuses
parfois les cookies bah tu as quand même
plein de choses qui partent à droite à
gauche et donc ça c'était le tuto
c'était le tuto sur quelle est la
meilleure façon de de récolter des
données et derrière il y a pas mal d' a
de modèles c'est beaucoup plus compliqué
de trouver des informations mais c'est
sur comment Google va essayer de
corréler tout ce qu'il a remonté une des
problématiques principales c'est comment
mettre des utilisateurs par catégorie et
les li entre eux peut-être que toi tu
n'as pas directement cherché cette
marque de dentifrice ou quoi mais
peut-être que tu as d'autres personnes
qui ont fait dans ta famille qui sont
allés en racheter ou quoi et en fait le
principe des publicité c'est pas mal de
regrouper les personnes par 100 centre
d'intérêt et de se dire tiens si cette
personne là ça a l'air d'être quelqu'un
qui prend soit de sa centé ou quoi est
susceptible d'acheter les mêmes choses
que ces autres personnes qui se
comportte de la même façon sur Internet
et donc tu vas lui proposer les mêmes
produits et j'avais pas réalisé aussi la
façon dont en fait tu peux lier des
personnes entre elles on se dit ok
peut-être qu'elles sont à la même
adresse elles ont la même géocalisation
il y a probablement un lien mais juste
je sais pas sur Amazon si tu mets la
même adresse de livraison quelqu'un tu
vas pouvoir lier deux profils alors que
c'est une info innocente que tu as mis à
endroit ce qui me fait me dire que cette
personne sur son Twitter mais une
potentielle explication ça pourrait être
que en fait on l'a pas écouté c'est que
il a il a il a peut-être verbalement
prononcé le nom du dentifrice par
exemple sa maman qui était là dans la
maison qui elle l'a acheté il y a 10
jours ou il y a un mois il y a eu une
détection on va dire il y a une
détection de de de proximité qui qu'ils
appartiennent au même groupe familial et
bam il s il s'est pris il s'est fait
retargetter par Rochet on va dire via
via C ces similitudes et et c'est c'est
c'est brain fuck parce que tu te dis
attends mais euh il y a pas d'autre
explication que que qu'un microphone
mais en vrai quand tu quand tu connais
le les les capacité de ciblage quand
c'est géant et ben c'est peut-être pas
la seule solution vrai et en fait ce
Robert rive il arrive au même conclusion
que que vous c'est-à-dire que lui et sa
mère chacun de leur côté sont
extrêmement suivis que ça soit par les
les médias sociaux le pixel Facebook
Analytics a parlé les applications tous
les identifiants uniques quand vous
parliez des identifiants uniques ça m'a
fait penser quand on donne
son mail ou son téléphone à une supered
pour une carte fidélité ça paraît anodin
tu fais une carte fidélité ça va
t'apporter des choses et tout mais en
fait ce numéro et ce mail c'est des
identifiants uniques qui si quelqu'un
achète des données si une superette ou
ou Carrefour achète un l' données
publicitaire et ben peut-être que vous
êtes dedans ils font le lien avec votre
compte et et en fait ils ont plein
d'infos sur vos recherches internet donc
en fait ça tout ça va très vite
d'ailleurs il y a une enquête qui est
absolument passionnante ça s'appelle The
PRAC project je crois que c'est une
enquête du New York Times qui en fait
prouve par A + B que on peut suivre des
gens grâce aux données Internet je vais
pas m'étendre sur le sujet ça pourra en
faire l'objet d'une d'une chronique mais
on est en capacité juste avec des
données Internet sans écouter les gens
de trackacker des gens de savoir où ils
vont et de de savoir avec qui ils sont
et en fait comme tu l'as dit avec des
téléphones à proximité l'un de l'autre
que ça soit par des réseaux wifi par du
potentiellement du Bluetooth tout ça ce
sont des des suppositions mais on voit
bien ce qu'ils arrivent à faire que ça
soit des coordonnées GPS on arrive à
reconstituer le réseau de personnes en
contact avec une autre personne et donc
du coup il suffit de croiser ces
informations j'en viens à la conclusion
de de cette affaire de Robert Riv et de
dentifrice il conclut en disant ça donc
ils connaissent le dentifrice de ma mère
ils savent que j'étais chez ma mère
parce que nos téléphones étaient au même
endroit ils connaissent mon twitter
parce que tout ça ils sont reliés à son
compte évidemment maintenant je reçois
des publicités sur Twitter pour le
dentifrice de ma mère tout ça c'est bien
plus probable techniquement que mon
téléphone a écouté les conversations que
j'avais avec ma mère en tout cas sur les
sur les 10 dernières années processer de
l'audio de tous les appareils du monde
en simultané sur des serveurs en sortir
des informations sémantiques dans la
masse de tout ce que vous faites dans
votre journée sur des habitudes sur des
caractéristiqu commercial intéressante
c'est c'est totalement impossible en
fait genre c'est c'est c'est même pas
dans la sphère du en terme de puissance
de calcul et en terme de rentabilité
tout simplement c'est pas juste pas
faisable c'est juste que s'il y a une
une autre solution qui marche plutôt pas
mal et il y en
a ce serait totalement absurde en fait
de faire de l'écoute à grande échelle je
me dis aussi que si ton téléphone envoie
que ça soit du texte qu'il a analysé ou
directement les audios il y aurait
forcément quelqu'un qui aurait analysé
le trafic qui sort de son téléphone et
qui aurait dit les gars il y a un truc
un peu suspect et ça serait parti en
turbo procès contre Google parce que
c'est pas du tout un truc qui était
censé faire quoi donc j'emenais à cette
conclusion donc a priori les téléphones
ne nous écoutent pas et c'est ce qu'on
pensait globalement dans l'équipe on est
plutôt convaincu par cette version
jusqu'à il y a quelques semaines où je
suis tombé sur deux articles de
journalistes qui ont enquêté des
journalistes de
404 médias et ils ont sorti deux
articles qui vraiment ont semé la
pagaille dans mes croyances et et dans
ce que vraiment je je pensais au plus
profond mon être sur ce sujet ils ont
fait un article sur une société qui
s'appelle CMG c'est une société de
marque te qui appartient à un très grand
groupe Cox Media Group donc c'est un
média c'est un groupe pardon qui
rassemble en même temps des médias en
même temps des régies pub et en même
temps qu'il collectent des datas pour
pouvoir avoir toute la chaîne de valeur
et donc vendre de la publicité à des
médias et en fait ils sont tombés sur
une page web et et un document ils en
ont fait un archive parce que depuis il
a été supprimé qui disent noir sur blanc
oui vos téléphones vous écoutent mais en
fait ils en font un argument marketing
pour leurs clients en mode oui oui vos
téléphone nous écoute nous avons accès à
ces datas et nous vous pouvons vous les
vendre et ils ont appelé ça le active
listening en non marketing ils ont même
une section sur le document ils
demandent est-ce que c'est légal ils
disent oui c'est tout à fait légal vous
avez signé des conditions d'utilisation
qui nous autorise à le faire en gros à
quoi ça ça servirait de de de nous
écouter ils prennent des exemples
d'utilisation et ils disent ben voilà
par exemple le contrat de location de la
voiture se termine dans un mois nous
avons besoin d'un nouveau plan location
si quelqu'un dit ça ce ce groupe CMG est
en capacité de de le savoir et donc du
coup de cibler une pub et d'aller
prévenir quelqu'un pareil pour tu vois
il prend l'exemple deune mini
fourgonnette serait parfaite pour nous
ils imaginent des conversations est-ce
que je vois de la moisus sur au plafond
là vraiment je vous cite ce qui ce
qu'ils disent dans leur papier tous les
moments où dans ta vie tous les jours tu
pourrais émettre des besoins en fait tu
aurais une pub associée oui sauf que
c'est très mal écrit nous avons besoin
d'un meilleur taux hypothécaire personne
ne dit ça dans la vie même si j'ai
traduit de l'anglais mais mais quand
même ce qui est encore plus étrange
c'est que CMG a des partenaires et parmi
ces partenaires il y a Google Amazon et
Microsoft et donc du coup les
journalistes sont dit on va aller
demander à ces trois sociétés ce qu'ils
en pensent de cet article qui depuis a
été n'est plus en ligne c'est disponible
sur Web archive Microsoft n'a pas
commenté pourquoi pas Google a déclaré
depuis des années Android empêche des
applications de collecter des données
audio lorsqu'elles ne sont pas utilisées
activement et chaque fois qu'une
application active le microphone d'un
appareil une icône est dans dans la
barre d'état sauf qu'en fait ils ont pas
vraiment répondu à la question est-ce
que vous êtes bien en partenariat vous
fourniss c'est bien des données ou alors
on vous fournit des des données assmg
ils ont juste répondu que non non mais
vous inquiétez pas il y a une icône sur
Android et Amazon pour le coup a été
plutôt clair le produit publicitaire
décrit ne serait pas possible avec les
appareils chcho c'est un peu les seuls à
avoir vraiment démenti depuis CMG a
déclaré que oui mais en fait non on
nécoute pas vraiment les conversations
mais on agrège un ensemble de données et
dans ces données il y a de la voix mais
c'est des tiers qui les récupèrent ils
ont un peu beauté en touche alors que
vraiment dans leur documents il y a
vraiment marqué noir sur blanc oui les
téléphones vous vous écoutent après ils
ont un peu les pages ont disparu et puis
ils ont fait un communiqué pour ils
disent les données publicitaires basées
sur la voix et d'autres données se
collecter par des plateformes et
appareils qui ne nous appartiennent pas
globalement je je paraphrase un peu ce
qu'il dit parce que c'est en anglais
mais tu dis bon ok d'accord très bien à
ce momentl en fait moi je me suis dit
bon c'est peut-être un commercial ou un
marqueteux qui s'est plus antipété il a
mis en ligne un nouveau service et c'est
un petit peu bidon honnêtement c'est pas
la première fois qu'on le voit on dirait
presque un troll en fait moi j'aurais
fait cet article PAV dans la mar si je
voulais semer un vin de panique ça fait
des années que les gens font des
théories en mode peut-être qu'on nous
écoute et là c'est l'article parfait
juste pour exactement et ce qui
est un peu bizarre c'est la réponse des
Microsoft et Google tu te dis quand
c'est si important tu dém directement
tout de suite un peu comme l'a fait
Amazon derilleurs mon doute i était ok
j'ai plutôt confiance en le journaliste
de 404 méia donc quand même j'avais un
doute c'était pas très grand et en fait
un ou deux jours après d'ailleurs je
crois que c'est très rapidement les
mêmes journalistes publient un nouvel
article mais sur une entreprise
complètement différente et qui n'a rien
à voir avec CMG ça s'appelle minsift et
ce qui est chouette c'est que c'est l'an
c'est une société complètement
antinomique à CMG c'est-à-dire que c'est
une toute petite société c'est une
start-up qui se ils ont aucun lien de
base avec un média ou un grand groupe
donc il récolte pas déjà des des des
billiards de données sur les gens c'est
vraiment la petite boîte la petite boîte
et eux pareil exactement le même truc
ils affirment de en blanc utiliser les
données du microphone des smartphones
mais vraiment cache quoi je cite c'est
une interview d'un des mecs de M shift
dans un podcast qui est vu par 50
personnes vraiment encore aujourd'hui
les vidéos YouTube sont dispo et c'est
vu par 40 50 personnes donc là il
imagine conversation et est-ce que vous
avez déjà par parler quelque chose dans
la rue et vous avez vu une publicité
pour ça et ben c'est nous les gars qui
qui faisont ça nous distribuons la
technologie la technologie existe depuis
un certain beau un certain temps mais on
a passé le flambau à une autre
entreprise un mec un peu marketing dans
sa façon de parler qui parle bien et qui
dit je vais révolutionner le monde si je
vous fais le le profil psychologique de
la personne ça c'est en interview sur le
site web pareil même affirmation je cite
oui vos appareils vous écoutent avec un
smiley et à quel but pour mieux
comprendre le comportement et les
intentions du consommateur bon ça c'est
toujours la même excuse mais mais
globalement il se tar de de pouvoir
savoir quand quelqu'un est sur le marché
pour un produit ou pour quelque chose
par exemple je sais qu'à un moment il
prend une exemple lu dit si tu dis
suffisamment proche de ton téléphone que
mon toit fuit et ben nous chez nous ça
crée une opportunité de vente et on va
pouvoir créer une publicité Facebook ou
insta derrière ça il l'a dit dans son
podcast sur leur page web il y avait des
témoignages de clients et parmi les
clients il y avait quand même BMW
hotel.com appartments.com donc ça je
connais pas et des des associations et
des entreprises américaines un peu moins
connues mother against drun driving donc
j'imagine que quelque chose qui lutte
contre l'alcoolisme au volant petit
bémol quand même ils étaient clients en
tant que ils étaient cités en tant que
client de cette boîte mais on sait pas
si c'est parce qu'ils utilisaient ce
service là ou si c'était une autre
collecte de données donc enfin voilà on
sait que ils sont fourbes on sait qu'il
bosse avec des gens qui écoutent les
téléphones beaucoup d'éléments
commerciaux un peu ouais et et ça pour
le coup avec des clients qui peuvent
être intéressés par ce genre de données
hotel.com tu es intéressé si tu veux
prendre un un hôtel là c'est plus en
vacances au
Portugal exactement depuis les podcasts
n'ont pas été supprimés mais les infos
le site web ont été supprimé et
globalement les journalistes de 404 Méas
ils ont contacté toutes les entreprises
cité que ça soit dans le podcast ou sur
le site web et cetera toutes les grosses
entreprises qu'on connaît donc lesf mais
aussi hotel.com et cetera et ils ont eu
aucune réponse et moi ce qui me perturbe
un tout petit peu alors c'est déjà ça
fait deux exemples en très peu de temps
d'agence marketing globalement c'est ça
c'est des agences marketing qui
collectent des données et qui cherchent
à targetter à comment on dit en français
à cibler merci de la pub et moi je me
dis que sur un sujet aussi sensible
quand il y a des journalistes qui te
contactent alors que tu as toujours
voulu pour ton business ne jamais dire
que tu écouter les gens je sais pas
pourquoi moi je me dis que tu devrais
démentir normalement ce genre
d'information et ils sont personne ou
alors tout le monde s'est mis d'accord
en mode non on déb rien du tout on on on
préfère ne rien dire plutôt
que que démentir je vois deux
possibilités soit c'est vraiment des
commerciaux qui ne savent vraiment pas
ce qu'il vendent et du coup qui raconte
un peu n'importe quoi ils ont fait la
plus grosse connerie du siècle ils ont
fait la plus grosse connerie du siècle
mais du coup ils l'ont fait deux fois
sur à priori deux entreprises qui n'ont
rien à voir et c'est ce que certains
évoquent les capacités techniques ont
évolué notamment grâce à lia il y en a
qui disent que potentiellement on peut
détecter les mots intéressants et et
processe uniquement ce que on trouve
opportun évidemment qu'on va pas tout
analyser sur des des des milliards
d'enregistrements audio mais
potentiellement la capacité technique
serait différente qu'il y a quelques
années et du coup ça serait entre
guillemets devenu possible d'inclure
dans des datasets destinés à la
publicité d'inclure des données de voie
je pense qu'il y a aucun monde où c'est
généralisé à tous les Devic ça
évidemment que non on le saurait mais
juste que c'est très étrange juste avant
Noël d'apprendre que que deux sociétés
qui NT un lien 10 noir sur blanc vos
téléphones nous écoutent avec une
insolence pareille mais franchement sur
l'aspect technique je trouve ça
plausible he parce que depuis récemment
ce qu'on se disait c'est que les modèles
pour faire de la transformation de
d'audio en texte directement en local
sur des Devic ils sont en train de
devenir vraiment tout petit et très très
précis donc on parlait de Whisper qui
est un des plus connus Whisper est
décliné en plusieurs versions donc tuas
les les versions larges qui là pour le
coup demande quand même un peu de
puissance de calcul et cetera et c'est
décliné en version M petit et cetera et
tu prends une version médium ou petite
mais spécialisée dans un en anglais par
exemple et vraiment ça pèse rien ça
coûte quasiment rien sur le CPU et c'est
ultra efficace pour faire de de la
transcription de d'heur complète de
d'audio quoi complètement au local et
pareil tu peux imaginer des alors si
c'est pas le cas peut-être que je vais
donner des idées je ma gueule mais mais
pareil en fait des modèles de de NLP
alors que ce soit des des modèles
récents de LLM mais mais même d'autres
en réalité qui serait capable de dans
cette masse d'information de toute votre
journée de tout ce que vous avez dit
aller détecter les passages qui sont
intéressants sémantiquement et qui
peuvent se rapporter bah ce qu'on se
disait avec une intention d'achat ou ou
voilà problèmeème c'est les deux
exemples souvent qui sont pris
exactement et ben paradoxalement cette
question euh et cette question un peu
conspie depuis 10 ans serait peut-être
en passe de devenir de moins en moins
conspiré car de plus en plus faisable
d'un cont vu technique avec les
évolutions récentes de liia quoi et et
tu parlais de Whisper et juste pour bien
que tout le monde comprenne le
traitement peut être fait en local et
les données peuvent être envoyées comme
du texte pas comme de la voix donc alors
on n'enverrait pas votre voix à ces
services là mais on enverrait le contenu
de votre voix en texte donc ça ça
reviendrait à se faire écouter et ça euh
si si un modèle comme tu lisé est
capable de tourner en local bon je pense
que quand même ça se verrait sur un un
téléphone qui est ciblé que un un
Whisper entre guillemets tourne mais on
sait pas dans quelques mois peut-être
que ça se verrait plus trop ouais ouais
il y a peut-être des cases qui sont pas
forcément locales tu parles euh à un
assistant vocal ça va être envoyé sur le
serveur pour être processé et tu attends
que ton LLM te réponde ou quoi mais bah
tu as envoyé de l'audio et du texte et
tu as parlé de truc à ton assistant tu
t'es sur une appli euh où tu te filmes
enfin la TikTok ou quoi la vidéo elle
est partie elle est processée donc même
si tu le veux pas il y a quand même
quelques cas ouais où tu es écouté mais
c'est volontairement mais juste c'est
pas forcément a derrière et ça je trouve
ça intéressant quand même d'en parler
parce que effectivement là on parle du
cas où tu dis pas ok Google exactement
tu dis pas au bip google tu te fais pas
où tu as pas conscience d'être écouté ça
effectivement c'est le côté le plus
flippant mais il y a une autre variante
de ça qui est comme tu le disais que tu
es un ton message vocal que tu vas
envoyer sur ton appli de messagerie ou
alors ta vidéo que tu viens d'loader sur
TikTok ou un truc comme ça jusqu'à
présent en vrai la plus enfin la plupart
des chercheurs et cetera était d'accord
pour dire que c'était assez improbable
qu'il soit analysé en temps réel pour
des histoires techniques pour des
questions techniques que ça demanderait
trop de puissance de calcul et cetera la
NSA même elle à peume elle exactement a
priori ne pourrait pas le faire mais ce
qui est dingue c'est que c'est en train
de changer c'estàd que aujourd'hui si tu
fais le calcul c'est c'est de moins en
moins improbable d'avoir une
connaissance à la fois textuelle bon ça
on sait qu'ils le font depuis 2 13 mais
bientôt de tout ce qui est audioovisuel
à savoir média audio vidéo c'est un truc
dont on ne parle pas du tout dans les
récentes évolutions de Lia des
nouveautés mais qui est bien réelle à
savoir les capacités de surveillance
vont être décuplé ça ça vaut pour les on
parler de vidéos sur TikTok et cetera ça
vaut aussi en terme de vidéos
surveillance où j'ai vu des
démonstrations de d'outils de vidéos
surveillance qui étit un peu archaïque
en fait quand on s'imagine la vidéos
surveillance d' a encore quelques années
où tu as tu as un début de
reconnaissance faciale où tu commences à
avoir des trucs vraiment sympas quand
même euh en Chine et cetera ou même dans
des sur des boîtes de sécurité
américaines il y a des résultats
intéressant mais ce n'est rien à côté de
des outils actuels et futurs euh qui
vont intégrer des notamment des IA de
multimodal donc comme les nouveaux gpt4
qui peuvent avoir une compréhension
super fine de ce qui est en train de se
passer dans une vidéo qu'est-ce qui
rentre qu'est-ce qui sort ok machin qui
a telle identité euh vient d'effectuer
telle action il porte tel vêtement tel
sac il se rend de tel à tel endroit on
imagine qu'il est probblement en train
de d'aller prendre l'avion bah il y a
des application qui pardon il y a des
applications qui tu lu montres un
vêtement et tu peux lui dire avec quoi
tu me conseilles de porter ça alors
c'est trop bien mais ça te donne une un
nombre d'informations sur toi je rebonis
pardon mais mais làdessus tout ça pour
dire que si vous trouvez ça encore un
peu ridicule de se poser des question
sur la surveillance de Mass et cetera et
vous êtes mais non mais ça c'est encore
des des petits rigolos de de lanceur
d'alerte ou le truc comme ça qui qui
s'inquiète de ça en fait on s'en fout
complètement c'est pas le cas c'est
vraiment pas le cas les les prochaines
années vont être très très étrange
surtout si on ne fait rien on parlait
des opties qui sont possibles même les
téléphones évoluent et de plus en plus
dans les CPU de ton téléphone tu as des
parties qui sont optimisées pour LESIA
et cetera qui fait que tu consommes
moins tu peux faire tourner des modèles
plus lourds donc ah c'est sûr qu'on aura
des LNM qui vont tourner sur nos
téléphones il y a déjà quelques années
où on pouvait aller sur le dashboard
Google je pense que c'est toujours le
cas et on avait les enregistrements
quand on prononce le le le fameux mot
mais rien que ça c'est c'est c'était un
peu flippant de savoir que sur sur votre
compte Google sur les serveurs de Google
il y a toutes vos voix quand quand vous
donnez une action et en fait le plus
probable c'est que de plus en plus on il
a le chercheur le fameux Robert rive
disait dans son titre on a lâché sur la
vie privée on a lâché le combat et qu'en
fait on va nous écouter avec nots
semionsentement donc c'est-à-dire avec
des des conditions d'utilisation qu'on
va de plus en plus accepter qui on va de
plus en plus Rogier sans jamais trop
franchi la ligne de on vous écoute sans
que vous le sachiez jamais parce que ça
je pense que c'est beaucoup trop
impopulaire sans doute qu'il y en a qui
vont faire une bêtise et qui
potentiellement vont être condamnés he
mais mais potentiellement c'est C deux
entreprises mais par contre la frontière
de on se fait écouter avec notre
semi-accord et c'est vraiment utilisé
pour des pubs ça je pense que c'est ce
que m'a fait réaliser ces deux articles
c'est une chose c'est bien ça c'est très
très proche hautement probable imagine
le truc où tu tu viens de poser de
poster ton TikTok un peu plus tard tu
reçois un petit mail ou une petite on
dirait que votre pull est un peu usé là
vous voulez pas en acheter un autre non
mais c'est sûr mais évidemment qu'on va
avoir des trucs comme ça ça ça va pas
être ça ça pas être vous voulez pas en
acheter un autre ça va être hop petite
pub affiché sur Amazon dans pull
bizarrement qui ressemble pas mal ça va
être ça et du coup toi tu te dis pas je
me suis fait avoir ouais c'est çaudra
que je le change ou alors vous avez pris
un peu de poids quand même ça évidemment
depuis un an on a remarqué que vous sur
TikTok là ouais AZ un les fêes les fa
euh un petit régime quand même un petit
oh ou ça don des prisson pour les
smartphones qui nous écoutent la réponse
est encore toutouverte mais qu'en est-il
des assistants vocaux les Google home et
cetera et ben on vous avait justement
fait une chronique à quelques temps sur
les Google home et des vulnérabilités un
peu étranges qui ont été découvertes par
un chercheur en cybersécurité c'était
dans cette vidéo je vous laisse aller
voir c'était un peu technique mais très
intéressant
浏览更多相关视频
The Future of Your Personal Data - Privacy vs Monetization | Stuart Lacey | TEDxBermuda
¿Por qué me vigilan, si no soy nadie? | Marta Peirano | TEDxMadrid
Can We Trust Artificial Intelligence? | The Daily Aus
Google Consent Mode v2 Komplettguide (deutsch) - Alles was du JETZT wissen musst!
The 9 BEST Scientific Study Tips
AI vs Artists - The Biggest Art Heist in History
5.0 / 5 (0 votes)