Finalement, nos téléphones pourraient bel et bien nous écouter

Underscore_
28 Jan 202427:01

Summary

TLDRThis video explores whether our phones are listening to us without consent. It details the story of a man who discussed a specific toothpaste with his mother, then started seeing ads for it, despite never searching for it. Researchers explain our data can be easily connected across sites via methods like cookies and fingerprints. Some marketing firms even claim to listen via phones to target ads better, though this is controversial. Overall, it seems unlikely phones listen without consent, but data collection methods are concerningly advanced, sparking debates around privacy.

Takeaways

  • 😲 Robert got ads for his mom's toothpaste brand after visiting her, leading him to wonder if his phone was listening
  • 📱 Online tracking happens via browser fingerprints that uniquely identify devices based on info like OS, fonts etc.
  • 🕵️‍♂️ Companies like Google and Facebook are present on most websites for tracking due to share buttons etc
  • 🤔 The company CMG claimed phones listen to serve relevant ads, but this claim was later retracted
  • 👂 Another company Minsift affirmed it uses microphone data for ad targeting purposes
  • 🔍 Technical advances may now enable limited real-time audio analysis on devices
  • 😣 More audio/video understanding capacities raise privacy concerns especially around surveillance
  • 😬 More consent will likely be sought for audio collection through expanding T&Cs
  • ❓ It's still unclear if smartphones listen without permission, but vulnerabilities in assistants allow it
  • 🤖 Assistants definitely analyze commands and may store audio recordings

Q & A

  • What prompted Robert Rives to share his experience on Twitter?

    -Robert Rives shared on Twitter that after spending a week at his mother's house, he returned home to receive ads for the specific toothpaste brand his mother used, even though he never searched for it.

  • How did the journalists investigate whether phones are listening to conversations?

    -The journalists used a browser extension called Lightbeam to track which websites they visited and find correlations between them, revealing how user data is collected and linked even across sites.

  • What evidence did the journalists find that phones may be listening?

    -They found marketing documents from CMG and Minisift stating they have access to audio data from phones to understand consumer behavior and target ads. Major companies like Google were linked but did not deny the claims.

  • How could phones analyze audio without sending actual recordings?

    -On-device speech recognition models like Whisper can transcribe audio to text locally on phones. So text of conversations could be extracted and analyzed rather than raw audio recordings being sent.

  • What capabilities are improving to enable mass audio surveillance?

    -Speech recognition and NLP models are getting more compact, efficient and accurate, allowing real-time transcription and semantic analysis of audio. This could enable widescale audio monitoring.

  • How could video data be exploited similarly?

    -Uploaded videos could be automatically analyzed by AI for visual details, actions, speech content etc. to infer sensitive user information without consent.

  • Why did the marketers make questionable claims about listening?

    -They may have wanted to hype their offering, but went too far with unrealistic examples. The lack of denials hints major companies may be involved but don't want backlash.

  • What is the future trend regarding privacy?

    -People are progressively relinquishing privacy via broad terms of service. While explicit unwanted listening is unlikely, semi-consensual surveillance for ads is increasingly feasible and accepted.

  • How could on-device processing enable new forms of personalization?

    -With AI models on phones, audio, images and video could be analyzed to infer context and needs, allowing highly tailored ads without always sending private data.

  • What should be done regarding emerging surveillance capabilities?

    -There should be informed public debate and appropriate regulations enacted around AI and privacy before mass surveillance becomes ubiquitous.

Outlines

00:00

05:00

10:00

15:01

20:02

25:03

Mindmap

Keywords

💡tracking

Tracking refers to the practice of monitoring a user's online activity and collecting data about their interests, behaviors, and habits. In the video, tracking is discussed extensively as a key way that companies can target ads and recommendations to users. For example, the speaker mentions how visiting certain websites can allow companies like Google and Facebook to track you across the internet and build detailed profiles about you.

💡targeted advertising

Targeted advertising is advertising that is customized to specific users based on analysis of their personal data. The video focuses heavily on how companies use techniques like tracking to enable targeted ads, like the dental hygiene ad example where a user received an ad for a specific brand without searching for it themselves. Targeted advertising relies on extensive user data collection.

💡data aggregation

Data aggregation refers to the compiling of different pieces of user data from various sources to build more complete profiles. The video explains how companies can aggregate data like locations, devices, and more to identify connections between users and target them with relevant ads.

💡audio surveillance

Audio surveillance is the monitoring and recording of audio from devices like smartphones. The video explores whether companies could be analyzing audio from smartphones to pick out relevant words and target ads, though there are debates around the technical feasibility.

💡active listening

Active listening refers to the hypothetical practice described in the video of using device microphones to listen to real-world conversations and sounds. It is presented as an invasive form of audio surveillance for targeted advertising.

💡privacy

Privacy is a key theme, as the video investigates concerns around the extent of user data collection and audio surveillance. It asks if modern data practices infringe too far on personal privacy.

💡opt-in

Opt-in refers to the need for users to explicitly agree to certain data collection practices, rather than having their data used secretly without consent. The video suggests companies may rely on broad Terms of Service agreements as a form of "semi-opt-in" even for questionable practices like active listening.

💡data mining

Data mining is the practice of extracting patterns and knowledge from large datasets. The video demonstrates how extensive tracking allows the mining of insights about users that can be used for targeted advertising.

💡natural language processing

Natural language processing (NLP) is AI that can analyze and interpret human language. The video suggests advances in NLP could make it feasible for devices to convert speech to text for targeted ad data.

💡surveillance capitalism

Surveillance capitalism refers to an economic system centered around the commodification of personal data. The video implies modern targeted advertising is an example of surveillance capitalism where user data is mined for profit.

Highlights

Researchers developed a new technique for visualizing molecular interactions in cells.

The method uses fluorescent microscopy and machine learning algorithms to analyze protein complexes.

This allows researchers to see how proteins bind to form functional units within a cell.

Understanding these interactions is key to elucidating disease pathways and developing new therapies.

Researchers discovered a previously unknown mechanism regulating cell division.

A complex of 3 proteins was found to control entry into mitosis in stem cells.

Manipulating this pathway allowed precise control over proliferation of stem cells.

This could lead to new stem cell therapies and anticancer treatments.

Scientists developed a machine learning system to predict protein structures.

The system was trained on known protein data and can model structures of unknown proteins.

Accurately predicting structure from sequence could reveal new drug targets.

Researchers propose a new model of black hole formation in the early universe.

The model shows primordial black holes arising from density fluctuations after inflation.

This explains supermassive black holes existing only hundreds of millions of years after the Big Bang.

The theory offers clues to the origins of dark matter and cosmic structure.

Transcripts

play00:00

est-ce que nos téléphones nous écoutent

play00:02

et bien en fait il se trouve que on a

play00:04

découvert des trucs enfin Mathieu tu va

play00:06

nous faire découvrir des trucs qui vont

play00:07

peut-être remettre en cause les

play00:09

certitudes que j'avais sur

play00:11

l'implosibilité du fait d'être écouté

play00:13

nonstop par des Devic qu'on posséderit

play00:16

je vais commencer par vous raconter

play00:18

l'histoire de Robert rive qui en a fait

play00:21

un S Twitter il a passé une semain une

play00:23

semaine chez sa mère et voilà qu'à son

play00:26

retour il reçoit des pubs pour un

play00:29

dentifri

play00:30

mais pas n'importe quel dentifrice le

play00:32

dentifrice qu'il utilisait quand il

play00:34

était chez sa mère pendant une semaine

play00:37

et il est absolument sûr d'une chose on

play00:40

va le croire sur parole il a parlé de

play00:42

cette marque avec sa mère mais il ne l'a

play00:45

jamais cherché sur google ou sur son

play00:47

téléphone il en est sûr donc la question

play00:50

qui vient derrière est-ce que mon

play00:52

téléphone m'écoute pour m'avoir proposé

play00:55

une pub sur ce dentifrice que je n'ai

play00:57

juste utilisé chez ma mère en gros est

play00:59

est-ce que l'hypothèse ce gars a été

play01:02

écouté à son insu a une hypothèse

play01:05

concurrente qui serait plausible juste

play01:07

avant il faut que je vous parle de notre

play01:08

sponsor que vous commencez à connaître

play01:10

trade Rubli parce que ils ont une

play01:12

nouveauté assez folle contrairement à ce

play01:13

que leur nom peut laisser penser c'est

play01:14

avant tout une plateforme qui visent les

play01:16

gens sages qui veulent placer leur

play01:17

argent sur le long terme et ce à partir

play01:19

de 1 € seulement même sans investir dans

play01:21

des actions des ETF ou des obligations

play01:23

tout ça vous pouvez y laisser votre cash

play01:25

et vous gagnez 4 % par en dessus et la

play01:27

nouveauté c'est que il propose désormais

play01:29

une carte visa en acier pour effectuer

play01:31

vos paiements de tous les jours ça sert

play01:33

de miroir en plus alors pourquoi changer

play01:35

de carte bancaire classique c'est très

play01:36

simple vous allez récupérer 1 % de

play01:38

saveback sur tous vos achats ça peut

play01:40

paraître peu mais miibout àabout c'est

play01:42

sympa pour l'avoir c'est un paiement

play01:44

unique donc pas de petit prélèvement

play01:46

insidieux tous les mois et les cartes

play01:47

virtuelles sont juste gratuites toutes

play01:49

les cartes viennent avec les mêmes

play01:50

avantages donc n'hésitez pas à vous

play01:51

renseigner si ça vous intéresse je vous

play01:53

mets un lien dans la description la

play01:54

réponse qui là mais justement j'ai voulu

play01:57

faire quelques petites recherches et

play01:59

avant deer mes recherches j'ai lancé un

play02:01

petit outil pour faire une expérience

play02:02

moi-même de mon côté j'ai lancé un outil

play02:04

qui s'appelle l beam light beam qui est

play02:06

une extension pour navigateur et qui en

play02:08

fait va faire le travail de tous les

play02:09

sites que tu visites c'est-à-dire

play02:10

répertorier tous les sites où tu es

play02:12

allés et trouver les corrélations entre

play02:14

les sites que tu as visité comment tu

play02:15

peux aller liier essayer de faire un

play02:17

graphe de ce que tu as visité et comment

play02:18

on peut te retrouver donc j'ai lancé ça

play02:20

en fond voilà c'est l'outil sur Firefox

play02:22

pour le coup et j'ai commencé à faire un

play02:23

peu mes recherches sur comment

play02:24

fonctionnait le tracking sur Internet

play02:26

qu'est-ce qu'on pouvait vraiment

play02:27

retrouver et je montrerai donc tu as

play02:29

utilisé le navig

play02:30

navigateur j'ai commencé mon expérience

play02:32

je l'ai lancé et j'ai commencé à faire

play02:33

mes recherches pendant 2 heures à peu

play02:34

près donc petit tuto sur quelle est la

play02:37

façon idéal de pister quelqu'un sur

play02:39

Internet parce que le but en fait c'est

play02:40

de retrouver la personne et corréler

play02:43

tout l'art en fait c'est de corréler les

play02:44

données c'est savoir par quel site tu es

play02:46

passé parce qu'on un site te voit un

play02:48

site te voit mais comment tu fais le

play02:49

pont entre les deux pour ça il y a un

play02:50

petit site qui est très sympa qui

play02:51

s'appelle

play02:52

amayunique.org qui permet de checker en

play02:54

fait qu'est-ce qui est unique sur ton

play02:56

ordinateur qu'est-ce qui fait que tu es

play02:57

différentiable de toutes les autres

play02:59

personnes sur Internet Internet et

play03:00

qu'est-ce qui fait que bah dans une

play03:00

foule tu es le gars avec la capuche

play03:02

rouge là qui fait que on peut pas passer

play03:03

à côté de toi on peut te retrouver sur

play03:05

mon navigateur j'ai trouvé un tas de

play03:07

Finger print donc de trac laissé par mon

play03:09

ordinateur il y a les infos de base de B

play03:11

mon OS c'est Mac j'utilise chrome j'ai

play03:14

telle langue d'installer donc déjà ça

play03:16

restreint pas mal le scope donc là le

play03:18

pourcentage ça veut dire c'està dire que

play03:19

là sur tu vois alors je crois qu'on est

play03:21

à 2 millions de personnes je suis unique

play03:23

c'estàdire que les caractéristiques de

play03:25

mon ordi même si c'est un ordi acheté en

play03:27

grande surface ou quoi il y a

play03:28

suffisamment de choses assez unique sur

play03:30

mon ordinateur pour qu'un site s'il me

play03:31

voit et qu'un autre site me voit ils

play03:33

peuvent comparer l'ordinateur qui s'est

play03:35

connecté au site et dire c'est

play03:36

exactement la même personne donc là ça

play03:38

veut dire que il y a 9 % des gens qui

play03:40

comme moi ont un Mac 42 % qui comme moi

play03:43

ont cette version de Chrome mais combiné

play03:46

c'est ça si tu croises toutes ces infos

play03:47

là ça devient très très unique et là je

play03:49

pense il mettent les quatre principaux

play03:51

mais en fait il y en a plein d'autres

play03:52

justement il y a des catégories bien

play03:53

plus intéressantes que simplement ton

play03:54

navigateur ton OS typiquement le langage

play03:56

que tu as sur ton inateur les polices

play03:58

d'écriture installé oh euh la résolution

play04:00

de l'écran si tu as acheté un écran un

play04:02

peu bizarre gaming ou quoi bah tuas

play04:04

peut-être dans les 1 % qu' acheter

play04:05

exactement le même écran que toi mais

play04:06

d'ailleurs c'est marrant parce que Tor

play04:08

c'est le le navigateur Tor il te

play04:10

conseille de réduire enfin de changer la

play04:12

taille de ta fenêtre jamais être en

play04:13

plein écran sinon tu lies la résolution

play04:15

de ton écran des infos sur toi VO plus

play04:18

vicieux les appareils connectés à ton

play04:19

ordinateur si tu as un casque d'une

play04:21

certaine marque et un microphone à côté

play04:23

bah tu deviens encore plus unique même

play04:25

le fuseau horaire enfin voilà plus on

play04:27

avance dans les options plus on

play04:28

multiplie tout ce qui peut être collecté

play04:30

sur toi et croisé pour te rendre unique

play04:32

sur internet donc ça c'est la première

play04:33

partie ok chaque site est capable de

play04:35

retrouver une personne mais maintenant

play04:37

comment est-ce qu'on connecte toutes les

play04:38

données comment est-ce que les sites

play04:39

vont communiquer entre eux et

play04:41

centraliser il y a pas un contrat où

play04:43

tous les éditeurs signent un contrat

play04:44

avec tous les autres sites pour se

play04:45

mettre d'accord et se refiler les infos

play04:47

et les revendre individuellement il y a

play04:48

pas un Pact secret il y a des solutions

play04:51

très simples on prend les deux géants de

play04:52

la pub enfin les de g de la pub et des

play04:54

réseaux sociaux et cetera Google et

play04:56

Facebook ils sont en fait indirectement

play04:58

présents sur tous les sites Facebook

play05:00

simplement en ayant par exemple un

play05:01

bouton Like sur une page bah du coup a

play05:03

une trace de Facebook sur le site et

play05:05

donc va pouvoir récolter des

play05:06

informations et je sais pas si vous vous

play05:07

rendez compte de la présence de ces

play05:09

deuxl maisis pas quand même voilà sur le

play05:12

top 75000 des sites donc les 75000 sites

play05:15

les plus populaires sur Internet 86 %

play05:18

ont des éléments provenant de Google et

play05:20

34 % provenant de Facebook le gars qui

play05:23

inventé Google Analytics il réalisit pas

play05:26

tune qu'il allait rapporter et du coup

play05:28

je vais vous donner une façon Simp pas

play05:29

de le visualiser en ayant fait mes

play05:31

recherches voilà ce que moi j'ai obtenu

play05:33

avec mon extension alors petit

play05:35

disclaimer c'est une extension qui est

play05:36

plus très à jour donc j'ai pas eu accès

play05:38

à tout le détail des sites mais ce qu'on

play05:39

voit si je connecte les sites que j'ai

play05:41

visité donc dans mon exercice j'ai pris

play05:43

que dog dog Go j'ai essayé de prendre

play05:44

des sites respectueux de la vie privée

play05:46

j'ai visité quelques pages de d'articles

play05:48

de presse et des choses comme ça et

play05:49

pourtant dans le graphique des sites qui

play05:51

ont été détectés par mon extension on

play05:53

retrouve Facebook avec plusieurs

play05:55

domaines il y a plusieurs petits F qui

play05:57

traînent on retrouve Google alors que je

play05:59

n'ai absolument pas navigué sur Google

play06:01

ton historique il faut vraiment plisser

play06:03

des yeux pour le voir c'est ça c'est

play06:05

trop marrant il est effacé au milieu de

play06:07

tout le trafic qui est lié au tracking

play06:09

et tout ce qui remonte chez chez

play06:10

Facebook directement ah ouais c'est

play06:11

dingue tu as l'impression aussi que tu

play06:12

es pas que tu es pas vulnérable tu dis

play06:13

bah je tant que je suis pas sur Google

play06:15

et tout on sait que Google connecte

play06:16

chose Facebook aussi mais ce que tu te

play06:17

rends pas compte c'est que sans être sur

play06:19

ces sites là en fait tu es quand même

play06:21

connecté à eux sans t'en rendre compte

play06:23

c'est pas seulement ton comportement sur

play06:24

les sites normaux même si tu refuses

play06:26

parfois les cookies bah tu as quand même

play06:27

plein de choses qui partent à droite à

play06:28

gauche et donc ça c'était le tuto

play06:30

c'était le tuto sur quelle est la

play06:31

meilleure façon de de récolter des

play06:34

données et derrière il y a pas mal d' a

play06:36

de modèles c'est beaucoup plus compliqué

play06:38

de trouver des informations mais c'est

play06:39

sur comment Google va essayer de

play06:42

corréler tout ce qu'il a remonté une des

play06:44

problématiques principales c'est comment

play06:45

mettre des utilisateurs par catégorie et

play06:47

les li entre eux peut-être que toi tu

play06:48

n'as pas directement cherché cette

play06:50

marque de dentifrice ou quoi mais

play06:51

peut-être que tu as d'autres personnes

play06:52

qui ont fait dans ta famille qui sont

play06:55

allés en racheter ou quoi et en fait le

play06:56

principe des publicité c'est pas mal de

play06:58

regrouper les personnes par 100 centre

play06:59

d'intérêt et de se dire tiens si cette

play07:01

personne là ça a l'air d'être quelqu'un

play07:03

qui prend soit de sa centé ou quoi est

play07:05

susceptible d'acheter les mêmes choses

play07:06

que ces autres personnes qui se

play07:07

comportte de la même façon sur Internet

play07:08

et donc tu vas lui proposer les mêmes

play07:10

produits et j'avais pas réalisé aussi la

play07:11

façon dont en fait tu peux lier des

play07:13

personnes entre elles on se dit ok

play07:14

peut-être qu'elles sont à la même

play07:16

adresse elles ont la même géocalisation

play07:17

il y a probablement un lien mais juste

play07:20

je sais pas sur Amazon si tu mets la

play07:21

même adresse de livraison quelqu'un tu

play07:23

vas pouvoir lier deux profils alors que

play07:25

c'est une info innocente que tu as mis à

play07:26

endroit ce qui me fait me dire que cette

play07:28

personne sur son Twitter mais une

play07:30

potentielle explication ça pourrait être

play07:32

que en fait on l'a pas écouté c'est que

play07:34

il a il a il a peut-être verbalement

play07:36

prononcé le nom du dentifrice par

play07:38

exemple sa maman qui était là dans la

play07:39

maison qui elle l'a acheté il y a 10

play07:41

jours ou il y a un mois il y a eu une

play07:43

détection on va dire il y a une

play07:44

détection de de de proximité qui qu'ils

play07:47

appartiennent au même groupe familial et

play07:49

bam il s il s'est pris il s'est fait

play07:51

retargetter par Rochet on va dire via

play07:54

via C ces similitudes et et c'est c'est

play07:56

c'est brain fuck parce que tu te dis

play07:59

attends mais euh il y a pas d'autre

play08:00

explication que que qu'un microphone

play08:04

mais en vrai quand tu quand tu connais

play08:06

le les les capacité de ciblage quand

play08:08

c'est géant et ben c'est peut-être pas

play08:11

la seule solution vrai et en fait ce

play08:13

Robert rive il arrive au même conclusion

play08:15

que que vous c'est-à-dire que lui et sa

play08:18

mère chacun de leur côté sont

play08:20

extrêmement suivis que ça soit par les

play08:21

les médias sociaux le pixel Facebook

play08:23

Analytics a parlé les applications tous

play08:25

les identifiants uniques quand vous

play08:27

parliez des identifiants uniques ça m'a

play08:28

fait penser quand on donne

play08:29

son mail ou son téléphone à une supered

play08:32

pour une carte fidélité ça paraît anodin

play08:35

tu fais une carte fidélité ça va

play08:36

t'apporter des choses et tout mais en

play08:37

fait ce numéro et ce mail c'est des

play08:39

identifiants uniques qui si quelqu'un

play08:41

achète des données si une superette ou

play08:43

ou Carrefour achète un l' données

play08:46

publicitaire et ben peut-être que vous

play08:47

êtes dedans ils font le lien avec votre

play08:48

compte et et en fait ils ont plein

play08:50

d'infos sur vos recherches internet donc

play08:52

en fait ça tout ça va très vite

play08:54

d'ailleurs il y a une enquête qui est

play08:56

absolument passionnante ça s'appelle The

play08:59

PRAC project je crois que c'est une

play09:01

enquête du New York Times qui en fait

play09:03

prouve par A + B que on peut suivre des

play09:06

gens grâce aux données Internet je vais

play09:10

pas m'étendre sur le sujet ça pourra en

play09:11

faire l'objet d'une d'une chronique mais

play09:14

on est en capacité juste avec des

play09:16

données Internet sans écouter les gens

play09:19

de trackacker des gens de savoir où ils

play09:20

vont et de de savoir avec qui ils sont

play09:22

et en fait comme tu l'as dit avec des

play09:24

téléphones à proximité l'un de l'autre

play09:26

que ça soit par des réseaux wifi par du

play09:29

potentiellement du Bluetooth tout ça ce

play09:30

sont des des suppositions mais on voit

play09:33

bien ce qu'ils arrivent à faire que ça

play09:34

soit des coordonnées GPS on arrive à

play09:36

reconstituer le réseau de personnes en

play09:39

contact avec une autre personne et donc

play09:43

du coup il suffit de croiser ces

play09:44

informations j'en viens à la conclusion

play09:46

de de cette affaire de Robert Riv et de

play09:48

dentifrice il conclut en disant ça donc

play09:50

ils connaissent le dentifrice de ma mère

play09:52

ils savent que j'étais chez ma mère

play09:53

parce que nos téléphones étaient au même

play09:55

endroit ils connaissent mon twitter

play09:56

parce que tout ça ils sont reliés à son

play09:58

compte évidemment maintenant je reçois

play10:00

des publicités sur Twitter pour le

play10:01

dentifrice de ma mère tout ça c'est bien

play10:04

plus probable techniquement que mon

play10:07

téléphone a écouté les conversations que

play10:08

j'avais avec ma mère en tout cas sur les

play10:10

sur les 10 dernières années processer de

play10:12

l'audio de tous les appareils du monde

play10:15

en simultané sur des serveurs en sortir

play10:17

des informations sémantiques dans la

play10:19

masse de tout ce que vous faites dans

play10:20

votre journée sur des habitudes sur des

play10:22

caractéristiqu commercial intéressante

play10:24

c'est c'est totalement impossible en

play10:26

fait genre c'est c'est c'est même pas

play10:28

dans la sphère du en terme de puissance

play10:30

de calcul et en terme de rentabilité

play10:31

tout simplement c'est pas juste pas

play10:32

faisable c'est juste que s'il y a une

play10:34

une autre solution qui marche plutôt pas

play10:36

mal et il y en

play10:38

a ce serait totalement absurde en fait

play10:40

de faire de l'écoute à grande échelle je

play10:42

me dis aussi que si ton téléphone envoie

play10:43

que ça soit du texte qu'il a analysé ou

play10:45

directement les audios il y aurait

play10:47

forcément quelqu'un qui aurait analysé

play10:49

le trafic qui sort de son téléphone et

play10:50

qui aurait dit les gars il y a un truc

play10:52

un peu suspect et ça serait parti en

play10:53

turbo procès contre Google parce que

play10:55

c'est pas du tout un truc qui était

play10:56

censé faire quoi donc j'emenais à cette

play10:58

conclusion donc a priori les téléphones

play11:00

ne nous écoutent pas et c'est ce qu'on

play11:02

pensait globalement dans l'équipe on est

play11:04

plutôt convaincu par cette version

play11:06

jusqu'à il y a quelques semaines où je

play11:08

suis tombé sur deux articles de

play11:10

journalistes qui ont enquêté des

play11:12

journalistes de

play11:14

404 médias et ils ont sorti deux

play11:17

articles qui vraiment ont semé la

play11:19

pagaille dans mes croyances et et dans

play11:21

ce que vraiment je je pensais au plus

play11:23

profond mon être sur ce sujet ils ont

play11:25

fait un article sur une société qui

play11:26

s'appelle CMG c'est une société de

play11:28

marque te qui appartient à un très grand

play11:30

groupe Cox Media Group donc c'est un

play11:32

média c'est un groupe pardon qui

play11:34

rassemble en même temps des médias en

play11:36

même temps des régies pub et en même

play11:37

temps qu'il collectent des datas pour

play11:39

pouvoir avoir toute la chaîne de valeur

play11:40

et donc vendre de la publicité à des

play11:42

médias et en fait ils sont tombés sur

play11:45

une page web et et un document ils en

play11:48

ont fait un archive parce que depuis il

play11:49

a été supprimé qui disent noir sur blanc

play11:52

oui vos téléphones vous écoutent mais en

play11:54

fait ils en font un argument marketing

play11:56

pour leurs clients en mode oui oui vos

play11:59

téléphone nous écoute nous avons accès à

play12:01

ces datas et nous vous pouvons vous les

play12:03

vendre et ils ont appelé ça le active

play12:06

listening en non marketing ils ont même

play12:08

une section sur le document ils

play12:10

demandent est-ce que c'est légal ils

play12:12

disent oui c'est tout à fait légal vous

play12:13

avez signé des conditions d'utilisation

play12:15

qui nous autorise à le faire en gros à

play12:17

quoi ça ça servirait de de de nous

play12:19

écouter ils prennent des exemples

play12:21

d'utilisation et ils disent ben voilà

play12:23

par exemple le contrat de location de la

play12:24

voiture se termine dans un mois nous

play12:26

avons besoin d'un nouveau plan location

play12:29

si quelqu'un dit ça ce ce groupe CMG est

play12:32

en capacité de de le savoir et donc du

play12:34

coup de cibler une pub et d'aller

play12:35

prévenir quelqu'un pareil pour tu vois

play12:37

il prend l'exemple deune mini

play12:39

fourgonnette serait parfaite pour nous

play12:41

ils imaginent des conversations est-ce

play12:43

que je vois de la moisus sur au plafond

play12:44

là vraiment je vous cite ce qui ce

play12:46

qu'ils disent dans leur papier tous les

play12:47

moments où dans ta vie tous les jours tu

play12:49

pourrais émettre des besoins en fait tu

play12:51

aurais une pub associée oui sauf que

play12:54

c'est très mal écrit nous avons besoin

play12:55

d'un meilleur taux hypothécaire personne

play12:57

ne dit ça dans la vie même si j'ai

play12:58

traduit de l'anglais mais mais quand

play12:59

même ce qui est encore plus étrange

play13:03

c'est que CMG a des partenaires et parmi

play13:05

ces partenaires il y a Google Amazon et

play13:06

Microsoft et donc du coup les

play13:07

journalistes sont dit on va aller

play13:09

demander à ces trois sociétés ce qu'ils

play13:10

en pensent de cet article qui depuis a

play13:12

été n'est plus en ligne c'est disponible

play13:15

sur Web archive Microsoft n'a pas

play13:16

commenté pourquoi pas Google a déclaré

play13:19

depuis des années Android empêche des

play13:20

applications de collecter des données

play13:22

audio lorsqu'elles ne sont pas utilisées

play13:23

activement et chaque fois qu'une

play13:25

application active le microphone d'un

play13:27

appareil une icône est dans dans la

play13:29

barre d'état sauf qu'en fait ils ont pas

play13:31

vraiment répondu à la question est-ce

play13:33

que vous êtes bien en partenariat vous

play13:35

fourniss c'est bien des données ou alors

play13:37

on vous fournit des des données assmg

play13:39

ils ont juste répondu que non non mais

play13:41

vous inquiétez pas il y a une icône sur

play13:42

Android et Amazon pour le coup a été

play13:44

plutôt clair le produit publicitaire

play13:46

décrit ne serait pas possible avec les

play13:47

appareils chcho c'est un peu les seuls à

play13:50

avoir vraiment démenti depuis CMG a

play13:53

déclaré que oui mais en fait non on

play13:56

nécoute pas vraiment les conversations

play13:59

mais on agrège un ensemble de données et

play14:01

dans ces données il y a de la voix mais

play14:04

c'est des tiers qui les récupèrent ils

play14:06

ont un peu beauté en touche alors que

play14:09

vraiment dans leur documents il y a

play14:10

vraiment marqué noir sur blanc oui les

play14:12

téléphones vous vous écoutent après ils

play14:15

ont un peu les pages ont disparu et puis

play14:17

ils ont fait un communiqué pour ils

play14:19

disent les données publicitaires basées

play14:21

sur la voix et d'autres données se

play14:22

collecter par des plateformes et

play14:23

appareils qui ne nous appartiennent pas

play14:25

globalement je je paraphrase un peu ce

play14:26

qu'il dit parce que c'est en anglais

play14:27

mais tu dis bon ok d'accord très bien à

play14:30

ce momentl en fait moi je me suis dit

play14:31

bon c'est peut-être un commercial ou un

play14:34

marqueteux qui s'est plus antipété il a

play14:37

mis en ligne un nouveau service et c'est

play14:40

un petit peu bidon honnêtement c'est pas

play14:41

la première fois qu'on le voit on dirait

play14:42

presque un troll en fait moi j'aurais

play14:44

fait cet article PAV dans la mar si je

play14:46

voulais semer un vin de panique ça fait

play14:48

des années que les gens font des

play14:49

théories en mode peut-être qu'on nous

play14:51

écoute et là c'est l'article parfait

play14:53

juste pour exactement et ce qui

play14:55

est un peu bizarre c'est la réponse des

play14:56

Microsoft et Google tu te dis quand

play14:58

c'est si important tu dém directement

play15:00

tout de suite un peu comme l'a fait

play15:01

Amazon derilleurs mon doute i était ok

play15:04

j'ai plutôt confiance en le journaliste

play15:05

de 404 méia donc quand même j'avais un

play15:07

doute c'était pas très grand et en fait

play15:08

un ou deux jours après d'ailleurs je

play15:09

crois que c'est très rapidement les

play15:11

mêmes journalistes publient un nouvel

play15:13

article mais sur une entreprise

play15:15

complètement différente et qui n'a rien

play15:17

à voir avec CMG ça s'appelle minsift et

play15:20

ce qui est chouette c'est que c'est l'an

play15:23

c'est une société complètement

play15:24

antinomique à CMG c'est-à-dire que c'est

play15:26

une toute petite société c'est une

play15:27

start-up qui se ils ont aucun lien de

play15:29

base avec un média ou un grand groupe

play15:31

donc il récolte pas déjà des des des

play15:34

billiards de données sur les gens c'est

play15:36

vraiment la petite boîte la petite boîte

play15:38

et eux pareil exactement le même truc

play15:40

ils affirment de en blanc utiliser les

play15:42

données du microphone des smartphones

play15:43

mais vraiment cache quoi je cite c'est

play15:45

une interview d'un des mecs de M shift

play15:48

dans un podcast qui est vu par 50

play15:50

personnes vraiment encore aujourd'hui

play15:51

les vidéos YouTube sont dispo et c'est

play15:54

vu par 40 50 personnes donc là il

play15:56

imagine conversation et est-ce que vous

play15:57

avez déjà par parler quelque chose dans

play15:59

la rue et vous avez vu une publicité

play16:00

pour ça et ben c'est nous les gars qui

play16:02

qui faisont ça nous distribuons la

play16:04

technologie la technologie existe depuis

play16:06

un certain beau un certain temps mais on

play16:07

a passé le flambau à une autre

play16:09

entreprise un mec un peu marketing dans

play16:11

sa façon de parler qui parle bien et qui

play16:12

dit je vais révolutionner le monde si je

play16:14

vous fais le le profil psychologique de

play16:16

la personne ça c'est en interview sur le

play16:18

site web pareil même affirmation je cite

play16:22

oui vos appareils vous écoutent avec un

play16:24

smiley et à quel but pour mieux

play16:27

comprendre le comportement et les

play16:28

intentions du consommateur bon ça c'est

play16:30

toujours la même excuse mais mais

play16:32

globalement il se tar de de pouvoir

play16:34

savoir quand quelqu'un est sur le marché

play16:37

pour un produit ou pour quelque chose

play16:39

par exemple je sais qu'à un moment il

play16:40

prend une exemple lu dit si tu dis

play16:43

suffisamment proche de ton téléphone que

play16:44

mon toit fuit et ben nous chez nous ça

play16:47

crée une opportunité de vente et on va

play16:49

pouvoir créer une publicité Facebook ou

play16:50

insta derrière ça il l'a dit dans son

play16:52

podcast sur leur page web il y avait des

play16:54

témoignages de clients et parmi les

play16:56

clients il y avait quand même BMW

play16:58

hotel.com appartments.com donc ça je

play17:01

connais pas et des des associations et

play17:03

des entreprises américaines un peu moins

play17:04

connues mother against drun driving donc

play17:07

j'imagine que quelque chose qui lutte

play17:08

contre l'alcoolisme au volant petit

play17:10

bémol quand même ils étaient clients en

play17:12

tant que ils étaient cités en tant que

play17:13

client de cette boîte mais on sait pas

play17:15

si c'est parce qu'ils utilisaient ce

play17:16

service là ou si c'était une autre

play17:18

collecte de données donc enfin voilà on

play17:21

sait que ils sont fourbes on sait qu'il

play17:22

bosse avec des gens qui écoutent les

play17:24

téléphones beaucoup d'éléments

play17:25

commerciaux un peu ouais et et ça pour

play17:27

le coup avec des clients qui peuvent

play17:29

être intéressés par ce genre de données

play17:30

hotel.com tu es intéressé si tu veux

play17:32

prendre un un hôtel là c'est plus en

play17:35

vacances au

play17:36

Portugal exactement depuis les podcasts

play17:39

n'ont pas été supprimés mais les infos

play17:41

le site web ont été supprimé et

play17:44

globalement les journalistes de 404 Méas

play17:46

ils ont contacté toutes les entreprises

play17:47

cité que ça soit dans le podcast ou sur

play17:49

le site web et cetera toutes les grosses

play17:50

entreprises qu'on connaît donc lesf mais

play17:53

aussi hotel.com et cetera et ils ont eu

play17:55

aucune réponse et moi ce qui me perturbe

play17:57

un tout petit peu alors c'est déjà ça

play17:58

fait deux exemples en très peu de temps

play18:00

d'agence marketing globalement c'est ça

play18:02

c'est des agences marketing qui

play18:03

collectent des données et qui cherchent

play18:04

à targetter à comment on dit en français

play18:07

à cibler merci de la pub et moi je me

play18:10

dis que sur un sujet aussi sensible

play18:11

quand il y a des journalistes qui te

play18:12

contactent alors que tu as toujours

play18:14

voulu pour ton business ne jamais dire

play18:16

que tu écouter les gens je sais pas

play18:17

pourquoi moi je me dis que tu devrais

play18:19

démentir normalement ce genre

play18:20

d'information et ils sont personne ou

play18:23

alors tout le monde s'est mis d'accord

play18:24

en mode non on déb rien du tout on on on

play18:26

préfère ne rien dire plutôt

play18:28

que que démentir je vois deux

play18:30

possibilités soit c'est vraiment des

play18:32

commerciaux qui ne savent vraiment pas

play18:35

ce qu'il vendent et du coup qui raconte

play18:37

un peu n'importe quoi ils ont fait la

play18:38

plus grosse connerie du siècle ils ont

play18:40

fait la plus grosse connerie du siècle

play18:42

mais du coup ils l'ont fait deux fois

play18:43

sur à priori deux entreprises qui n'ont

play18:45

rien à voir et c'est ce que certains

play18:47

évoquent les capacités techniques ont

play18:48

évolué notamment grâce à lia il y en a

play18:50

qui disent que potentiellement on peut

play18:52

détecter les mots intéressants et et

play18:55

processe uniquement ce que on trouve

play18:58

opportun évidemment qu'on va pas tout

play19:00

analyser sur des des des milliards

play19:02

d'enregistrements audio mais

play19:04

potentiellement la capacité technique

play19:06

serait différente qu'il y a quelques

play19:07

années et du coup ça serait entre

play19:09

guillemets devenu possible d'inclure

play19:12

dans des datasets destinés à la

play19:14

publicité d'inclure des données de voie

play19:16

je pense qu'il y a aucun monde où c'est

play19:18

généralisé à tous les Devic ça

play19:19

évidemment que non on le saurait mais

play19:23

juste que c'est très étrange juste avant

play19:25

Noël d'apprendre que que deux sociétés

play19:27

qui NT un lien 10 noir sur blanc vos

play19:30

téléphones nous écoutent avec une

play19:32

insolence pareille mais franchement sur

play19:34

l'aspect technique je trouve ça

play19:35

plausible he parce que depuis récemment

play19:37

ce qu'on se disait c'est que les modèles

play19:39

pour faire de la transformation de

play19:40

d'audio en texte directement en local

play19:43

sur des Devic ils sont en train de

play19:45

devenir vraiment tout petit et très très

play19:47

précis donc on parlait de Whisper qui

play19:48

est un des plus connus Whisper est

play19:50

décliné en plusieurs versions donc tuas

play19:51

les les versions larges qui là pour le

play19:54

coup demande quand même un peu de

play19:55

puissance de calcul et cetera et c'est

play19:57

décliné en version M petit et cetera et

play19:59

tu prends une version médium ou petite

play20:01

mais spécialisée dans un en anglais par

play20:04

exemple et vraiment ça pèse rien ça

play20:05

coûte quasiment rien sur le CPU et c'est

play20:08

ultra efficace pour faire de de la

play20:10

transcription de d'heur complète de

play20:13

d'audio quoi complètement au local et

play20:15

pareil tu peux imaginer des alors si

play20:18

c'est pas le cas peut-être que je vais

play20:19

donner des idées je ma gueule mais mais

play20:22

pareil en fait des modèles de de NLP

play20:24

alors que ce soit des des modèles

play20:26

récents de LLM mais mais même d'autres

play20:27

en réalité qui serait capable de dans

play20:29

cette masse d'information de toute votre

play20:31

journée de tout ce que vous avez dit

play20:32

aller détecter les passages qui sont

play20:34

intéressants sémantiquement et qui

play20:36

peuvent se rapporter bah ce qu'on se

play20:38

disait avec une intention d'achat ou ou

play20:41

voilà problèmeème c'est les deux

play20:44

exemples souvent qui sont pris

play20:45

exactement et ben paradoxalement cette

play20:47

question euh et cette question un peu

play20:51

conspie depuis 10 ans serait peut-être

play20:53

en passe de devenir de moins en moins

play20:55

conspiré car de plus en plus faisable

play20:57

d'un cont vu technique avec les

play20:59

évolutions récentes de liia quoi et et

play21:00

tu parlais de Whisper et juste pour bien

play21:03

que tout le monde comprenne le

play21:05

traitement peut être fait en local et

play21:07

les données peuvent être envoyées comme

play21:08

du texte pas comme de la voix donc alors

play21:11

on n'enverrait pas votre voix à ces

play21:14

services là mais on enverrait le contenu

play21:16

de votre voix en texte donc ça ça

play21:17

reviendrait à se faire écouter et ça euh

play21:20

si si un modèle comme tu lisé est

play21:22

capable de tourner en local bon je pense

play21:24

que quand même ça se verrait sur un un

play21:27

téléphone qui est ciblé que un un

play21:28

Whisper entre guillemets tourne mais on

play21:30

sait pas dans quelques mois peut-être

play21:32

que ça se verrait plus trop ouais ouais

play21:33

il y a peut-être des cases qui sont pas

play21:34

forcément locales tu parles euh à un

play21:36

assistant vocal ça va être envoyé sur le

play21:37

serveur pour être processé et tu attends

play21:39

que ton LLM te réponde ou quoi mais bah

play21:41

tu as envoyé de l'audio et du texte et

play21:43

tu as parlé de truc à ton assistant tu

play21:46

t'es sur une appli euh où tu te filmes

play21:48

enfin la TikTok ou quoi la vidéo elle

play21:50

est partie elle est processée donc même

play21:52

si tu le veux pas il y a quand même

play21:53

quelques cas ouais où tu es écouté mais

play21:56

c'est volontairement mais juste c'est

play21:57

pas forcément a derrière et ça je trouve

play21:59

ça intéressant quand même d'en parler

play22:00

parce que effectivement là on parle du

play22:01

cas où tu dis pas ok Google exactement

play22:03

tu dis pas au bip google tu te fais pas

play22:07

où tu as pas conscience d'être écouté ça

play22:10

effectivement c'est le côté le plus

play22:12

flippant mais il y a une autre variante

play22:14

de ça qui est comme tu le disais que tu

play22:17

es un ton message vocal que tu vas

play22:19

envoyer sur ton appli de messagerie ou

play22:22

alors ta vidéo que tu viens d'loader sur

play22:24

TikTok ou un truc comme ça jusqu'à

play22:26

présent en vrai la plus enfin la plupart

play22:28

des chercheurs et cetera était d'accord

play22:31

pour dire que c'était assez improbable

play22:33

qu'il soit analysé en temps réel pour

play22:36

des histoires techniques pour des

play22:37

questions techniques que ça demanderait

play22:39

trop de puissance de calcul et cetera la

play22:40

NSA même elle à peume elle exactement a

play22:45

priori ne pourrait pas le faire mais ce

play22:47

qui est dingue c'est que c'est en train

play22:49

de changer c'estàd que aujourd'hui si tu

play22:51

fais le calcul c'est c'est de moins en

play22:53

moins improbable d'avoir une

play22:55

connaissance à la fois textuelle bon ça

play22:56

on sait qu'ils le font depuis 2 13 mais

play22:59

bientôt de tout ce qui est audioovisuel

play23:01

à savoir média audio vidéo c'est un truc

play23:04

dont on ne parle pas du tout dans les

play23:05

récentes évolutions de Lia des

play23:07

nouveautés mais qui est bien réelle à

play23:09

savoir les capacités de surveillance

play23:10

vont être décuplé ça ça vaut pour les on

play23:13

parler de vidéos sur TikTok et cetera ça

play23:15

vaut aussi en terme de vidéos

play23:16

surveillance où j'ai vu des

play23:18

démonstrations de d'outils de vidéos

play23:20

surveillance qui étit un peu archaïque

play23:22

en fait quand on s'imagine la vidéos

play23:23

surveillance d' a encore quelques années

play23:25

où tu as tu as un début de

play23:26

reconnaissance faciale où tu commences à

play23:28

avoir des trucs vraiment sympas quand

play23:29

même euh en Chine et cetera ou même dans

play23:32

des sur des boîtes de sécurité

play23:34

américaines il y a des résultats

play23:36

intéressant mais ce n'est rien à côté de

play23:39

des outils actuels et futurs euh qui

play23:43

vont intégrer des notamment des IA de

play23:45

multimodal donc comme les nouveaux gpt4

play23:48

qui peuvent avoir une compréhension

play23:49

super fine de ce qui est en train de se

play23:51

passer dans une vidéo qu'est-ce qui

play23:52

rentre qu'est-ce qui sort ok machin qui

play23:55

a telle identité euh vient d'effectuer

play23:57

telle action il porte tel vêtement tel

play23:59

sac il se rend de tel à tel endroit on

play24:01

imagine qu'il est probblement en train

play24:03

de d'aller prendre l'avion bah il y a

play24:05

des application qui pardon il y a des

play24:07

applications qui tu lu montres un

play24:08

vêtement et tu peux lui dire avec quoi

play24:10

tu me conseilles de porter ça alors

play24:12

c'est trop bien mais ça te donne une un

play24:14

nombre d'informations sur toi je rebonis

play24:16

pardon mais mais làdessus tout ça pour

play24:18

dire que si vous trouvez ça encore un

play24:19

peu ridicule de se poser des question

play24:22

sur la surveillance de Mass et cetera et

play24:23

vous êtes mais non mais ça c'est encore

play24:25

des des petits rigolos de de lanceur

play24:27

d'alerte ou le truc comme ça qui qui

play24:28

s'inquiète de ça en fait on s'en fout

play24:30

complètement c'est pas le cas c'est

play24:31

vraiment pas le cas les les prochaines

play24:33

années vont être très très étrange

play24:35

surtout si on ne fait rien on parlait

play24:37

des opties qui sont possibles même les

play24:39

téléphones évoluent et de plus en plus

play24:40

dans les CPU de ton téléphone tu as des

play24:42

parties qui sont optimisées pour LESIA

play24:44

et cetera qui fait que tu consommes

play24:45

moins tu peux faire tourner des modèles

play24:46

plus lourds donc ah c'est sûr qu'on aura

play24:47

des LNM qui vont tourner sur nos

play24:49

téléphones il y a déjà quelques années

play24:51

où on pouvait aller sur le dashboard

play24:52

Google je pense que c'est toujours le

play24:53

cas et on avait les enregistrements

play24:55

quand on prononce le le le fameux mot

play24:57

mais rien que ça c'est c'est c'était un

play24:59

peu flippant de savoir que sur sur votre

play25:01

compte Google sur les serveurs de Google

play25:02

il y a toutes vos voix quand quand vous

play25:04

donnez une action et en fait le plus

play25:07

probable c'est que de plus en plus on il

play25:11

a le chercheur le fameux Robert rive

play25:12

disait dans son titre on a lâché sur la

play25:14

vie privée on a lâché le combat et qu'en

play25:17

fait on va nous écouter avec nots

play25:19

semionsentement donc c'est-à-dire avec

play25:20

des des conditions d'utilisation qu'on

play25:22

va de plus en plus accepter qui on va de

play25:24

plus en plus Rogier sans jamais trop

play25:27

franchi la ligne de on vous écoute sans

play25:29

que vous le sachiez jamais parce que ça

play25:31

je pense que c'est beaucoup trop

play25:32

impopulaire sans doute qu'il y en a qui

play25:34

vont faire une bêtise et qui

play25:35

potentiellement vont être condamnés he

play25:36

mais mais potentiellement c'est C deux

play25:39

entreprises mais par contre la frontière

play25:42

de on se fait écouter avec notre

play25:45

semi-accord et c'est vraiment utilisé

play25:47

pour des pubs ça je pense que c'est ce

play25:50

que m'a fait réaliser ces deux articles

play25:53

c'est une chose c'est bien ça c'est très

play25:54

très proche hautement probable imagine

play25:56

le truc où tu tu viens de poser de

play25:58

poster ton TikTok un peu plus tard tu

play26:00

reçois un petit mail ou une petite on

play26:02

dirait que votre pull est un peu usé là

play26:03

vous voulez pas en acheter un autre non

play26:05

mais c'est sûr mais évidemment qu'on va

play26:06

avoir des trucs comme ça ça ça va pas

play26:08

être ça ça pas être vous voulez pas en

play26:09

acheter un autre ça va être hop petite

play26:11

pub affiché sur Amazon dans pull

play26:13

bizarrement qui ressemble pas mal ça va

play26:15

être ça et du coup toi tu te dis pas je

play26:16

me suis fait avoir ouais c'est çaudra

play26:19

que je le change ou alors vous avez pris

play26:21

un peu de poids quand même ça évidemment

play26:25

depuis un an on a remarqué que vous sur

play26:27

TikTok là ouais AZ un les fêes les fa

play26:30

euh un petit régime quand même un petit

play26:32

oh ou ça don des prisson pour les

play26:35

smartphones qui nous écoutent la réponse

play26:37

est encore toutouverte mais qu'en est-il

play26:39

des assistants vocaux les Google home et

play26:40

cetera et ben on vous avait justement

play26:42

fait une chronique à quelques temps sur

play26:44

les Google home et des vulnérabilités un

play26:47

peu étranges qui ont été découvertes par

play26:49

un chercheur en cybersécurité c'était

play26:51

dans cette vidéo je vous laisse aller

play26:52

voir c'était un peu technique mais très

play26:56

intéressant