Collecting (your) data

Si c'est gratuit, c'est que vous êtes le produit. La collecte de données personnelles est un business, et vous pourriez en être victime.

Collecting (your) data
Si c’est gratuit, c’est que vous êtes le produit !

Une donnée personnelle est une donnée qui se rapporte à une personne identifiée ou identifiable. Les données personnelles sont partout : la position GPS, les calories brûlées pour aller au travail ou encore le nombres d’heure de sommeil accumulées... Il s’agit d’une véritable mine d’informations quand on le rapporte au nombre d’objets connectés dans le monde ! “ Collecting data “, ou collecter des données, c’est donc récupérer ces données personnelles, ainsi que d’autres données, qui, regroupées ensemble, constituent le BIG DATA.

Quelques chiffres :

  • Il y a 30 milliards d’appareils connectés dans le monde
  • 29,000 Go sont créés chaque seconde en 2020
  • 171 milliards de dollars : c’est le chiffre d’affaire du Big Data en 2019

Concrètement, à quoi servent ces milliards de données ?

Photo de tiroirs
Photo by Jan Antonin Kolar on Unsplash

L’enjeu premier du Big Data est la transformation de données en business. Beaucoup d’entreprises se fondent sur ces données afin d’orienter leur politique, d’adapter un produit ou encore de faire une meilleure communication.

Utilisons un exemple très concret : les voitures. Il est possible d’installer un boitier sur une voiture afin que le conducteur puissent jouer avec ses propres statistiques : vitesse moyenne, nombre de kilomètres parcouru par jour, température… Cependant, l’assureur, lui, l’utilise afin d’affiner des profils types, établir des bonus ou des malus, et pour rédiger des contrats types.

Le Big Data est un moyen très efficace pour affiner la prise de décision. Et on ne parle pas que des assurances, mais aussi des banques, des entreprises de tout type, et même des États ! Nombreux sont ceux qui utilisent le Big Data au quotidien. Barack Obama et son équipe ont, par exemple, utilisé les données de masse et la simulation informatique afin d’orienter au mieux son discours lors des élections présidentielles américaines.

Le deuxième enjeu majeur de la collecte de données est d’ alimenter des bases données utilisées pour entraîner les systèmes d’intelligence artificielle. Les photos, les textes, les vidéos, les enregistrements vocaux sont autant de données utilisées. Les différentes techniques de Machine Learning ont besoin des données de masse pour que, in fine, les programmes s’exécutent avec précision.

Comment fonctionne le business de collecte de données personnelles ?

Pour les ordinateurs, tablettes et téléphones portables, le schéma de collecte de données est le suivant :

Schéma de collecte de données

Les flèches rouges représentent un transfert de données, les flèches vertes représentent un transfert d’argent.

La visite d’un site web ou d’une application a priori gratuite enclenche un processus monétisé qui fonctionne comme le schéma l’indique : le développeur crée un site web ou une application qui s’autorise à prélever des données personnelles sur l’appareil numérique (au moyen de cookies, d’acceptation des conditions générales d’utilisations, remplissage de formulaires, etc.). Ensuite, le développeur vend ses informations à une régie publicitaire : une entreprise qui traite les données, les trie et les revend à des entreprises qui pourraient être intéressées par des informations sur des clients/ potentiels clients afin de proposer des puns adéquats sur les différents sites ou applications.

Ce cercle a priori vertueux a des défauts, dont certains sont éthiques. D’abord, beaucoup d’utilisateurs ne se rendent pas compte des données qu’ils offrent. Ensuite, les applications et sites web prélèvent beaucoup de données supplémentaires, très souvent peu cohérentes avec l’activité du logiciel. Enfin, il existe beaucoup (trop) de régies publicitaires : nous ne savons plus qui possède quelles informations ! Le collecting data et le Big Data suscitent donc beaucoup de débats, notamment vis-à-vis de la protection des données personnelles pour la protection de la vie privée.

Clément G.