Cabinet d’avocats franco-belge, moderne et humain,
au service de la création et de l’innovation

9 pôles d’activités dédiés au
droit de la création et de l’innovation

Nos activités scientifiques & académiques

Faisons connaissance !

Un procès en vue ?
Lisez le guide destiné à mieux vous préparer

Le portail du droit des technologies, depuis 1997
Powered by

Un site pour tout savoir sur le RGPD
Powered by

Cambridge Analytica : comprendre le dossier en 5 minutes

Publié le par

Le scandale Cambridge Analytica devient petit à petit le scandale Facebook. Que s’est-il passé ? Comment la société a-t-elle pu profiler des dizaines de millions de personnes ? Sa méthode est-elle révolutionnaire ? Quels sont les enjeux ? Quelles sont les questions juridiques. Cinq minutes pour comprendre le dossier.

Ce que l’on sait …

La firme Cambridge Analytica a mis en place un questionnaire psychologique d’apparence anodine. Comme elle était un partenaire agréé par Facebook, elle a pu proposer ce questionnaire aux utilisateurs du réseau social.

En réalité, l’application de Cambridge Analytica poursuivait une autre visée :

  • elle récupérait les données facebook de toute personne répondant au questionnaire ;
  • elle récupérait également au passage, les données facebook des amis de la personne répondant au questionnaire.

Cela a permis à Cambridge Analytica de récupérer les données de 87 millions d’utilisateurs alors que 270.000 personnes (seulement) ont répondu au questionnaire. C’est un rapport moyen de 1 à 322, c’est-à-dire que pour 1 personne répondant au questionnaire, l’application a accédé en moyenne aux données de 321 autres personnes (les « amis » de celui participant au sondage).

Cambridge Analytica disposait par ailleurs d’autres bases de données ou d’autre sources d’informations. Elle a agrégé toutes les données sur le modèle du big data, ce qui lui a permis de dresser un profil individuel de chaque personne. En d’autres termes, elle a converti des données brutes dont elle disposait en quantité, en un profilage des personnes concernées (voir la méthode ci-dessous).

Ce profilage a notamment été utilisé dans le cadre des élections américaines par le staff de campagne de Donald Trump.

C’est un lanceur d’alerte, ex-employé de la société, qui a révélé et dénoncé le système.

Ce que l’on ne sait pas …

Quelles sont les données facebook auxquelles Cambridge Analytica a accédé ?

On sait qu’il y l’identification (nom, prénom), la date de naissance, les données de localisation, les pages facebook visitées/likées, mais y en a-t-il d’autres ?

Cambridge Analytica disposait par ailleurs d’autres bases de données ou sources d’informations. Lesquelles ? D’où venaient-elles ? Quelles étaient les infos qui y figuraient ? C’est important car en matière de profilage, le croisement des données est une des clés du succès.

Facebook savait-elle ?

C’est une question vivement débattue. Le réseau social se dit victime d’un partenaire indélicat, et a du reste immédiatement retiré l’agrément à Cambridge Analytica.

Le problème, c’est qu’il vient de retirer l’agrément à une autre société qui faisait peu ou prou la même chose (cubeyou), et qu’il y en aura peut-être d’autre.

Si cela se multiplie, le risque pour facebook est d’être acculée à l’alternative suivante : soit la société savait auquel cas elle est complice, soit son système est une passoire auquel cas elle manque de sérieux, mais dans les deux cas son image serait durablement ternie et sa responsabilité pourrait être mise en cause.

La campagne de Donald Trump ?

Cambridge Analytica était un des partenaires de la campagne de Trump. Qu’elle était exactement son rôle ? Trump (ou son staff) savait-il que les données avaient été collectées illicitement ? Quel est le lien avec la manipulation supposée de l’élection US par la Russie (des partenaires de Cambridge Analytica seraient russes ou auraient des intérêts en Russie).

D’autres manipulations ?

Cambridge Analytica aurait été un partenaire de la campagne pour le Brexit. Qu’ont-ils fait exactement ? D’autres campagnes ont-elles été manipulées (on parle d’un test grandeur nature au Kenya) ?

Le profilage façon Cambridge Analytica

Depuis toujours, les hommes politiques adaptent leur discours à leur audience : homme ou femme, cadre ou ouvrier, Paris ou la province, … le message sera adapté au public puisque le but est de le convaincre.

L’idée maitresse de Cambridge Analytica est que cette segmentation est largement inefficace : toutes les femmes, tous les cadres, ou tous les parisiens ne sont pas pareils. Pourquoi dès lors leur adresser un message fondé sur pareil critère ?

Pour la société, Il faut ajouter à cette segmentation liée au genre, à la situation économique ou à la localisation de l’individu, une couche supplémentaire liée à la personnalité de chaque personne.

Elle a mis au point un modèle fondé sur 5 critères (modèle OCEAN) :

  • Openess : suis-je ouvert aux nouvelles expériences ? (imaginatif vs. conventionnel)
  • Conscientiousness : est-ce que j’aime les choses planifiées, organisées ou plutôt l’aspect spontané voire aventureux ?
  • Extraversion : est-ce que j’aime passer du temps avec les autres ou suis-je plutôt un solitaire ?
  • Agreeableness : comment vais-je équilibrer mes besoins s’ils entrent en conflit avec le besoin des autres ou de la collectivité ? (confiance, compétitif, résilience)
  • Neuroticism : ai-je tendance à m’inquiéter, être angoissé ?

Par ailleurs, la société a injecté dans ce modèle un critère de « persuasion » : la personne-est-elle sensible aux messages qu’elle reçoit ? En d’autres termes, s’agit-il d’une personne susceptible d’être convaincue si elle reçoit le bon message, au bon moment, via le bon canal ?

Le résultat est bluffant :

  1. Les données objectives (démographiques, géographiques, ethniques, etc.) sont disponibles : âge, sexe, ethnie, religion, diplômes, revenus, patrimoine, localisation, statut socio-économique, composition familiale, etc.
  2. A cela s’ajoute une couche comportementale qui existe depuis longtemps : sensibilité à la publicité, sensibilité à la marque ou au prix, tendance en termes de mobilité, style de vie ou de consommation, engagements dans la société, etc.
  3. Le profilage individualisé de Cambridge Analytica ajoute la personnalisation: qui suis-je moi, individu différent de tout autre individu ?

L’addition des trois est une forme de big data amélioré.

Concrètement et en schématisant :

  • La segmentation traditionnelle permet de savoir que Paul et Jacques sont des hommes, âgés de 45 ans, éduqués, dynamiques et avec un niveau de revenus confortable.
  • Il découle du point précédent qu’ils sont tous les deux des candidats idéaux pour l’achat d’une voiture électrique.
  • Grâce au profilage fondé sur son modèle OCEAN, Paul est identifié « 25 O, -21 C, -10 E, 17 A et 20 N », tandis que Jacques est « 17 O, 7 C, 20 E, -5 A et -10 N ».Traduction : Paul est ouvert aux expériences, conscient des besoins de la société et plutôt inquiet ; Jacques est ouvert aux expériences, organisé et plutôt extraverti.
  • Les outils de communication personnalisés permettent de s’adresser directement et individuellement à Paul et Jacques, qui sont pourtant voisins de palier dans le même immeuble.
  • Tout ceci mis ensemble, Paul et Jacques vont recevoir, via les réseaux sociaux, des bannières sur leur site sportif préféré, et des publicités ciblées sur leur TV interactive, un message adapté à chacun. On va leur vendre la même voiture, au même prix, mais avec des arugments différents : Paul sera sensibilisé par des arguments écologiques d’une voiture électrique (émission de CO2) ou liés à la responsabilité vis-à-vis des générations futures, tandis que Jacques sera informé de la vitesse d’accélération et va recevoir un message émotionnel relatif au plaisir de conduire et à l’image du conducteur d’une voiture électrique.

La même chose sera effectuée pour tous les « clients » de Cambridge Analytica, y compris lorsque ledit client est un candidat aux élections américaines. Pour envoyer un message pro-armes, Monsieur va recevoir un message insistant sur la tradition, l’histoire américaine et la transmission des valeurs aux enfants, tandis que son épouse va recevoir des éléments chiffrés sur le nombre d’agressions dans le quartier où elle fait ses courses et les écoles de tirs où s’entrainer. Leur enfant majeur qui vit avec eux va recevoir un troisième message, encore différent, insistant cette fois sur le poids de l’indutrie en termes économiques. Un même but (soutenir le lobby pro-arme), mais des messages différents adaptés à la personnalité du destinataire. Et ainsi de suite avec tous les sujets discutés lors d’une élection …

Les problèmes juridiques

Les questions juridiques sont nombreuses mais on peut en relever certaines plus évidentes que d’autres.

Si l’on anticipe sur le GDPR qui entre en vigueur le 25 mai prochain (le régime actuel est sur ce point relativement similaire), les données à caractère personnel doivent être (notamment) :

  1. traitées de manière licite, loyale et transparente au regard de la personne concernée ;
  2. collectées pour des finalités déterminées, explicites et légitimes, et ne pas être traitées ultérieurement d’une manière incompatible avec ces finalités ;
  3. adéquates, pertinentes et limitées à ce qui est nécessaire au regard des finalités pour lesquelles elles sont traitées.

Par ailleurs, le responsable du traitement doit informer la personne concernée de toute une série de choses (notamment l’identité et les coordonnées du responsable du traitement, les finalités du traitement, les destinataires des données, etc.).

En collectant les données facebook de la personne participant au sondage sans le lui dire (ou sous couvert de conditions générales discrètes), Cambridge Analytica a violé ces principes.

En collectant au passage les données des amis de la personne participant au sondage, Cambridge Analytica se rend coupable d’une violation plus grave encore vis-à-vis de celles-ci.

En croisant les données pour un profilage précis et en les réutilisant à des fins commerciales ou politiques qui sont incompatibles avec la finalité de départ et sans avoir l’accord des personnes concernées, Cambridge Analytica a violé plusieurs règles.

Enfin, en n’ayant pas informé les personnes concernées de l’existence du traitement et de leurs droits, Cambridge Analytica a violé son devoir d’information.

Plus d’infos ?

En regardant la vidéo du patron de Cambridge Analytica, du temps où il était considéré comme un gourou du marketing.

Droit & Technologies

Soyez le premier au courant !

Inscrivez-vous à notre lettre d’informations

close

En poursuivant votre navigation sur notre site, vous acceptez l’utilisation de cookies afin de nous permettre d’améliorer votre expérience utilisateur. En savoir plus

OK