La CNIL s’empare de l’affaire Benalla

Publié le 14/08/2018 par Etienne Wery

Une étude belge a analysé les tweets consacrés à l’affaire Benalla, notamment en classant les émetteurs des messages en fonction de leur appartenance politique supposée. Inondée de plaintes, la CNIL ouvre un dossier. Et si, à la réflexion, toute cette gesticulation n’était qu’un feu de paille ?

L’affaire Benalla est le feuilleton politico-médiatique de l’été. Sur les réseaux, ce sont des millions de posts, tweets et autres likes qui ont amplifié le phénomène, au point d’attirer l’attention d’une association belge qui entend lutter contre la désinformation.

Le constat de l’association : « l’affaire Benalla a occupé Twitter en ce mois de juillet dans des volumes que nous n’avions presque jamais croisés auparavant. Ce volume a également été fortement amplifié par un petit nombre de comptes. »

D’où la question suivante : « Nous nous posons alors la question : comment s’exerce cette hyperactivité ? S’agit-il de partages militants ou est-ce également un gonflage numérique contaminé par de la désinformation ? »

Les résultats de l’étude

Les résultats complets de l’étude sont disponibles sur le site de l’association. En résumé, selon l’étude :

En moins de trois semaines, 4,5 millions de tweets en français ont été échangés par 247.701 auteurs différents, ce qui en fait un phénomène tout à fait exceptionnel ;
Près de la moitié des contenus (47%) ont été générés par 1 % des acteurs (ceci exclut les médias) ;
Parmi ces comptes hyperactifs, certains le sont encore plus que d’autres : moins de 500 acteurs ont publié près de 800.000 tweets ;
Les 1 % les plus actifs présentent des caractéristiques troublantes : activité hors norme sur certains sujets très politiques et sensibles, activité concentrée à certains moments spécifiques (élections, crise), mass following dans le but d’augmenter la visibilité des tweets, pratique fréquente du pseudonyme ; information géographique du compte souvent manquante ; 27 % d’entre eux ont des liens avec des médias officiels russes suspectés de désinformation et près de 10% d’entre eux ont été identifiés dans le passé comme relayant sciemment des campagnes de désinformation.
Au moins trois comptes utilisent un système de tweets automatisés ou semi-automatisés.

Filtrage politique ?

C’est la suite de l’étude qui a créé la polémique. En effet, les chercheurs ont tenté de classer les auteurs de tweets en quatre catégories :

Les souverainistes, LR et proches des mouvements contre le mariage pour tous ;
La communauté du rassemblement national, des souverainistes et quelques personnes des mouvements contre le mariage pour tous ;
La communauté constituée par la France insoumise avec des porosités de lien avec les autres communautés qui occasionne quelques faux positifs ;
La communauté constituée des médias et des porosités avec les autres communautés, et LREM.

L’étude se penche alors sur le comportement spécifique de chacune de ces catégories. Par exemple, la catégorie 3 serait une des plus actives mais aussi une des moins susceptibles de désinformer, tandis que les catégories 1 et 2 seraient plus à risque sur le plan de la fiabilité de l’information et utiliseraient des comptes automatisés.

Dans un premier temps, les auteurs de l’étude ont rendu accessibles les données brutes sur lesquelles ils ont travaillé. L’idée était de permettre à quiconque de vérifier la méthodologie et la fiabilité des enseignements tirés. On a donc des fichiers Excel qui circulent contenant une liste de pseudonymes, le nombre total de tweets, et des informations permettant de positionner le compte sur l’échiquier politique.

Cette initiative s’est fortement retournée contre les promoteurs de l’association qui ont depuis lors cessé la mise à disposition des données brutes.

La CNIL saisie de l’affaire

Dans un communiqué, la CNIL confirme qu’elle « est actuellement saisie d’un nombre important de plaintes concernant les conditions dans lesquelles EU DisinfoLab a effectué une étude sur certains messages publiés sur le réseau Twitter relatifs à l’affaire BENALLA.

La collecte et le traitement de données à caractère personnel sont soumis au RGPD (Règlement Général sur la Protection des Données), qui protège tout particulièrement les données relatives aux opinions politiques des personnes. L’ONG à l’origine de l’étude étant située en Belgique, la CNIL instruira les plaintes dont elle a été saisie dans le cadre de la coopération européenne instaurée par le RGPD. »

Plusieurs voix se sont élevées, pour dénoncer un fichage. Parfois, la virulence de la critique confine à l’insulte. Jean-Luc Mélenchon se fend ainsi d’un élégant : « Eh stupide barbouze ! Je ne suis pas un bot russe. C’est juste moi, Mélenchon, qui tweete contre toi ! Si t’as besoin de me ficher pour t’en rappeler, c’est que tu es encore plus bête que tu en as l’air. Signé matricule 14452. »

Quand la meute hurle ensemble, le recul s’impose. Le dossier est terriblement complexe et pose des questions absolument fondamentales sur le plan démocratique. Réagir avec les tripes et prononcer des jugements à l’emporte-pièce n’aidera pas beaucoup. C’est dans la réflexion, l’analyse et le temps que l’on verra si l’initiative et licite ou non.

GDPR et liberté d’expression

L’article 85 du GDPR est malheureusement trop souvent passé sous silence : « Les États membres concilient, par la loi, le droit à la protection des données à caractère personnel au titre du présent règlement et le droit à la liberté d’expression et d’information, y compris le traitement à des fins journalistiques et à des fins d’expression universitaire, artistique ou littéraire. »

C’est donc aux Etats qu’il appartient d’établir un équilibre entre des valeurs tout aussi respectables l’une que l’autre. (A noter que la Belgique, à la traine, n’a pas encore adopté sa loi …)

GDPR et consentement

Les titulaires des comptes analysés par l’étude, n’ont pas consenti au traitement qu’engendre l’étude.

Et alors ? Le consentement n’est qu’une hypothèse de légitimité parmi d’autres. Condamner au motif que « En l’espèce, les abonnés de Twitter n’ont jamais été sollicités par EUDisinfoLab pour donner leur consentement à l’enquête » est donc un raccourci erroné s’il y a une autre base de licéité, tel par exemple l’intérêt légitime poursuivi par le responsable du traitement.

GDPR et données politiques

L’étude contient un volet dans lequel les auteurs des comptes sont positionnés sur l’échiquier politique. Pour ce traitement-là, des règles spécifiques s’appliquent.

Une des règles spécifiques veut que la poursuite d’un intérêt légitime, qui peut justifier de façon générale un traitement, n’est plus une hypothèse de licéité pour les données « sensibles » (dorénavant on dit « particulières »).

Mais à nouveau, en déduire qu’il faut un consentement est un raccourci erroné. Même en présence de données sensibles, il y a d’autres hypothèses de licéité, notamment :

Le traitement porte sur des données à caractère personnel qui sont manifestement rendues publiques par la personne concernée (contrairement à Cambridge Analytica avec laquelle il n’y a pas de parallèle à faire, les traitements ont porté sur des données mises en ligne par les auteurs des tweets sans restriction de diffusion) ;
Le traitement est nécessaire pour des motifs d’intérêt public important (la liberté d’expression et d’information, a fortiori au sujet d’un débat d’intérêt général, doit être prise en compte) ;
Le traitement est nécessaire à des fins de recherche scientifique ou historique ou à des fins statistiques.

Débat d’intérêt général

Dans le jargon des droits fondamentaux, opposer la protection des données d’un individu à la liberté d’expression d’un autre, revient à créer une « ingérence » dans la liberté d’expression.

Le fait qu’il y ait une ingérence n’est pas problématique en soi pour autant que celle-ci respecte un certain nombre de principes, notamment :

Constituer une mesure nécessaire, dans une société démocratique, à (…) la protection de la réputation ou des droits d’autrui (…).
Être « proportionnée » et « respecter le contenu essentiel » de la liberté invoquée.

Si l’on analyse la jurisprudence de la cour (CEDH, Strasbourg) on constate qu’il est tout à fait exceptionnel d’admettre une ingérence dans la liberté d’expression lorsque le sujet abordé relève de ce que l’on appelle l’intérêt général.

Or, dans le contexte actuel de la problématique de la désinformation sur Internet, et des ingérences russes supposées ou réelles dans certains processus démocratiques, il est probable qu’un juge admette que l’exercice auquel s’est livré l’association relève d’une contribution à un débat d’intérêt général.

À cet égard, on soulignera que la proximité de l’association avec tel pays, tel mouvement politique ou telle entreprise, est totalement irrelevante. On l’a déjà dit, mais il faut le répéter : la liberté d’expression n’a de sens que si elle protège les propos qui dérangent. Une liberté qui se limiterait à pouvoir dire que tout le monde est beau et gentil perdrait vite de sa saveur …

Thèmes	RGPD, vie privée et données personnelles
Tags	#cnil/CPVP#données particulières#données personnelles#journaliste#liberté d'expression

La CNIL s’empare de l’affaire Benalla

Les résultats de l’étude

Filtrage politique ?

La CNIL saisie de l’affaire

GDPR et liberté d’expression

GDPR et consentement

GDPR et données politiques

Débat d’intérêt général

Publié dans

Auteurs

Etienne Wery

La CNIL s’empare de l’affaire Benalla

Les résultats de l’étude

Filtrage politique ?

La CNIL saisie de l’affaire

GDPR et liberté d’expression

GDPR et consentement

GDPR et données politiques

Débat d’intérêt général

Publié dans

Auteurs

Etienne Wery

Soyez le premier au courant !

Soyez le premier au courant !