Méthodologie

Objet du projet

Après Allô Place Beauvau qui signale les violences policières, Allô IGPN qui scrute comment elles sont traitées par la police elle-même, Radio Police examine, d’un point de vue statistique, comment la police et le public en parlent.

Canal de communication ouverte, objet de séduction, de riposte et outil pédagogique, Twitter est un lieu de conversation prisé par un certain nombre de policiers (fonctionnaires, syndicats, institution elle-même), mais aussi par des partisans et/ou détracteurs et commentateurs des activités policières. Ensemble, ils traduisent une libération historique de la parole.
Suivre et tenter de cerner statistiquement ce phénomène inédit est le propos de Radio Police.

Quels comptes Twitter ?

Radio police propose une classification/un regroupement en deux catégories de l’expression de cette parole présente sur le réseau.

  • La catégorie des comptes police répertorie des particuliers (policiers et familles de policiers), des syndicats (certains véhéments, d’autres discrets) et l’institution elle-même (Intérieur, Direction générale de la police nationale, préfecture de police de Paris, gendarmerie, etc.).
  • La catégorie des observateurs est constituée par le public qui s’exprime sur ce sujet c’est-à-dire des citoyens, avocats, magistrats, collectifs, ONG, journalistes, sociologues, chercheurs, victimes et autres.

Nos critères

Les comptes doivent être actifs et publics. Les messages répertoriés doivent concerner la thématique des pratiques policières sans appréciation qualitative de son contenu. Ces collections sont mouvantes, au gré de l’activité du réseau (nouveaux comptes, comptes abandonnés).

Les listes : une fonctionnalité native de Twitter

Par essence, Twitter se base sur un système de listes affinitaires (comptes abonnés, comptes auxquels on s’abonne). Le réseau propose également de créer des groupes spécifiques de comptes Twitter.

C’est ainsi que nous avons avons créé la collection police et la collection observateurs.

Publique, chacune de ces listes devient une source permettant de faire de la veille d’information.

La carte des comptes « Qui parle à qui »

Elle permet de comprendre les forces du débat en présence : les comptes personnels qui interagissent, les comptes institutionnels qui se répondent, les gendarmes qui répliquent.

La trace de leurs relations, mise à disposition par les fonctionnalités de Twitter, permet d’établir une cartographie de ces interactions publiques, mouvante et éphémère. Les avatars représentant les comptes sont positionnés en fonction de leur plus ou moins grande proximité dans le graphe des échanges (méthode #{link_to "UMAP", "https://umap-learn.readthedocs.io/en/latest/", target: "_blank", rel: "noopener") et leurs interactions sont soulignées au survol de chaque compte par un trait qui indique qui s’adresse à qui.

La sélection des thèmes

Les thèmes relèvent de deux catégories : les thèmes de fond et les sujets d’actualité.

Les premiers font écho aux questions suivies par nos signalements Allô Place Beauvau : maintien de l’ordre, légitimité ou non de l’emploi de la force, doctrines à l’œuvre.

Les seconds révèlent les préoccupations du moment, aussi bien au sein de la police que parmi ceux qui l’observent.

Comment ça marche ?

Notre travail statistique/cartographique repose sur les tweets et retweets publiés depuis novembre 2018 (début Allô Place Beauvau) à partir des comptes de nos deux collections (cf. ci-dessus).

3 240Par compte Chaque jour sont ainsi relevés 3 240 tweets par compte (limite permise par Twitter). Les tweets sont regroupés par différentes techniques d’analyse automatique de la langue (segmentation, lemmatisation et étiquetage morphosyntaxique), de manière à transformer les mots en leur racine sémantique et à les filtrer en fonction de leur seul usage syntaxique.

Par ce procédé technique, sont identifiés des mots-clés des messages publiés (méthode CHI2), reliés à d’autres par des liens de similarité calculés d’après leur co-occurrence (méthode cosine) afin de calculer des « familles » de termes via un algorithme de détection de communauté (modularité selon Louvain).

55 L’exploration technique des espaces thématiques ainsi créés par le calcul a mis en exergue les thèmes de fond de Radio Police. Les sujets d’actualité sont, eux, déterminés en amont au fil des semaines.

Pour faciliter l’exploration de ces tweets, nous avons indexé leur contenu dans un moteur de recherche (Elasticsearch) qui permet de filtrer et de compter les tweets qui contiennent les mots d’un thème. L’interface visuelle est fondée sur ce moteur de recherche.

Le contenu des tweets, leur date de création, l’identifiant et l’intitulé du compte sont publics et relèvent de la responsabilité de leur auteur, qui a fait le choix de les publier sur Twitter . Nous ne collectons aucune donnée personnelle, aucune métadonnée de géolocalisation ni aucune information nominative.

La mise à jour s’effectue automatiquement et quotidiennement. Les tweets, repris in extenso, tels que publiés par leurs auteurs sur le réseau social, n’apparaissent pas plus de 72 heures après leur publication dans Radio Police.

Par ce travail, Mediapart propose une photographie statistique des débats actuels publics qui agitent la question policière.