Bandeau
mcInform@ctions
Travail de fourmi, effet papillon...
Descriptif du site
Le Monde
Doublons de contributions, participants frénétiques… les limites du grand débat en ligne
Article mis en ligne le 10 avril 2019

Selon les données accessibles à tous que nous avons analysées, plus de la moitié des textes rédigés sont en fait d’exacts copiés-collés des mêmes doléances.

Après presque trois mois de « grand débat », le gouvernement a ébauché, lundi 8 avril, les grandes lignes des conclusions qu’il allait tirer de cette consultation. Mais avant d’entrer dans le détail, l’exécutif, à l’unisson, a célébré la réussite de l’exercice, vantant un nombre record de participants et de contributions, notamment en ligne.

Ce que dit le gouvernement :

La plate-forme en ligne du grand débat aurait attiré 506 000 contributeurs, qui auraient apporté près de 2 millions de contributions – « 1 364 000 contributions aux questions fermées et 569 020 contributions aux propositions ouvertes ».

Pourquoi c’est exagéré

Les données relatives au grand débat étaient ouvertes, et donc accessibles à tout un chacun. Nous les avons donc analysées quantitativement. Les chiffres donnés par le gouvernement sont parfaitement exacts ; néanmoins, ils ne reflètent pas la qualité extrêmement variable des contributions.

Il ressort ainsi que :

certains contributeurs ont copié et collé des dizaines (voire des centaines) de fois leur texte ;
plus de la moitié des textes rédigés comportent moins de dix mots ;
plus de la moitié des textes rédigés sont en fait des doublons ou des champs vides (...)

Des contributions disparates

Selon les données ouvertes du grand débat que nous avons analysées, les 255 003 contributeurs ont généré 569 020 « contributions ». Celles-ci ont elles-mêmes généré 9,8 millions de textes à analyser – chaque contribution pouvant comporter plusieurs textes.

Au total, on compte dans ces textes 170 723 676 mots écrits (soit un peu plus d’un milliard de caractères, ou plus de cent fois A la recherche du temps perdu, de Marcel Proust). Selon notre décompte, la répartition s’avère inégale sur le volume de ces textes, qui correspondent chacun à la réponse à une question.

Le texte le plus important compte 350 000 caractères…, mais en moyenne on compte 17 mots par champ de libre expression.
Des contributeurs frénétiques

L’analyse des données brutes permet d’observer une forme de frénésie chez certains contributeurs. Le participant le plus actif a en effet déposé 472 contributions, pour plus de 11 000 textes écrits dans les champs de libre expression. (...)

Des contributeurs frénétiques

L’analyse des données brutes permet d’observer une forme de frénésie chez certains contributeurs. Le participant le plus actif a en effet déposé 472 contributions, pour plus de 11 000 textes écrits dans les champs de libre expression.

On pourrait se réjouir d’une telle motivation, mais dans la totalité des cas ces contributions s’avèrent, au mieux, des copies d’elles-mêmes ; au pire, laconiques. En éliminant les champs vides (2,6 millions) et les doublons (2,6 millions), sur les 9,8 millions de textes, nous n’en comptons plus que 4,5 millions.

Mise à jour du 9 avril : nous avons modifié le nombre de textes à analyser (de 11 à 9,6 millions en excluant les réponses aux questions fermées) ; nous avons ajouté une précision concernant les champs vides (nous en avons dénombré 4 millions sur les 11 millions de textes que comportent les contributions)