Le hackathon de l’accessibilité numérique : rendre Captchas et PDFs plus faciles à utiliser

Les 11 et 12 février 2025, la DINUM (Direction Interministérielle du numérique) a organisé un Hackathon de l’accessibilité numérique.

Mais qu’est-ce qu’un hackathon ?

Selon la définition de Wikipedia :

« Un hackathon, marathon de programmation ou programmathon, est un événement durant lequel des groupes de développeurs volontaires se réunissent pendant une période de temps donnée afin de travailler sur des projets de programmation informatique de manière collaborative. C’est un processus créatif aux objectifs larges et variés souvent axés sur la proposition de solutions informatiques innovantes, l’amélioration de logiciels existants ou la conception de nouvelles applications dans le domaine des technologies numériques. »

L’objectif de cet événement était de travailler sur l’accessibilité de projets axés autour de deux thématiques complexes :

  • Les fichiers PDF, qui sont souvent difficiles à lire et qui sont peu accessibles ;
  • et les Captchas, (completely automated public Turing test to tell computers and humans apart), des tests qui permettent de déterminer si la requête est faite par un humain ou une machine. L’objectif des Captchas est d’empêcher les attaques par les robots et, de renforcer la sécurité du service. Mais les Captchas posent de gros problèmes d’accessibilité à beaucoup de personnes, et, en particulier, celles qui ont un handicap.

Chaque personne participant à l’événement était libre de proposer un projet autour de l’une de ces deux thématiques.

Cet événement était organisé par la DINUM (direction interministérielle du numérique) en partenariat avec le FIPHFP (Fond pour l’insertion des personnes handicapées dans la fonction publique) et le SIG (service d’information du gouvernement) à l’occasion du 20ème anniversaire de la loi du 11 février 2005 pour l’égalité des chances, la participation et la citoyenneté des personnes handicapées.

Contrairement à l’objectif du Hackathon classique, des personnes avec divers profils, développement, design, étudiantes et étudiants, utilisatrices et utilisateurs, ont travaillé ensemble pendant deux jours sur un projet de leur choix.

J’étais un peu sceptique sur l’issue de l’événement, ayant moi-même beaucoup de difficultés avec les Captchas. Je trouve aussi que la lecture de PDFs n’est pas facile, surtout lorsque le PDF n’est pas accessible.

Je me suis finalement prise au jeu et j’ai rejoint l’équipe des mozilliennes et mozilliens travaillant sur le projet PDF JS. Cette initiative permet de lire les PDFs dans Firefox au format HTML. Ayant toujours eu du mal à lire les PDFs dans un navigateur, ce projet m’intéressait particulièrement. Malheureusement, il n’a pas été sélectionné pour faire partie de la présentation finale car il existe depuis un certain temps. Pourtant, l’équipe a travaillé dur pendant ces deux jours pour corriger des bugs et améliorer l’accessibilité de la lecture de PDFs sous Firefox. Vous trouverez sur ce site une interview des personnes qui ont participé au projet PDF JS.

Résultats de l’Hackathon

7 projets ont été retenus. Leur travail a été évalué par un jury constitué de 9 personnes, issues du milieu associatif, mais aussi d’institutions gouvernementales.

1. Prisme

L’objectif du projet était de permettre la lecture de PDFs quand on voit mal ou pas l’écran.

Il s’agit d’une visionneuse alternative pour des PDF qui ne sont pas accessibles. Il est possible de modifier la taille du texte, changer les couleurs de la police et du fond. Un profil permet de paramétrer une fois pour toutes l’affichage du texte selon les besoins de la personne. Un module d’OCR (reconnaissance optique de caractères) permettra de traiter des images scannées.

2. Tesser’Hack

Le projet consistait à prendre un PDF image et le convertir au format texte. L’objectif était d’améliorer l’accessibilité du document. Il s’agira d’un service web. Le texte est reconnu. L’article est structuré en markdown. Les tableaux et images peuvent être reconnus et le texte est converti en format bureautique plus manipulable, tel que format docx ou ODT. L’alternative textuelle est incluse dans le pdf. Je n’ai pas réussi à comprendre si les tableaux pourront être rendus accessibles grâce à une liaison de chaque cellule avec ses en-têtes.

3. VerifPDF

Le projet a pour objectif d’aider les personnes qui créent des PDFs à les rendre conformes. L’outil balise le PDF et le transforme en HTML. Un rapport d’analyse indique les erreurs et comment les corriger. Il sera possible de modifier les propriétés, les balises, l’ordre de lecture. L’outil contient également un mode révision pour visualiser sur un seul document la structure du fichier et vérifier l’ordre de lecture.

Le projet permet de gagner du temps et de la fiabilité dans la production de PDFs en aidant l’utilisatrice ou l’utilisateur dans la fabrication du PDF. Il sera possible à la personne qui crée le PDF de déterminer si une image est informative ou décorative.

4. Docs x Albert

L’objectif du projet est d’utiliser l’Intelligence Artificielle (IA) pour faire une transcription au format markdown du document. Il est possible de poser des questions ou de donner des consignes à l’outil : y a-t-il des images ? Fais un résumé du document.

L’outil peut traiter les tableaux, les listes, les mises en page avec plusieurs colonnes.

5. Captch’Alt

Les Captchas posent des problèmes d’accessibilité, de sécurité et de respect de la vie privée.

Le but du projet est de faire en sorte que la personne n’ait plus à cocher une case pour indiquer qu’elle n’est pas un robot. La solution est basée sur du Javascript et peut être transposée.

6. CaptchEtat

Ce projet a été initié par l’AIFE (Agence pour l’informatique financière de l’État). L’objectif est d’améliorer l’existant et de le rendre plus accessible.

Ils ont tenté de prendre en compte les besoins de tous les handicaps. Il est possible de :

  • Lire l’audio du Captcha en boucle (pour laisser le temps à la personne de taper les informations entendues) 
  • De regénérer l’image avec d’autres couleurs.

7. GéoCaptcha

Il s’agissait d’un Captcha reposant sur les données géographiques. Le but du projet était d’en faire un Captcha agréable à utiliser.

Conclusion

Il a été intéressant de rencontrer des personnes motivées, prêtes à faire bouger les choses.

Le prix de la catégorie PDF a été décerné au projet VerifPDF.

Une mention spéciale du jury a été accordée au projet Prisme.

Dans la catégorie Captcha, c’est le projet Captch’Alt qui a reçu le premier prix.

Une mention spéciale a été décernée au projet Captchetat.

Merci à toute l’équipe de la DINUM de nous avoir accueillis et d’avoir rendu possible cet Hackathon. Lors de cet événement, j’ai fait des rencontres intéressantes. Je remercie également tout particulièrement les personnes qui ont travaillé sur le projet PDF JS. J’ai beaucoup apprécié leur accueil et mon intégration dans le groupe pour leur montrer ce qui est possible avec les différents lecteurs d’écran et ce qu’il faut améliorer.