Créer des voix de synthèse libres pour lecteur d'écran

Les lecteurs d’écran présentés par @Irina11y et @ljf durant le camp ont posé la question de l’offre libre autour de ce type de besoins.
Aussi j’aimerais savoir si vous avez des pistes d’outils libres qui permettraient de faire des voix de synthèse beaucoup plus sympathiques que celle des robocop habituels.

il semble qu’il existe des dépots sources proposant ce genre de chose, comme ceci

et aussi comment inclure ces modèles de voix pour que ça fonctionne avec Orca

si vous avez des pistes ou si vous souhaitez participer en donnant de la voix ou un coup de patte, go !

1 « J'aime »

Je viens de tester Svoxpico à l’instant et ça m’a l’air très bien.
cf la doc ici : https://doc.ubuntu-fr.org/svoxpico

Les anciens moteurs de synthèse vocale sous Linux sont vieillissants et loin d’être à la hauteur de ceux présents dans les autres systèmes d’exploitation.
Dans ce domaine, Android a apporté un peu de fraîcheur avec l’apparition du moteur picoTTS. PicoTTS a été créé par SVOX puis racheté par Nuance qui a plus ou moins abandonné le projet, certainement pour ne pas concurrencer son moteur TTS payant. Google, qui l’a choisi comme moteur de synthèse vocale (Text To Speech) pour Android 1.6 en 2009, continue de le développer sur son Dépôt GIT.

Selon NixOS il est sous licence Apache 2.

On peut rapidement le tester car il est packagé souvent, sous Nix :

nix-shell -p picotts
pico2wave -l fr-FR -w test.wav "Faites demi-tour dès que possible !";
vlc test.wav

La voix me semble assez proche de Kali qu’utilise @Irina11y :slight_smile:

J’essaye de voir rapidement si ça s’intègre à Orca !

3 « J'aime »

L’accessibilité sous Linux ça a l’air compliqué, dans ma configuration NixOS + Wayland + Sway, il n’y a rien d’installé par défaut et Orca ne marche pas « out-of-the-box ». Je continue mes recherches mais je viens de lire ce billet de blog sur la question que j’ai trouvé intéressant : Linux Accessibility: an unmaintained Mess

Edit 1 : un schéma de comment ça marche sous Linux + la doc
schéma qui montre comment gtk2/3, java, mozilla, qt4, qt5, et gt4 communiquent sur le bus at-spi dbus pour envoyer au final les informations à Orca

https://www.freedesktop.org/wiki/Accessibility/

Edit 2 : j’ai réussi à démarrer Orca et le faire parler un peu une fois at-spi2 d’installé et le daemon at-spi-bus-launcher lancé. Je confirme qu’on peut utiliser la voix pico depuis Orca

Me reste encore à trouver les raccourcis claviers et comment faire parler orca mais j’ai le setup de base c’est un début…

3 « J'aime »

Je suis trop contente que ça a l’aire de vous motiver !

Pour les racourcis claviers, s’il n’ont pas été modifiés dans les paramètres, c’est ici
https://help.gnome.org/users/orca/stable/commands.html

4 « J'aime »

Mais… mais… mais… c’est INCROYABLE :smiley: merci de regarder ça :pray:
J’ai réussi à installer pico et à convertir un texte en audio, par contre je comprends pas comment l’intégrer à Orca - tu m’as perdue à partir du moment où tu mentionnes at-spi2 :innocent:

Pardon, à partir du moment où tu as pico d’installé, Orca devrait te le proposer dans les paramètres, comme dans ma capture d’écran. C’est donc une option à changer, tu sais comme quand on testait les voix pendant le camps et qu’il y avait que espeak avec la voix robotique - normalement une nouvelle option devrait être là, nommée pico !

at-spi2 c’est juste pour info, tu peux zapper !

Et oui pas évident sur les distributions et les bureaux ou ca n’est pas pris en compte par défaut.
Autant vous dire que les non-techs ne vont même pas esseyer.

Intéressant et je ne connais pas tout cela.
Mais par contre est-ce qu’il y a des actions que l’on peut faire pour simplifier la chose pour toutes les distributions et que cela soit accessible pour les néophytes.
Car ça aurait déjà de l’intérêt…

Je dirais, aller chez les gens qui gèrent les distribs, sensibiliser au sujet, leur faire comprendre que c’est important et surtout se rassembler pour montrer qu’on représente quand-même un poid non négligeable. Y a un gros besoin de formation dans le domaine, je pense.
Si vous avez la main pour travailler dirrectement dans une distrib, ce qui serait cool ça serait que tous les paquets nécessaires à l’accessibilité soit installer par défaut et que toutes les options et logiciels soit facillement activable, y compris dans l’installeur.

Après adapter tous les logiciels qui sont innutilisables, c’est un énorme taf et ça demande carrément un autre niveau d’investissement, à pare quand c’est juste quelque détails à modifier.

1 « J'aime »

Et si non il manque aussi pas mal de documentation, de traduction, rassembler les ressources ETC…

1 « J'aime »

On viens de me parler de coqui-ai/STT mais c’est encore expérimentale et pas encore intégré à Orca.

Bonjour à tous et toutes, je suis ce flux avec grand intérêt. Hébergeant pas loin de 500 sites et tous loin d’être accessible et ayant 10 postes informatiques pour le grand public.

Du coup est ce qu’il y a une ou des distributions recommandés ?

Chez Infini on réinstalle notre salle PAPI avec de un changement de machines et réinstallations des OS donc autant bien faire dès le début.
Le site évoqué plus haut est has-been et on le retravaille avec un CMS (Évidemment c’est du SPIP), mais du coup si vous voulez faire des retours quant à son accessibilité c’est le bienvenu. Adresse de travail du nouveau site :

Pour ne pas polluer ce fils vous pouvez faire les retours ici :

Je suis en train de faire des tests avec Ubuntu LTS 22.04, pour l’instant impossible de choisir svox pico dans Orca (bref d’utiliser la jolie voix), mais je compte bien régler ce problème ! Mais sinon, le reste fonctionne. On peut activer Orca avec alt + super (touche windows) + S au démarrage de Ubuntu.

Sur mon PC portable, impossible par contre d’ouvrir les paramètres de Orca avec le raccourci clavier par défaut (Orca Mod + espace) car ce dernier est configuré en mode bureau et donc assigne Orca Mod = Insert. Pour contourner, j’ouvre un terminal et lance orca --setup puis sur la page qui s’ouvre tout en haut, je passe en disposition « Ordinateur portable ». Je valide avec OK et maintenant je peux facilement ouvrir les paramètres avec Verr Maj. + espace.

Firefox ne fonctionne pas instantanément avec Orca, il y a une astuce : le relancer, et tout marche après.
Si votre système est récalcitrant, je vous encourage donc à créer une clé USB Live Ubuntu 22.04, ça devrait marcher pareil que moi !

1 « J'aime »

Je viens de faire le test de mon coté sur une Debian Bullseye.
Orca est installé de base sur la distribution avec Gnome.

Pour voir la config de base :

orca -s

Par défaut il y pas mal de voix mais pas Pico

Pour installer Pico, il faut ajouter les dépots non-free et installer ceci
Puis éditer /etc/speech-dispatcher/speechd.conf et activer le module Pico

apt-get update
apt-get install libttspico-utils libttspico0 speech-dispatcher-pico

vi /etc/speech-dispatcher/speechd.conf
/pico => entrée
supprimer le # pour activer le module pico
:wq => entrée

Et ça fonctionne plutot pas mal, d’après mes premiers tests sur Firefox ESR.

La documentation est plutot bien faite :
https://wiki.debian.org/Accessibility/Orca
https://wiki.debian.org/fr/accessibility
https://help.gnome.org/users/orca/stable/introduction.html.fr

1 « J'aime »

Vous pouvez aussi essayer avec MBROLA

C’est en License.GNU Affero General Public.

Possible qu’Orca soit installé de base avec Gnome sur toutes les distrib qui supportent ce bureau, à pare peut-être sur des instals minimalistes.

Y a une autre voix disponnible qui s’appelle MaryTTS
http://mary.dfki.de/
J’ai écouté un peut sur leur site ce que ça donne, les voix allemandes sont pas mal mais les françaises sont bisares je trouve.

tiens j’ai un site qui ne fonctionne pas pour MaryTTS

Ben non j’ai bien installé pico mais ça apparaît pas dans la liste, j’ai que « synthétiseur par défaut », « espeak-ng-mbrola » et « espeak-ng » :frowning:
J’ai lu les autres posts qui expliquent un peu comment arranger ça mais franchement ça me pique les yeux je comprends pas :sob:

Hello Margaux

A-tu réussis à faire fonctionner PicoTTS ? Sinon on peut se prévoir une visio pour essayer de résoudre le problème ensemble.

Il semble qu’il y ai une nouvelle PR dans orca qui pourrait permettre de supporter d’autres voix: micmic3 et piper

https://rhasspy.github.io/piper-samples/

On a rediscuté de pico avec irina et un soucis semblait (si c’ets bien la bonne voix) que le mode accéléré de la voix était plutôt mauvais.

Le nouveau repo de coqui: GitHub - coqui-ai/TTS: 🐸💬 - a deep learning toolkit for Text-to-Speech, battle-tested in research and production

3 « J'aime »