Texto a voz no funciona, la función parece estar pero con errores

Hola.

Acabo de inscribirme en el foro, así que aprovecho a saludar a todos.

Tengo que hacer un paréntesis para decir que estoy publicando en esta sección “Topics” porque no se me permite publicar en la sección “Español”, que era mi intención. supongo que tiene que ver con la cosa esa de la “confianza” (que me disculpen todos, no tengo mucha experiencia en foros).
No sé si “Topics” es sólo para mensajes en inglés, en cuyo caso, si se puede trasladar mi mensaje a la sección de mensajes en español, lo agradecía. Perdón por la molestia

El motivo por el que me he inscrito es que tengo algunos problemas con mi instalación de Opensuse Tumbleweed, y antes de considerar que sean problema de KDE y escribirles un informe de fallos he pesado que quizá sean fallos en mi instalación, paquetes que me faltan o mala configuración.

Tengo entendido que el protocolo en los foros es escribir un solo mensaje por cada problema en vez de un mensaje contándolos todos, aunque el texto esté bien estructurado y separado. Así que voy con el primero y ya escribiré los demás en mensajes independientes.

Cada vez que intento escuchar en voz alta algún PDF, correo, etc, me sale una voz como la del sintetizador de Stephen Hawking en los 90 que habla en un inglés incomprensible (especialmente para mí, que no hablo inglés :sweat_smile:). Creo que dice algo como: «… your nosequé is working nosecuántos… please otra cosa incomprensible… problem… ash… ash… ash… log…», o algo así.
¿Alguien sabe qué está diciendo?, o mejor, ¿alguien sabe qué hay que hacer para que Okular, Kmail, Calibre y otros lean en voz alta y con una voz comprensible tanto por el idioma como por la calidad del sonido?
Tengo la instalación por defecto de Tumbleweed salvo los programas de usuario que he instalado, pero no he tocado nada del sistema, creo :grimacing:. ¿Tal vez Tumbleweed no viene con todos los paquetes necesarios y me falta algo por instalar o configurar? En mi móvil Android “desgoogleado”, por ejemplo tuve que instalar la apli SherpaTTS, un sintetizador de voz. ¿Puede ser que en Tumbleweed haya que hacer lo mismo?

Gracias y saludos.

PD: Pues al ir a mandar mi mensaje sí se me ha permitido decir que se publique en el foro hispano. Había intentado publicarlo desde la categoría “Español” que aparece en el panel de la izquierda de la página, pero el botón para escribir un mensaje nuevo estaba desactivado. En fin, misterios de la técnica.

Hola a tod@s ,¿que aplicación utilizas de texto a voz?, en discorver te salen dos ,Crow Translate , KMouth.
Creo que hay alguno mas ,seguro que los compañeros que saben mas que yo te pueden ayudar.
Te damos la bienvenida.

Saludos

Hola @Chusa , recibe nuestra bienvenida al foro de openSUSE en castellano. Tenemos un tema en el que la gente recién llegada puede presentarse, por si quieres hacerlo: Presentaciones

No estoy seguro dónde o cómo publicaste, o cómo has visto la traducción. En cualquier caso, está en el lugar correcto :wink:

Sobre el asunto, sí, supongo que la instalación y configuración básica que traerá será en inglés y que habrá que configurarlo adecuadamente, o incluso cambiar el backend. Yo no tengo experiencia con esto, a ver si aparece alguien que lo lleve mejor.

Pues no tengo ni idea :sweat_smile:. La que venga de serie con Tumbleweed. ¿Sabes cómo puedo averiguarlo?

Kmouth parece más bien un programa para pegar un texto y que lo vocalice, no? Mi interés es más poder escuchar mi correo, libros y documentos directamente desde Kmail, Okular, Calibre, etc, que ya tienen incorporada la función de TTS para leer en voz alta directamente desde ellos, podéis comprobarlo cualquiera (y de paso podéis decirme si a vosotros os funciona :sweat_smile:), mientras hago tareas que no impliquen leer (por ejemplo revisar y retocar fotos) porque leer y escuchar palabras a la vez no funciona muy bien, en eso nuestro cerebro es monotarea y no me entero ni de lo que leo ni de lo que escucho; pero hacer una tarea que no ocupe “recursos cerebrales” dedicados de la comprensión del lenguaje mientras escucho una locución, es perfectamente factible y me permite “leer” libros y documentos que de otra forma me ocuparían un tiempo extra que por desgracia no me sobra.
En Firefox uso un complemento que se llama Read Aloud para que me “recite” páginas web, y EpubReader, que permite abrir Epubs en el navegador y se comunica con Read Aloud para recitarlos. Usa la voz de Google, que no es la mejor, pero se entiende bien, y los fallos son tolerables; muchísimo mejor que esa voz “de lata” que viene por defecto en Tumbleweed y además habla en inglés americano.
Ese es mi flujo de “trabajo” actualmente para estos menesteres, pero puesto que tanto como Okular como Calibre incorporan la función TTS (adjunto pantallazos de Okular), preferiría no tener que tirar de chapucillas, aparte de que requiere conexión a Internet.

Crow Translate es un traductor, por lo que veo, con sintetizador de voz, y que parece funcionar pegando texto también, como Kmouth.
El problema creo que no es la propia función TTS, que como digo ya está presente en varios programas, sino el sintetizador. Sospecho que me falta un programa sintetizador de voz que esté internacionalizado y pueda elegir más idiomas que el inglés. En Android fue fácil encontrar e instalar uno, pero para Linux no sé; veo algunos por Internet (Espeak, Flite otros), pero parecen proyectos muy viejos y poco amistosos de configurar.

Gracias por las sigerencias, de todas formas.

PD: He amagado de instalar Kmouth por ver si me tiraba de alguna dependencia que fuese el sintetizador de voz, pero no, por lo que supongo que estaría en las mismas: le pegue el texto que le pegue me soltará la misma parrafada en inglés incomprensible o en el mejor de los casos me leería el texto con esa pronunciación y ese sonido noventero.

Se dice backend entonces… supongo que me servirá para intentar buscar una solución, pero entre que mi ingles va poco más allá de poder pedir una cerveza cuando estoy de vacaciones por algún sitio donde el personal no habla español y que la mitad de las veces la búsquedas acaban convirtiéndose en una pesadilla de horas para al final no sacar nada en claro, pues prefería preguntar aquí por si alguien había tenido el mismo problema que yo.

Supongo que m tocará tirar de traductor y preguntar en el foro “anglo”. Además spongo que los desarrolladores de Opensuse estarán más por ahí o por el alemán que por el hispano. ¿O en este foro sólo participan usuarios?.

Gracias

Se me olvidaban los pantallazos, y la apli del foro me dice algo así como que tengo que subir sólo una imagen por cada mensaje, así que aquí va una…

… y aquí la otra. Esta es del menú contextual que aparece al seleccionar texto y pinchar con el botón derecho:

Hola Chusa, perdón he estado liado un par de días y no he mirado nada de correos o foro ,la verdad es que no se nada del tema,me interesa el hilo, ya que al llevar un par de horas se me cansa la vista y no estaría mal que me leyera un pdf o un correo y demás .
estaré atento al hilo a ver si lo resuelves,recuerdo haber tenido un hace mucho tiempo, pero no recuerdo si era de firefox o kde , ni recuerdo como lo hice ,pero se podía poner un voz femenina o masculina y en aquellos tiempo tenia uno de robot para vacilar.
Siento mucho no poder ayudarte

Saludos


¿Tienes instalado espeak?
La verdad que habla como Hawking pero por lo menos lo habla en español…

Hola de nuevo ,he visto algunos programas mas:
Voice Gen
Speech note
lectura
lo puedes instalar desde Discover

Saludos

Robótico (como decía @nemonix) pero se entiende. Para ello, he instalado el paquete espeak-ng (tiene docenas de voces).

Saludos

Yo tengo instalado espeak-ng pero al seleccionar speechd no puedo seleccionar ninguna “voz” ¿qué más hay que tener instalado?

[edito]
Ah, es el idioma, hay que tenerlo en castellano para que lo pille bien… Vaya bicho :rofl:

Sin speech-dispatcher-module-espeak no te salen las voces o al menos a mí no me salen…

zse speech-dispatcher

S  | Name                            | Summary                                       | Type
---+---------------------------------+-----------------------------------------------+--------
   | brltty-driver-speech-dispatcher | Speech Dispatcher driver for BRLTTY           | paquete
i  | speech-dispatcher               | Device independent layer for speech synthesis | paquete
   | speech-dispatcher-configure     | Configuration tool for Speech Dispatcher      | paquete
i+ | speech-dispatcher-module-espeak | ESpeak module for Speech Dispatcher           | paquete

Me lo debió de instalar automáticamente espeak-ng.

 ~/Descargas  zypper se -iv speech                                                        ✔  3s  16:34:01 
S  | Name                            | Type    | Version          | Arch   | Repository
---+---------------------------------+---------+------------------+--------+----------------------------
i+ | libqt5-qtspeech-plugin-speechd  | paquete | 5.15.16+kde1-1.3 | x86_64 | Repositorio principal (OSS)
    name: libqt5-qtspeech-plugin-speechd
i+ | libQt5TextToSpeech5             | paquete | 5.15.16+kde1-1.3 | x86_64 | Repositorio principal (OSS)
    name: libQt5TextToSpeech5
i+ | libQt6TextToSpeech6             | paquete | 6.9.0-1.1        | x86_64 | Repositorio principal (OSS)
    name: libQt6TextToSpeech6
i  | libspeech-provider-1_0          | paquete | 1.0.1-2.1        | x86_64 | Repositorio principal (OSS)
    name: libspeech-provider-1_0
i+ | libspeechd2                     | paquete | 0.12.0-1.2       | x86_64 | Repositorio principal (OSS)
    name: libspeechd2
i  | libspeechd_module0              | paquete | 0.12.0-1.2       | x86_64 | Repositorio principal (OSS)
    name: libspeechd_module0
i+ | qt6-texttospeech                | paquete | 6.9.0-1.1        | x86_64 | Repositorio principal (OSS)
    name: qt6-texttospeech
i+ | speech-dispatcher               | paquete | 0.12.0-1.2       | x86_64 | Repositorio principal (OSS)
    name: speech-dispatcher
i  | speech-dispatcher-module-espeak | paquete | 0.12.0-1.2       | x86_64 | Repositorio principal (OSS)
    name: speech-dispatcher-module-espeak

EDIT: Pues parece que no. Ya los tenía de antes.

Saludos

Hola.

Supongo que serán dependencias pero pueden haberse instalado por otra cosa.

Si configuro Plasma en castellano, funciona -las voces, meh, pero vale-; si lo tengo en gallego, no funciona. Puedo arrancar una aplicación cambiando el lenguaje con la variable de entorno (ej. LANG=es_ES okular), pero por alguna razón esto no funciona en el equipo de escritorio. Aun así me parece un pequeño bug si no hay forma de usar un idioma incluso si se ejecuta el programa en otro -aunque si cambias el sistema los demás están en inglés-.

Gracias. Los probaré cuando vuelva de vacaciones.

Pues cuídate la vista. Mi madre tiene sufre de ojo seco por llevar casi 30 años trabajando con pantallas y no mola nada. Ella usa siempre esquemas de color oscuros incluso de día si no hay mucha luz ambiental porque dice que le resecan menos los ojos.

Mientras sacamos algo en claro de todo esto com decía, uso el navegador. No sé si sería lo mismo que dices que tenías tú, puedes probar; también lee PDFs pero había que cargarlos no recurdo cómo (lo uso para Epubs y páginas web).
Se supone que funciona también en FF Android, pero a mí sólo me funciona si estoy conectada por wifi no sé si es que se pega con otros complementos o qué, aunque en el móvil apenas tengo 3 o 4 instalados. Ya investigaré, que esto de pelearse con el software es bastante agotador :disappointed:

Por cierto que también en el complemento Reader View, no la “Vista de lectura” que tiene FF sino un complemento que se llama así, hay también la opción TTS, aunque, como en Read Aloud, casi todas las voces son de pago y las que no lo son funcionan a trompicones salvo la de Google Translate.

El mensaje de arriba era para elbitmalo. No veo que se pueda cambiar el respondido ni que se pueda borrar el mensaje y volver a publicarlo bien, así que pongo esta nota.

No, relacionado con el “speech” tengo todo esto (incluidas bibliotecas de QT5 :hushed:):

Tengo Speechd, como tú, y me suena que cuando busqué por internet sintetizadores de voz apareció por alguna parte Speex, así que si no me estoy equivocando, supongo que ese es el que está usando mi instalación.

Por cierto, que en la entrada «Voz del texto a voz» no me sale nada: