Valutazione discussione:
  • 0 voto(i) - 0 media
  • 1
  • 2
  • 3
  • 4
  • 5
  Condividi: Facebook Twitter
Programma per trasformare un testo o un eBook in un audio-libro
#21
@ Blackstar

Con https://ttsreader.com/ Il libro di 450 pagine si carica completamente, ma in modo impreciso, inoltre non hai poi la
possibilità di salvare il testo come audio-libro.

Mentre Balabolka, messo con Wine su Linux, di suo è privo della lingua italiana, ma anche di qualsiasi altra lingua, va 
messa a parte con il software “RSSolo4Italian.zip”, tra l’altro difficile da reperire.
Purtroppo non riesce a completare il caricamento del Software per la lingua, vedi foto sotto, di conseguenza hai 
una versione di Balabolka completamente muta.
Peccato questo Balabolka aveva tantissime opzioni.

[Immagine: hpQPxxD.png]
Cita messaggio
#22
1) Leggete bene le licenze. RealSpeak Silvia non è un software gratuito ma può essere installato solo in casi molto specifici
2) Balabolka è un software per Windows che si appoggia a molte funzioni native del sistema operativo incluse ad le librerie SAPI 4/5. Ricreare tutto il necessario in Wine è complicato e -come nel caso precedente- violerebbe le licenze d'uso (https://appdb.winehq.org/objectManager.p...&iId=17859). Non ha senso buttarsi su Linux se poi bisogna saccheggiare Windows per fare le cose di cui si ha bisogno
3) è per questo che ti ho suggerito eSpeak perché su Linux è forse l'unico software "da testo a voce" che permette di ottenere dei risultati accettabili per quanto modesti.
4) io credo che tu stia sbagliando approccio, alla prima difficoltà molli tutto e parti per una nuova strada e così facendo non credo che ne verrai a capo. C'è gente preparatissima su Linux in questo forum, io ti consiglierei di lavorare su eSpeak cercando di risolvere i problemi che sono emersi.
5) Se proprio vuoi usare software per Windows prova a recuperare una vecchia licenza anche di Windows 98/xp e a creare una macchina virtuale
Bene per male è carità, male per bene è crudeltà
Cita messaggio
#23
(05/11/2020, 03:46)Dirck Ha scritto: messa a parte con il software “RSSolo4Italian.zip”, tra l’altro difficile da reperire.

Quel software lo trovi sul sito di Dimio (che ti avevo segnalato prima), in relazione alla lingua italiana.

In aggiunta ho trovato una lingua SAPI5, con la voce di Lucia, che si prende da qui:
https://www.microsoft.com/en-us/download...x?id=27224
dove si può scaricare --> "MSSpeech_TTS_it-IT_Lucia.msi"
(lo metto a beneficio di chi usa Windows, in particolare)

(05/11/2020, 08:33)Blackstar Ha scritto: 3) è per questo che ti ho suggerito eSpeak perché su Linux è forse l'unico software "da testo a voce" che permette di ottenere dei risultati accettabili per quanto modesti.
4) io credo che tu stia sbagliando approccio, alla prima difficoltà molli tutto e parti per una nuova strada e così facendo non credo che ne verrai a capo. C'è gente preparatissima su Linux in questo forum, io ti consiglierei di lavorare su eSpeak cercando di risolvere i problemi che sono emersi.

Concordo perfettamente con te; anche perchè aver il risultato richiesto l'unico approccio funzionale è quello di utilizzare il Terminale (a cui bastano veramente 2 comandi in croce per riuscire nell'intento richiesto).
Via che purtroppo in tanti non vogliono perseguire, ma che rimane sia migliore che più veloce.
Domani farò una guida più completa su come ottenere un risultato ottimale, seppure con voce discreta (stasera penso di testare mbrola che ha una voce migliore rispetto a quelle di default).
Cita messaggio
#24
Una guida abbastanza completa su come tradurre un TXT in MP3:

L'installazione richiede come prerequisiti:
- espeak (insieme a -data e altri),
- mbrola - mbrola-it1 - mbrola-it2 - mbrola-it3 - mbrola-it4  (naturalmente se la lingua italiana è quella di interesse)
- ffmpeg (tranlare in mp3),
- poppler-utils (che include il pdftotext di interesse),
- gespeaker (non necessario, ma ottimale per uso grafico, essendo una GUI),
- pdfshuffler (se si vuole modificare graficamente un PDF), ma non necessario alla guida.

Alcuni elementi sono già stati trattati nella prima pagina, quindi non ripeterò.

Tutti i passi successivi necessitano dell'uso di un Terminale (senza richieste di sudo/root vari).
Per evitare passaggi extra do per scontato che TUTTI i file di interesse siano in: /home/vostronome

1. Controlliamo che lingua è installata nel nostro OS:
Codice:
espeak --voices=it
Se hai inserito le richieste sopra, ti usciranno come output "it" (installato di serie, voce robotica), "mb-it3" (Mbrola, voce maschile), "mb-it4" (Mbrola, voce femminile).

2. Ora serve la trasformazione di un PDF esistente in TXT, con:
Codice:
pdftotext testo.pdf testo.txt
Supponendo che testo.pdf sia il file di interesse da trasformare e il TXT finale può avere il nome che vi interessa.
Per semplificare ho mantenuto lo stesso nome, variando ovviamente l'estensione.

Spesso i PDF hanno delle scritture a cima ed in fondo che i TXT replicano fedelmente, quindi prima di tradurre il passo successivo occorre ripulire manualmente il file TXT.
Una volta fatto passiamo al successivo capitolo.

3. Prima di fare la conversione vera e propria, la scelta migliore è testare i vari parametri disponibili, magari con la grafica di Gespeaker.
Se invece vuoi fare "a mano" si può tentare con un numero di parametri a scelta:
Codice:
espeak -v mb-it4 -s 140 -f testo.txt
In questo caso per esempio usa la voce femminile di Mbrola (-v mb-it4), con velocità impostata a 140 in lettura (-s 140), leggendo il file testo.txt che abbiamo trasformato prima.
Naturalmente a "mb-it4" si può sostutuire la voce maschile (mb-it3) o quella metallica del pc (it).
Volendo inserire tutti i parametri disponibili in Gspeaker, si può dare per esempio:
Citazione:espeak -a 100 -p 50 -s 110 -g 10 -v mb-it4 -f testo.txt
dove i parametri sono:
  "-a" -- volume, di serie con valore 100.
  "-p" -- controllo e regolazione del pitch (passo), serie valore 50.
  "-s" -- velocità lettura, di serie con valore 175.
  "-g" -- pausa tra le parole, di serie con valore 10 (millisecondi)
  "-v" -- lingua e tipo = Mbrola it4

4. Una conversione di prova in WAV, per testare se si comprende bene il parlato:
Codice:
espeak -v mb-it4 -s 140 -f testo.txt -w pippo.wav
Se il linguaggio è ritenuto abbastanza fluido, puoi pensare di realizzare un tutto in uno, come illustrato nell'ultimo passo.

5. A questo punto avendo tutti i parametri (o solo alcuni come sotto) scelti a disposizione per una trasformazione da TXT ad MP3 qualitativamente superiore (192 kbps, 44.1 kHz, Stereo) rispetto ad una scelta media.
Diamo: (è un unico comando)
Codice:
espeak -v mb-it4 -s 140 -f testo.txt --stdout | ffmpeg -i - -ar 44100 -ac 2 -ab 192k -f mp3 pippofin.mp3
ove:
"espeak -v mb-it4 -s 140" --> una parte dei parametri, volendo puoi metterli tutti, come al punto (3).
"-f testo.txt" --> il file TXT da processare.
"--stdout | ffmpeg -i - -ar 44100 -ac 2 -ab 192k -f mp3" --> la conversione in mp3 con ffmpeg
"pippofin.mp3" --> il nome finale che sarà il nostro "audiolibro".

Naturalmente ogni parametro su esposto è modificabile a piacimento.

Tenendo però presente che una voce SAPI5 (disponibilie su Windows) rimane comunque più naturale, credo che su Linux questa soluzione con mp3 di buona qualità la scelta migliore.
Cita messaggio
#25
@ Sharksu

Niente da fare.... mi è uscito un risotto inverecondo, questo è un sistema che va bene per un utente esperto, non
per un modestissimo utente Linux come il sottoscritto.
Comunque Grazie ugualmente!!!
Cita messaggio
#26
Ma guarda Dirck, non è difficile, se vuoi una mano sono qui.

L'unica cosa veramente impegnativa è togliere a mano solo le indentazioni che trovi ad inizio pagina o il numero di pagina se sono stampati sul PDF, per il resto, e sempre se accetti una qualità media nella parlata.
Se vuoi tentare la sorte, io farei così:
- prendo il libro in PDF e taglio le prime 10 pagine.
- lo trasformo in TXT.
- sottolineo le indentazioni con un editor di testo e le cancello a mano (scelta che io farei) oppure con la sostituzione nulla.
- tenterei la sorte come sopra.

Se poi va bene, mi replico metà libro. La scelta però spetta a te.

Non aver paura ad usare il Terminale o chiedere aiuto.
Ciao
Cita messaggio
#27
(07/11/2020, 13:15)Sharksux Ha scritto: Ma guarda Dirck, non è difficile, se vuoi una mano sono qui.


Ti ringrazio per la tua generosa offerta, ma le mie conoscenze di Linux sono veramente minime
rischierei di farti perdere solo del tempo…..

Non sono riuscito da terminale neanche a trasformare un testo da PDF in TXT, per riuscirci ho
dovuto ricorrere a: https://pdftotext.com/it/
Ma una volta ottenuta la conversione in TXT e averlo salvato sul pc, poi non sono stato in grado
di capire cosa esattamente immetterlo nel terminale per ottenere un testo audio in formato Mp3 da
salvare sul pc come audio-libro.

P.S. Mah... potrei mandarti (in privato) l’eBook in formato PDF di 450 pagine che ho trasformato in
formato TXT e salvato sul pc. (Ti rimarrebbe una copia di questo libro raro non più in commercio, sperando che sia di tuo gradimento...)
Scrivendomi poi esattamente le stringhe giuste da inserire nel terminale, forse, sottolineo forse, sarei
in grado poi di capire il procedimento e replicarlo in futuro con altri testi precedentemente trasformati
in TXT con l'ausilio del sito sopra citato.
Cita messaggio
#28
Guarda, se vuoi prova a mandarmi le prime 10 pagine (non l'opera intera); le puoi tagliare via grafica con PDF-Shuffler o PDF Arranger.
Facciamo una sorta di "assaggio" d'opera, così vediamo come va.
Te la trasformo senza problemi, ma dovresti fare un tentativo per capire come impostare la lingua a tuo piacimento (scrivi una frase via Gespeaker** e poi te la fai leggere - meglio se imposti una delle 2 lingue Mbrola), perchè è difficile che quello che rimane di mio gusto sia perfettamente uguale al tuo (suono, dizione, voce, etc).

Una volta fatto questo ti trasformo e scriverò la procedura esatta su come fare per il resto. E' giusto che appunti impari i vari passi anche in eventuale previsione di future conversioni.


** cioè semplicemente:
apri Gespeaker, cambi la voce a Mbrola3 o 4 (voce maschile, voce femminile) e poi ti segni gli altri parametri.
Nella frase da scrivere magari metti 2 o 3 copia-incolla a piacere, così da capire se riesci a "decifrare" bene il parlato.
Cita messaggio
#29
se può aiutare queste sono le impostazioni di gespeaker che rendono sopportabile l'ascolto per me.
   

Sharksux è possibile repricarle per il terminale dato che gespeaker non mi legge tutto il libro ma il terminale con espeak lo legge. In particolare il fattore fondamentale per una corretta lettura è il ritardo

Ps. ok ho visto i parametri da variare nei post precedenti 000017

PSS. sto provando il signore degli anelli 3509 pagine.
---
Codice:
espeak -a 150 -p 50 -s 135 -g 3 -v mb-it4 -f nuovofile.txt
cosi per me nel terminale.
La vita è come uno specchio:ti sorride se la guardi sorridendo
Un giorno senza rischio è non vissuto..
PCLinuxOS Mate - Forum Manjaro Italia Mate/Kde/Xfce - Windows 10-32bit 21h2
Cita messaggio
#30
(07/11/2020, 18:56)D-BARTO Ha scritto: se può aiutare queste sono le impostazioni di gespeaker che rendono sopportabile l'ascolto per me.


Sharksux è possibile repricarle per il terminale dato che gespeaker non mi legge tutto il libro ma il terminale con espeak lo legge. In particolare il fattore fondamentale per una corretta lettura è il ritardo

Ps. ok ho visto i parametri da variare nei post precedenti 000017

PSS. sto provando il signore degli anelli 3509 pagine.
---
Codice:
espeak -a 150 -p 50 -s 135 -g 3 -v mb-it4 -f nuovofile.txt
cosi per me nel terminale.

Con quei parametri dovresti dare:
Codice:
espeak -a 150 -p 50 -s 135 -g 3 -v mb-it4 -f nuovofile.txt --stdout | ffmpeg -i - -ar 44100 -ac 2 -ab 192k -f mp3 signore-anelli.mp3

come output > signore-anelli.mp3
Cita messaggio


Vai al forum:


Utenti che stanno guardando questa discussione: 3 Ospite(i)