Manuale per l'utente.
TXT2audio è un SEMPLICE convertitore di documenti (.TXT, .RTF, .DOC, .DOT E .HTML) in file audio (.MP3 o .WAV) e funziona con tutte le sintesi vocali nel formato SAPI 5.
Prima di utilizzare il programma è necessario leggere il file licenza.txt ed accettarne le condizioni.
Questo programma è stato testato con Windows 2000 e XP.
Per poter funzionare TXT2audio richiede la presenza sul sistema di almeno una sintesi vocale SAPI5.
Per poter convertire i documenti nel formato della suite Office (.doc, .rtf, ecc.) il programma richiede la presenza sul sistema di Microsoft(R) Word.
In modalità Web TXT2audio funziona solo su sistemi operativi Windows XP o 2000.
Questa parte del manuale descriverà quelle che sono le due modalità d'installazione del programma.
queste aggiunte sono state necessarie dalla versione 2.3.4, grazie alla creazione del pacchetto con installer.
Dalla versione 2.3.4, lo staff de ilgerone.net ha creato, per facilitare le cose ai meno esperti, un pacchetto autoinstallante in modalità Windows standard.
Sarà sufficenteseguire le istruzioni durante il processo d'installazione.
Tale processo creerà, nel menù avvio/programmi, l'icona del programma con relativi riferimenti ai collegamenti internet, a queste pagine, al manuale ecc...
La cartella sendto è una cartella di sistema e potrebbe non essere visibile da esplora risorse. In questo caso è necessario abilitarne la visione (menù Strumenti, Opzioni cartella, Visualizzazione, Visualizza cartelle e file nascosti).
Per usare il programma in modalità Web è inoltre comodo creare un collegamento di TXT2audio.exe sul desktop.
Selezionare da esplora risorse il file di testo che si intende convertire e, dal menu File o col bottone destro del mouse, selezionare "Invia a ...". Scegliere quindi il collegamento a TXT2audio.
Per l'esecuzione dal prompt dei comandi DOS è sufficiente posizionarsi nella cartella in cui è memorizzato il file di testo e digitare il comando:
c:\txt2wav\TXT2audio [#NomeFile.ini] [opzioni] "NomeFile.txt"
#NomeFile.ini è facoltativa e permette di caricare un file di configurazione per modificare le opzioni d'uso del programma presenti nel file C:\txt2wav\TXT2audio.ini.
Le opzioni possibili, facoltative, verranno spiegate più avanti nel documento.
"NomeFile.txt" è il nome del file di testo da convertire in WAV o MP3.
I file di output, se non specificato diversamente, saranno organizzati in sottocartelle create in un folder nella cartella corrente: la stessa in cui è presente il file di testo.
Attenzione: se nella cartella sono già presenti file WAV o MP3 con lo stesso nome di quelli creati dal programma, il suo comportamento potrebbe essere imprevedibile.
Durante l'esecuzione il programma può essere interrotto premendo la combinazione di tasti ctrl-C.
Per avviare il programma nella modalità Web basta invece cliccare l'icona di TXT2audio.exe precedentemente creata sul desktop.
E' sempre il comando ctrl-c che interrompe il server.
Nella creazione dei file audio è possibile regolare velocitàà, tono e scegliere la lunghezza dei file audio prodotti.
tutto ciò avviene attraverso opzioni che possono essere digitate a riga comando, prima del nome del file da convertire, oppure memorizzate nel file TXT2audio.ini o nel file di configurazione alternativo passato al programma a riga comando tramite il carattere #.
ATTENZIONE: le opzioni modificate attraverso la riga di comando hanno priorità su quelle contenute nel file di configurazione.
L'opzione:
-voce=n
Consente di selezionare una delle voci SAPI istallate sul computer. Il range va da 0 al numero effettivo di voci istallate.
Le voci possono essere caricate anche con il loro nome, per esempio:
-voce=Microsoft Mary
oppure
-voce=Roberto
ATTENZIONE: Il nome della voce è scelto dal produttore della voce stessa e non è facile da scoprire, per farlo è necessario fare riferimento all'attributo Name nella definizione della voce nel registro di sistema.
Tipici nomi delle voci Loquendo sono comunque: Roberto, Paola, Giulia ecc.
Le voci Microsoft sono invece nomi composti come:
Microsoft Mary
Microsoft Mike
SampleTTSVoice
Gli spazzi e le maiuscole sono importanti.
E' ammesso anche il formato:
-voce=Nome,Tono,Velocità
I valori per tono e velocità sono numeri interi compresi tra -10 e 10.
Esempi validi sono:
-voce=Giulia
-voce=0 (dove 0 indica il numero della voce)
-voce=3,2 (dove 3 è il numero della voce e 2 indica il tono)
-voce=Giulia,0,1 (dove 0 indica il tono e 1 la velocità)
In generale il formato completo del parametro è:
-voce={NumeroVoce|Nome Voce}[,tono[,velocità]]
Le opzioni:
-velo=x
-tono=y
consentono di regolare la velocità (-velo) o il tono (-tono) di lettura.
Attenzione: se nel file TXT2audio vengono posti dopo l'opzione -voce il loro valore annulla i precedenti.
Come nel caso del tono e della velocità nell'opzione -voce I valori ammessi vanno da -10 a 10.
L'opzione:
-volu=x
consente di regolare il volume dei file audio prodotti. Il valore di x va da 0 a 100.
L'opzione:
-emph=...
permette di scegliere una o due voci alternative alla principale nella lettura dei dialoghi.
Esempi validi sono:
-emph=Giulia
-emph=Giulia,0,1 (dove 0 indica il tono e 1 la velocità)
-emph=Giulia;Microsoft Mary
-emph=Paola,1,0;Roberto,2
e così via.
In generale il formato completo del parametro è:
-emph=Nome Voce[,tono[,velocità]][;Nome Voce[,tono[,velocità]]]
Per gli utenti che dispongano di una sola voce è anche possibile specificare
-emph=1
che aumenta l'enfasi della voce principale sempre nella sola lettura dei dialoghi.
con -emph=0 o -emph=none la funzione viene disattivata.
Attenzione il programma riconosce un dialogo dalla presenza dei sergenti (« »). Se nel testo non sono bilanciati o mancano il programma non può funzionare correttamente.
L'opzione:
-ctrl=...
consente di passare alla sintesi vocale specifici parametri che non seguono lo standard SAPI 5.
Per esempio, con le voci Loquendo versione 6.x,indicando:
-ctrl=\lexicon=c:/dizionario.lex
il file dizionario.lex verrà usato per controllare la pronuncia delle parole durante la lettura.
E' possibile introdurre nellastringa il carattere new Line (a capo) con lastringa Nl (scritta in maiuscolo).
L'opzione:
-outd=<path>
consente di indicare il path dove verranno create le cartelle con i file audio. Esempi tipici di valori corretti per <path> sono: "d:\", "c:\MyDocument", ecc.
Il valore di default 'input_file' indica la stessa cartella in cui si trova il file di testo da convertire.
Il parametro:
-outf=xxx
consente di usare la stringa xxx come prefisso alla numerazione nel nome dei file audio creati dal programma. Ponendo:
-outf=nome_file
verrà scelto come prefisso il nome del file di input.
E' anche possibile il formato
-outf=
Che annulla qualunque prefisso nel nome del file audio generato adeguandone il formato a quei lettori MP3 che accettano solo numeri nel nome dei file.
L'opzione:
-lenb=n
permette di scegliere la dimensione dei frammenti di testo, in cui viene spezzato il file, e che genereranno i singoli file audio. Il malore n deve essere espresso in k-byte.
Si tenga presente che frammenti di 5 K, a 150 parole al minuto (-velo=1), producono file audio di circa 5/6 minuti.
Con -lenb=0 si disabilita la funzione di frammentazione e verrà prodotto un unico file audio, col nome indicato in -outf, che verrà creato nella cartella indicata dal parametro -outd.
ATTENZIONE! L'opzione -rbon=1 o la presenza di espliciti comandi di frammentazione presenti nel testo hanno priorità sull'opzione lenb=0 (si veda anche l'opzione -break).
Indipendentemente dal valore di lenb è comunque possibile forzare la frammentazione del testo attraverso una parola chiave scelta dall'utente.
L'opzione:
-break=parola
serve appunto per indicare tale chiave di interruzione.
Per ottenere l'organizzazione dei file audio in sottocartelle (gruppi) occorre agire sul parametro:
-ngrp=n
'n' può assumere un valore nel range tra 5 e 50 oppure 0 per disattivare la modalità gruppi.
Indicando 0 per -ngrp tutti i file audio verranno creati in un'unica cartella con lo stesso nome del file di testo in conversione.
Attivando invece la modalità gruppi i file audio verranno creati in sottocartelle
numerate, prefissate dal nome del file di testo in conversione, e
dove ogni cartella conterrà n file audio.
Per rendere i file audio compatibili col massimo numero possibile di lettori MP3 sono state inserite alcune opzioni che consentono di formattare la lettura.
Le opzioni:
-pini=n
-pfin=n
consentono di inserire una pausa di silenzio in testa (-pini) o in coda (-pfi). Il valore n deve essere espresso in millisecondi.
L'opzione:
-prgf=n
Provoca nella lettura una pausa di n millisecondi quando nel testo da convertire sono presenti una o più righe vuote.
L'opzione:
-numb=x
abilita, con x=1, la lettura del numero progressivo, all'inizio di ogni brano audio (x=0 disabilita invece la funzione).
L'opzione:
-vmsg=...
permette di scegliere una o due voci alternative alla principale nella lettura del numero progressivo del brano (prima voce) e dei titoli presenti nel testo (seconda voce).
Vengono considerati "titoli" le righe del testo che non contengano lettere minuscole dell'alfabeto.
come nel caso di -emph esempi validi sono:
-vmsg=Giulia
-vmsg=Giulia,0,1 (dove 0 indica il tono e 1 la velocità)
-vmsg=Giulia;Microsoft Mary
-vmsg=Paola,1,0;Roberto,2
e così via.
con -vmsg=none, o -vmsg=0, la funzione viene disattivata.
In generale il formato completo del parametro è:
-vmsg={none|0|Nome Voce}[,tono[,velocità]][;Nome Voce[,tono[,velocità]]]
La voce deve essere indicata col proprio nome, non è possibile indicare un numero come nell'opzione -voce.
Attenzione: la lettura dei titoli con la seconda voce richiede la scansione lettera per lettera di tutto il testo e ciò rallenta la velocità di conversione di circa il 20%.
Può essere comodo attivare la lettura del numero del brano eccezion fatta per il primo. La funzione si ottiene ponendo:
-off1=1
come già detto il parametro -numb consente di inserire all'inizio di ogni brano una numerazione progressiva. Il parametro
-pref=xxx
Consente la scelta di una stringa di testo come prefisso alla numerazione.
Ponendo:
pref=nome_file
si richiede al programma di usare, come prefisso, il nome del file di input.
All'inizio di ogni brano audio oltre al numero progressivo (-numb) e al prefisso (-pref) è possibile richiedere la lettura del numero dell'ultimo brano.
La funzione si attiva con l'opzione:
-last=1
-last=0 (il valore di default) disattiva invece la funzione.
Ponendo
-mp3c=1
verrà effettuata la conversione automatica dei file audio nel formato compresso MP3.
con
-mp3c=0
I file audio prodotti saranno invece nel formato .wav.
Il parametro:
-mp3p=...
permette di impostare le opzioni di conversione.
Le istruzioni su come modificarlo, e la licenza d'uso del programma LAME che effettua la conversione, sono presenti nel file di testo LAME.TXT incluso in questo pacchetto.
I valori preimpostati ("--priority 0 -m m -b 32") sono stati scelti in modo da produrre file mp3 di ridotte dimensioni senza comunque compromettere una buona qualità della voce.
# Impostazione del formato dei segmenti audio
Il parametro
-afrm=n
Permette di controllare la creazione dei segmenti audio. Accetta i seguenti valori:
Il valore di default è 14 e permette di ottenere buoni risultati con tutte le sintesi. Ovviamente l'ottimo si otiene seguendo le indicazioni dei vari produttori.
L'opzione:
-id3f=1
Permette di specificare se si vogliono accodare le informazioni ID3 TAG
V1.1 ai file MP3 generati.
Con
-id3f=0
La funzione viene disabilitata.
Nota: alcuni lettori MP3 richiedono quest'informazione per ordinare il
flusso dei frammenti; si consiglia di attivare l'opzione se il lettore
legge i frammenti in ordine sparso. Le informazioni ID3 TAG occupano 128
byte per file.
L'opzione
-stop=1
Richiede, per la chiusura del programma, la pressione del tasto di invio da parte dell'utente.
Con
-stop=0
il programma terminerà invece senza richiedere la pressione dell'invio finale.
Attenzione: in caso di errori nell'elaborazione l'opzione -stop=0 viene annullata. Per forzare comunque la chiusura automatica anche in presenza di errori occorre indicare
-stop=2.
Ponendo:
-xmlc=1
Il programma interpreterà i tag XML-Voice (standard Microsoft) per il controllo della voce.
Si consiglia di tenere il parametro impostato a 0 se non si conosce esattamente il contenuto del file di testo. Con -xmlc=1 ogni simbolo di < all'interno del testo verrà considerato come inizio di un tag XMl e, se fuori controllo, il risultato potrebbe essere imprevedibile.
Ponendo:
-loqu=1
Il programma interpreterà le sequenze escape delle sintesi vocali Loquendo per il controllo della voce.
Si consiglia di tenere il parametro impostato a 0 se non si conosce esattamente il contenuto del file di testo. Con -loqu=1 ogni simbolo di '\' all'interno del testo verrà considerato come inizio di una sequenza di controllo Loquendo e, se fuori controllo, il risultato potrebbe essere imprevedibile.
Il parametro
-rbon=1
Specifica se creare in ciascuna cartella il file _dirname.talk utilizzato dal programma di gestione
RockBox dei riproduttori Archos per vocalizzare il nome della stessa.
con
-rbon=0
la funzione viene disabilitata.
Nota: per informazioni su Rockbox, visitare il sito http://www.rockbox.org.
Il parametro
-rbfl=...
consente di scegliere per la creazione dei file MP3 delle etichette vocali RockBox parametri diversi da quelli usati nei brani audio del testo convertito.
L'opzione:
-rbnn=1
Inserisce nell'etichetta vocale Archos RockBox il numero dei brani o delle sottocartelle contenuti nella cartella.
L'opzione:
-port=n
permette di scegliere la porta del proprio computer che il server userà per accettare connessioni dalla rete.
Il valore di default è 8888
L'opzione:
-auto=1 (valore di default)
richiede al programma di avviare automaticamente il browser allo start del server.
con
_auto=0
l'opzione viene disabilitata.
(Per informazioni sulla modalità server consultare le FAQ create appositamente!)
L'opzione:
-exit=<comando>
Chiede a TXT2audio di eseguire il comando specificato dopo aver convertito, con la funzione "Converti tutti" della modalità web, un gruppo di testi.
Usualmente viene usata nel formato:
-exit=shutdown /s
per lo spegnimento del computer dopo la conversione di parecchi libri.
L'opzione:
#NomeFile
Permette di eseguire TXT2audio con un file .ini alternativo a quello di default (TXT2audio.ini).
Esempi validi per l'opzione, che può essere applicata solo con l'esecuzione a riga comando, sono:
C:\txt2wav\TXT2audio.exe #c:\MioFile.ini libro.txt
oppure
C:\txt2wav\TXT2audio.exe #c:\formati\inglese.ini -lenb=15 libro.txt
Attenzione: se usata, l'opzione # deve essere la prima della riga comandi.
# Opzioni per la creazione del feed RSS (podcast)
L'opzione:
-feed=1
richiede a TXT2audio la creazione del feed RSS per la pubblicazione sul proprio web server dell'audiolibro creato.
Con:
-feed=0
l'opzione viene disabilitata.
Attenzione. nella modalità web premendo il tasto "Crea Podcast" il feed RSS verrà creato indipendentemente dal valore di -feed.
L'opzione -mail= permette di inserire il proprio indirizzo di posta elettronica del feed RSS.
L'opzione -href= permette di indicare nel feed l'URL del folder dove verranno pubblicati gli audio libri sul proprio web server.
L'opzione -titl= permette di precisare il titolo del podcast descritto nel feed RSS.
Il valore di default:
-titl=TXT2audio's podcast (%s)
contiene la variabile %s per referenziare nel feed il titolo del documento convertito.
Se, per esempio, si converte il file "I promessi sposi.doc" il titolo del podcast risulterà:
TXT2audio's podcast (I promessi sposi)
Durante la lettura è possibile chiedere al programma di effettuare pause. Per far ciò è necessario introdurre nel testo da convertire il tag:
[pause n]
dove n, se assume un valore da 1 a 10, indica i secondi di silenzio. Con numeri da 11 in poi indica invece i millisecondi di pausa. Per fare qualche esempio:
[pause 2] come [pause 2000] indicano una pausa di due secondi;
[pause 1500] indica una pausa di un secondo e mezzo.
* Questa versione del programma è stata testata solo con Windows 2000 e XP
*. Non esistono controlli sul valore assegnato ai parametri di regolazione e, se vengono sbagliati, il programma si pianta.
* Il parametro -vmsg accetta solo stringhe e non un numero per la scelta della voce.
E vero e so anche che non è facile scoprire il nome che il produttore ha scelto per il proprio prodotto.
Purtroppo indicando la voce con il numero si produce il ricaricamento di tutti i difoni rallentando notevolmente il programma ma ... Non disperate, ci sto lavorando! :-)
* Con le voci SAPI5 di Loquendo (versione 6.x) lagestione delle pause risulta molto approssimativa.
Per problemi e suggerimenti:
| Oggi è Giovedi, 18 marzo 2010 , e sono le ore 15:42:e 31 secondi (@654)| | Standard CSS2 Valido! |
Pagina modificata Sabato, 12 Maggio, 2007