martedì 15 marzo 2016

Prova di Dragon NaturallySpeaking

Logo Dragon da Wikipedia in lingua inglese (https://en.wikipedia.org/wiki/Dragon_NaturallySpeaking)
Per l’italiano esiste in sostanza un unico prodotto per il riconoscimento vocale in ambito di “produttività”, cioè facilmente utilizzabile con gli strumenti da ufficio: Dragon® NaturallySpeaking. Prodotto da Nuance, questo programma è arrivato alla versione 13 per la lingua italiana (14 per la lingua inglese) e può essere installato su PC a un costo che sul sito aziendale parte da € 99 per la versione base. Sullo stesso sito sono inoltre disponibili versioni dotate di comandi aggiuntivi per il controllo del computer e di piccoli accessori per facilitare il lavoro.
 
Dragon permette sia la dettatura sia il controllo del computer attraverso la voce. Sul controllo non vorrei ancora dire molto, perché credo che per ottenere risultati soddisfacenti sia molto importante l’allenamento. Tuttavia, per la dettatura, Dragon è notevole. Forse dal punto di vista del riconoscimento puro e semplice Google adesso fornisce un risultato migliore, e spero di verificare questa impressione più avanti con qualche dato preciso. Però Google non si integra con i programmi da ufficio, e in ciò Dragon non ha semplicemente concorrenti. Io lo trovo molto efficiente... e ammetto che questo post è stato in buona parte dettato con Dragon!
 
Dal punto di vista operativo, l’installazione di Dragon (Premium, versione 13 per Windows) avviene da CD o da installatore scaricabile. Dopo l’installazione, c’è una brevissima fase (pochi minuti) di addestramento al riconoscimento del parlato di una singola persona. Anche in seguito è poi possibile effettuare un riconoscimento e addestrare il programma su un assieme di testi – ma finora ho sempre preferito evitare. In ogni caso, non è mai stato necessario usare il microfono in dotazione alla versione che ho ordinato io. Il sistema di microfoni del Surface che uso normalmente si è rivelato del tutto adeguato al compito.
 
Completato l’addestramento, Dragon funziona in modo piuttosto intuitivo. Facendo partire il programma in cima allo schermo compare una minuscola finestra che permette di attivare e disattivare il riconoscimento vocale. Quando il riconoscimento è attivo è possibile usarlo per dettare, per esempio, direttamente all’interno di Word: vicino al normale cursore appare una minuscola fiammella verde e da quel momento Dragon trascrive nella pagina di Word (o di un altro programma) ciò che sente attraverso il microfono. Inoltre, numerose funzioni aggiuntive permettono di eseguire le operazioni più comuni nell’elaborazione di testi. Per esempio: aprire virgolette, annullare le ultime azioni, selezionare e modificare il testo.
 
Anche dettando a una velocità naturale, senza bisogno di scandire le parole, Dragon ha percentuali di successo sorprendenti. Dal punto di vista dell’utente, il principale collo di bottiglia è quindi rappresentato dalla capacità di pensare a che cosa dettare: il programma riesce a tenere il passo.
 
Come per quasi tutti i programmi di questo tipo, occorre peraltro ricordarsi di dettare la punteggiatura. Sia le virgole sia i punti fermi a fine frase devono essere esplicitamente indicati al programma. Lo stesso succede con parole che, insolitamente, hanno un’iniziale maiuscola.
 
Per quantificare il funzionamento ho scelto sei righe di testo provenienti dal mio libro L’italiano del web (Roma, Carocci, 2011, p. 147). Il testo originale dice:
 
Non è comunque facile fare stime anche quando si guardano le cose dal punto di vista del lettore. Negli Stati Uniti, blog di successo come l’Huffington Post o BoingBoing registrano centinaia di migliaia di accessi al giorno. In Italia, l’unico blog che sembra noto anche a un pubblico non specialistico è quello di Beppe Grillo, spesso collocato nelle liste dei siti italiani più visitati.
 
La mia lettura, registrata usando Dragon Recorder 1.3 su iPhone 4S e scaricando il risultato sotto forma di file .wav per l’elaborazione con Dragon (Strumenti > Trascrivi registrazione…), è questa:
 
 
La trascrizione fornita da Dragon è stata questa, in cui evidenzio in corsivo gli errori:
 
Non è comunque facile fare stime anche quando si guardano le cose dal punto di vista del lettore. Negli Stati Uniti, blog di successo come la finto post o Borboni registrano centinaia di migliaia di accessi al giorno. In Italia, l’unico blog che sembrano anche un pubblico non specialistico è quello di Beppe grillo, spesso collocato nelle liste dei siti italiani più visitati.
 
Su 64 parole del testo di partenza, ne sono state sbagliate otto (“l’Huffington Post”, “BoingBoing”, “sembra noto”, “a” e “Grillo”); quattro di esse però erano nomi propri. La percentuale di errore è quindi circa del 12% complessivo e del 6% se si considerano inevitabili gli errori sui nomi propri. Anzi, non è poco che il programma sia stato in grado di mettere le giuste maiuscole sia a “Stati Uniti” sia a “Beppe”.
 

Nessun commento:

Posta un commento