giovedì 17 marzo 2016

Dettatura con Google

I servizi di Google comprendono una grande quantità di prodotti online e offline. Tra questi non manca un sistema di riconoscimento vocale, che si manifesta in varie forme. Per esempio, la casella di ricerca visualizzata nella home di Google usando il browser Chrome include a destra l’icona di un microfono per il riconoscimento vocale:
 
La casella di ricerca di Google su Chrome

Cliccando sull’icona si può dettare una ricerca a Google, con percentuali di successo sorprendentemente buone.
 
Il riconoscimento vocale è gestito da Google attraverso le Web Speech API, integrate in molti altri prodotti di Google e di terze parti. Il sistema è molto sofisticato e permette anche la dettatura, che nel 2015 è stata integrata anche in Documenti Google. Aprendo un documento con Documenti Google, infatti, nel menu “Strumenti” è adesso possibile attivare la funzione “Digitazione vocale” (etichetta non troppo intuitiva!), che fornisce risultati di alta qualità.
 
Per vedere quanto è alta la qualità io ho fatto una prova con la registrazione che ho già usato per Dragon NaturallySpeaking. Per far ascoltare il file a Google ho usato il missaggio stereo sul mio computer e ho aperto Documenti Google all’interno di Chrome per Windows, versione 49.0.2623.87 m.
 
Il testo originale (provenienti dal mio libro L’italiano del web, Roma, Carocci, 2011, p. 147) dice:
 
Non è comunque facile fare stime anche quando si guardano le cose dal punto di vista del lettore. Negli Stati Uniti, blog di successo come l’Huffington Post o BoingBoing registrano centinaia di migliaia di accessi al giorno. In Italia, l’unico blog che sembra noto anche a un pubblico non specialistico è quello di Beppe Grillo, spesso collocato nelle liste dei siti italiani più visitati.
 
La mia lettura, registrata usando Dragon Recorder 1.3 su iPhone 4S e scaricando il risultato sotto forma di file .wav, è questa:
 
 
La trascrizione fornita da Google, in cui evidenzio in corsivo gli errori e integro tra parentesi quadre l’unica parola saltata, è stata:
 
Non è comunque facile faresti neanche quando si guardano le cose dal punto di vista del lettore. Negli Stati Uniti, blog di successo come la finta un post su Boing Boing registrano centinaia di migliaia di accessi al giorno. In Italia, l'unico blog che sembra nota anche [a] un pubblico non specialistico e quello di Beppe Grillo, spesso collocato nelle liste dei siti italiani più visitati.
 
Su 64 parole del testo di partenza, ne sono state sbagliate nove (“fare stime”, “l’Huffington Post o”, “noto”, “a” e “è”) di cui un solo nome proprio. La percentuale di errore è quindi circa del 14% complessivo e del 12% se si considerano inevitabili gli errori sui nomi propri… che sono riconosciuti in forma molto efficiente. Molto meglio di Dragon per quanto riguarda i nomi propri, un po’ peggio per quanto riguarda la qualità complessiva.
 

Nessun commento:

Posta un commento