Interfacce vocali: Microsoft Speech Recognition, l’italiano e l’inglese

Creare voci sintetiche è complesso… ma nella costruzione delle interfacce vocali è comunque la parte facile. Mettere il computer in grado di usare il parlato umano è decisamente più difficile.

I primi sistemi commerciali in grado di trascrivere il parlato normale, senza stacchi artificiali tra le parole, hanno meno di vent’anni. Le funzioni di riconoscimento vocale (Text-to-Speech) hanno tuttavia fatto di recente passi da gigante.

Va però detto subito che, a differenza di quanto accade di solito, l’italiano non è supportato da uno dei principali prodotti di questo tipo. Il sistema di riconoscimento vocale di Windows 10 copre infatti solo sei lingue: inglese (con cinque diverse pronunce locali), francese, tedesco, giapponese, cinese mandarino e spagnolo. Per una volta l’italiano non è entrato nel gruppo di punta, e chissà se sarà supportato più avanti.

Se si vuole provare il prodotto, comunque, è sufficiente impostare su un computer con Windows una di queste prescelte come lingua del sistema operativo (Pannello di controllo > Orologio e opzioni internazionali > Lingua). Io ho provato con l’inglese, e al riavvio ho potuto attivare senza problemi il sistema di riconoscimento vocale (con il percorso che in italiano è: Pannello di controllo > Accessibilità > Riconoscimento vocale). A quel punto, nella parte alta dello schermo è comparsa questa finestrella:

Tuttavia, i risultati non sono stati particolarmente positivi. Do per scontato che la mia pronuncia dell’inglese, per quanto comprensibile a esseri umani, sia molto diversa da quella accettabile per Microsoft Speech Recognition. Con un po’ di fatica sono quindi riuscito a far partire programmi sul computer (aiutato anche da una finestra di dialogo che presenta diverse opzioni), però la dettatura è assolutamente deludente. L’ho messa alla prova i versi iniziali di una celebre poesia di Yeats, An Irish Airman Foresees His Death, di cui avevo dovuto curare la pronuncia molti anni fa, per un esame universitario:

I know that I shall meet my fate
Somewhere among the clouds above;
Those that I fight I do not hate,
Those that I guard I do not love…

Il risultato non è stato dei migliori, anche se ha una certa qualità da poesia metafisica:

I knew that they should and the roof E
somewhere under a mound to oust abound
those that pay for my item if he knows a thing
of the kind enough to allow!

In queste circostanze, Microsoft Speech Recognition non serve a molto. Per mia fortuna, esistono però diversi sistemi sostitutivi che coprono l’italiano, e il più importante è Dragon Dictate, di cui spero di parlare qui tra poco.

Interfacce vocali

martedì 8 marzo 2016

Microsoft Speech Recognition, l’italiano e l’inglese

Nessun commento:

Posta un commento