Le pronunce locali italiane rappresentano un grosso punto di incertezza per i sistemi di riconoscimento del parlato. In fin dei conti, esistono numerose pronunce diverse, con caratteri al tempo stesso marcati e molto diversi tra di loro. Inoltre, le pronunce locali sono più la regola che l’eccezione: ancora oggi è spesso possibile individuare l’origine di un italiano semplicemente sentendolo parlare – e con la possibilità a volte di individuare non solo la regione di provenienza, ma anche la città o addirittura il quartiere.
Interpretare l’italiano regionale è quindi molto importante per un qualunque sistema basato sul riconoscimento del parlato. Per fortuna, mi sembra che i sistemi attuali funzionino molto bene da questo punto di vista e il corpus CLIPS permette di verificare la cosa. Per esempio, una frase con un marcato accento napoletano come questa (audio CLIPS DGmtA02N, dopo 0:03) viene comunque interpretata correttamente:
Questa capacità è notevole, e si mostra tale anche in punti in cui sarebbe del tutto naturale avere problemi. Alcuni studenti del mio corso di Linguistica italiana II hanno individuato registrazioni del corpus CLIPS in cui il mancato riconoscimento da parte di Google o Dragon sembrava direttamente collegato alle caratteristiche della pronuncia. Tuttavia questi errori sono molto rari e, soprattutto, a volte dipendono forse da problemi di audio: quando ho tentato, non sono mai riuscito a replicarli.
Per esempio, nella registrazione LMp2A02N (Napoli) Alessandro Giosi aveva notato che la sequenza “camion rosso”, pronunciato con pesante accento per chiusura metafonetica, veniva interpretata da Google come “camion russo” (da 0:25). La sequenza è questa:
Tuttavia, quando ho provato a controllare, né Google né Dragon hanno dato la stessa risposta: in entrambi i casi la trascrizione è stata “camion rosso”.
Nella registrazione DGmtA04E (Parma) Sofia Ghisellini ha notato che alla pronuncia “all’esterno” diventava “ha le stanno” in evidente rapporto col fatto che la -r- veniva pronunciata con la caratteristica pronuncia uvulare emiliana (da 4:11):
Neanche qui sono stato in grado di riprodurre il problema: tanto Google quanto Dragon mi hanno fornito la trascrizione “all’esterno”.
In opportune circostanze, una pronuncia marcata potrebbe quindi forse indurre in errore i sistemi di riconoscimento. Nella pratica, questo non succede quasi mai... anche perché le situazioni di ambiguità fonetica sono molto poche. Parole come automobbile, per quanto marcate, non possono confondere perché non ci sono parole simili ad automobile che Google o Dragon possano scambiare in questo modo.