Question 1

Che cos'è ASR (Riconoscimento Vocale)?

Accepted Answer

L'ASR (Automatic Speech Recognition) è la tecnologia AI che cattura l'audio del linguaggio umano parlato e lo converte in testo scritto in tempo reale. È il sistema dietro alla dettatura vocale, ai sottotitoli automatici e alle trascrizioni dei meeting.

Question 2

A cosa serve ASR (Riconoscimento Vocale) nell'IA?

Accepted Answer

Trascrivere il parlato umano è un inferno per i computer: le persone mangiano le parole, parlano sovrapponendosi, usano accenti strani e c'è sempre rumore di fondo. L'ASR risolve questo problema usando reti neurali addestrate su milioni di ore di registrazioni vocali accoppiate ai relativi testi.