Latency (Latenza AI)
La Latenza è il tempo di attesa tra l'invio di un comando all'AI e l'inizio della ricezione della risposta. Si misura in millisecondi ed è cruciale per le app in tempo reale.
Se parli con un'AI e lei ci mette 10 secondi a rispondere, la conversazione sembra finta e frustrante. Se risponde in meno di 200ms, sembra di parlare con una persona vera.
Ridurre la latenza è la sfida tecnica del 2026: per avere traduttori universali o assistenti vocali fluidi, l'AI deve 'pensare' quasi alla velocità della luce, ottimizzando i server e i chip che la fanno girare.