Indietro

Internet Archive a rischio: perché stiamo perdendo la memoria del web

La battaglia contro i blocchi dei crawler e le sfide legali minaccia la sopravvivenza della Wayback Machine. Ecco l'impatto per utenti e ricercatori.

Internet Archive a rischio: perché stiamo perdendo la memoria del web

L'Internet Archive, pilastro della memoria digitale mondiale, sta affrontando una crisi senza precedenti che mette a rischio la sopravvivenza della Wayback Machine. Nelle ultime 48 ore, è emerso che oltre 23 grandi testate giornalistiche e piattaforme come Reddit hanno iniziato a bloccare sistematicamente il crawler ia_archiverbot. Il motivo principale risiede nel timore che l'archivio venga utilizzato come "scorciatoia" gratuita dalle aziende di intelligenza artificiale per addestrare i propri modelli senza pagare licenze.

L'impatto pratico è devastante per chiunque si occupi di fact-checking o ricerca storica. Senza l'archiviazione automatica, le prove di modifiche ai testi, la cancellazione di post governativi o la scomparsa di siti web diventano impossibili da tracciare. In Europa, questa situazione si scontra con le rigide normative del GDPR e del "diritto all'oblio". Molti siti europei stanno sfruttando queste leggi per giustificare il blocco dei bot, creando un "buco nero" informativo che frammenta la rete e impedisce la conservazione del patrimonio culturale digitale.

Per professionisti e cittadini, il rischio è la perdita di uno strumento di trasparenza fondamentale. Se i giganti dell'editoria e le piattaforme social continueranno a blindare i propri dati, la Wayback Machine potrebbe trasformarsi in un guscio vuoto, privando le generazioni future della possibilità di consultare la storia del web così come è stata scritta in tempo reale.