Wayback Machine, la nota interfaccia Web per scovare pagine non più esistenti su Internet, anche da anni, potrebbe presto rendere pubblico un motore di ricerca interno al fine di rintracciare, con una semplice query in stile Google, ogni stringa di testo presente tra le centinaia di miliardi di pagine indicizzate negli ultimi 15 anni dal servizio messo in piedi dall’associazione senza scopo di lucro Internet Archive. Ad oggi è infatti possibile solo cercare url ma non il contenuto delle pagine indicizzate dal noto servizio di Internet Archive.

La possibilità di usufruire di un motore di ricerca testuale rappresenterebbe una rivoluzione non da poco per tutti coloro che fanno ampio uso della Wayback Machine ma anche per semplici studiosi e scienziati che intendono rintracciare pagine Web e documenti oramai non più esistenti su Internet perché cancellati o semplicemente non più rintracciabili.
Numerosi studi, infatti, hanno già dimostrato che la vita media di una pagina Web su Internet è di soli 100 giorni. Le pagine Web vengono infatti sempre più spesso cancellate, pesantemente modificate o semplicemente rimosse qualora non risultino più funzionali allo scopo dell’editore o per altri motivi tecnici. Una notevole perdita in termini di documentazione relativa a questa era digitale.

La Laura and John Arnold Foundation ha annunciato dunque una nuova sovvenzione a Internet Archive affinché si possa realmente mettere in piedi un progetto relativo al tanto agognato motore di ricerca interno, una feature che la stessa IA sta tentando di aggiungere alla propria interfaccia già da diversi anni ma senza successo.
È evidente che, dato il grandissimo numero di pagine Web e documenti indicizzati e catalogati nel corso degli anni dal servizio, il compito di creare un motore di ricerca che possa indicizzare tutto il materiale e renderlo disponibile all’invio di una semplice query rappresenti un compito di non facile soluzione.

La rivoluzione sarebbe rappresentata in particolare dal fatto che, praticamente di colpo, si aggiungerebbero alle possibilità di ricerca tramite Google una nuova finestra su una Internet ormai scomparsa da tempo che, da sola, potrebbe rendere disponibile ulteriori centinaia di miliardi di pagine con un semplice click. Un progetto non indifferente, dunque, a tutto ciò che rappresenta Internet per studiosi, scienziati e ricercatori.
“Abbiamo bisogno di una libera documentazione pubblica e aperta che possa essere utilizzata per rendere i governi responsabili, al fine di garantire che le prove con citazioni siano accurate e complete, e per guidare il processo decisionale nell’era digitale. Rendendo più facile la ricerca con la Wayback Machine, Internet Archive sta contribuendo a conservare le informazioni all’interno dell’infrastruttura del Web”, dichiara Kelli Rhee, vicepresidente della LJAF.

Approfondimenti