Una squadra di ricercatori di DeepMind, una società inglese impegnata nello studio dell’intelligenza artificiale ed acquisita due anni fa da Google, hanno dichiarato di aver insegnato ai computer a leggere a capire la lingua inglese utilizzando un database di circa 330.000 articoli on-line presenti sui siti della CNN e del Daily Mail.
Queste due testate sono state scelte perché entrambe dispongono di riassunti che precedono l’articolo compilati secondo punti di sintesi elencati uno dopo l’altro.
Il computer avrebbero studiato gli articoli basandosi proprio su questi riassunti iniziali nel tentativo di migliorare le tecniche oggi esistenti nel campo dell’apprendimento profondo (deep learning) elaborando il linguaggio naturale attraverso i documenti scritti.

Attualmente, infatti, risulta ancora molto difficile estrarre le fasi salienti e le parti più importanti da un testo scritto in maniera prettamente automatica. Il lavoro eseguito su due siti succitati sarebbe ancor di più avvalorato dal fatto che le sintesi degli articoli, pubblicate sotto forma di elenchi iniziali prima degli stessi articoli, non sono nere copiature di frasi estrapolate dall’interno dell’articolo ma rappresentano riassunti estremamente schematici del suo contenuto con parole e frasi originali.
Ciò ha permesso agli algoritmi di DeepMind di creare database di annotazioni mettendoli in relazione con testi degli articoli.

Gli scienziati sarebbero stati dunque in grado di porre domande al computer e di ottenere un tasso relativamente alto di risposte precise. I computer sono stati in grado, infatti, di rispondere in maniera positiva o precisa al 60% delle domande che venivano loro poste.
Le difficoltà sorgevano solo con periodi composti da frasi molto complesse in cui erano presenti nozioni o notizie chiave dello stesso articolo.

Approfondimenti