Nel mio
precedente articolo ho descritto l'algoritmo in grado di rintracciare attività terroristica su Internet. Ma come funziona?
Prendiamo alcuni algoritmi già esistenti per adattarli e modificarli, allo scopo di individuare contenuti terroristici sul Web. L’algoritmo ci permette di analizzare un testo e riprodurne il modello. L’allarme scatta quando troviamo altri testi che riproducono questo modello - spiega
Mark Last.
L’algoritmo costruisce in pratica un vocabolario di tutte le parole e le frasi che appaiono in almeno alcuni dei testi terroristici che sono già noti. Durante la fase di prova si prendono dei documenti provenienti da siti usati da gruppi terroristi e si fa in modo che l’algoritmo ne impari la struttura, basandosi sulle relazioni tra le parole. Dopodiché l'algoritmo può essere applicato ad un nuovo documento, dal contenuto sconosciuto, ed è in grado di catalogarlo, cioè di trovare la categoria alla quale questo testo Web ha il maggior numero di probabilità di appartenza.
Esaminando migliaia di parole in poco tempo, l'algoritmo sceglie quelle che gli permettono di distinguere meglio tra un contenuto allarmante e ciò che non lo è, continua il
Mark Last. Se un testo contiene determinate parole ci sono maggiori probabilità che abbia contenuti terroristici. Per esempio, il modello stabilisce che le parole, che devono destare allarme sono
sionista,
martire,
Al Quds e
nemico. Se una sola di queste parole appare nel documento, allora è probabile che si tratti di un testo terroristico. Viceversa, è altamente probabile che non si tratti di terrorismo.
L'inizio della ricerca per lo sviluppo dell'algoritmo risale a circa due anni e mezzo fa, quando l’uso di Internet da parte dei terroristi è diventato uno dei maggiori problemi perché è conveniente, per alcuni gruppi estremisti all’interno di comunità terroristiche, comunicare via Internet tra di loro. Secondo gli esperti il numero di coloro che partecipano a forum jihadisti sul Web è piuttosto alto nei Paesi europei, come la Germania, il Regno Unito, la Francia e l’Italia.
Da una parte l'Intelligence può essere interessata a monitorare questi siti Internet per raccogliere informazioni interessanti, anche sul piano operativo, sui metodi usati dai gruppi terroristici per reclutare e dare istruzioni. Dall’altra l’interesse può essere quello di oscurare questi siti internet per interrompere la loro attività.