en
SICH Semantic Illegal Content Hunter
SICH è un progetto che ha l'obiettivo di recuperare contenuto illegale su Internet attraverso l'analisi semantica dei contenuti delle pagine.

Infatti, l'attività di esplorazione e ricerca di pagine e/o di siti contenenti materiale illegale, tramite ricerche basate su parole chiave ed analisi manuale dei testi, risulta particolarmente onerosa e poco efficace in termini di tempo e di precisione/completezza dei risultati ottenuti.
L'inefficacia di tale attività è dovuta all'impossibilità da parte dell'utente finale, in fase di analisi dei testi, di poter riconoscere, individuare ed utilizzare in modo rapido la terminologia specifica dei domini di interesse.
Ad esempio, se l'utente cercasse con google il termine "Black Mamba", otterrebbe, come primi risultati documenti che parlano di un particolare tipo di serpente. Solo scorrendo molti risultati potrebbe trovare pagine/siti sulla omonima sostanza psicoattiva.
Ciò vuol dire che l'utente finale, solo dopo numerosi tentativi, avrà sviluppato una conoscenza tale da permettergli di individuare in modo preciso l'occorrenza del concetto "Black Mamba" inteso come droga.
Cosa succederebbe se l'utente avesse a disposizione questa tipologia di informazione in maniera automatica?

L'obiettivo di SICH è proprio quello di mettere a disposizione dell'utente finale la conoscenza specifica di tre domini: Xenofobia/Razzismo, Gioco d'azzardo illegale online e Nuove Sostanze Psicoattive - NPS al fine di individuare l'occorrenza di concetti propri dei suddetti domini, a prescindere dalla forma con cui essi si presentano all'interno dei testi.
In questi contesti, l'utilizzo dell'analisi semantica è particolarmente indicato.
Per chi non è familiare con questo tipo di approccio, per capirne di più si può : SICH permette di recuperare contenuti illegali in mezzo alla miriade di contenuti presenti su Internet.
Ad oggi, il world wide web ospita 6,80 miliardi di documenti indicizzati e il web 2.0 (utilizzato da gran parte degli utenti Internet) contribuisce all'incremento della velocità di creazione/eliminazione di nuovi contenuti.
Il Contenuto Illegale (Illegal Content) non è, però, limitato al contenuto esplicitamente contrario alle leggi, ma ai contenuti offensivi o prodromici ad attività o comportamenti illegali; inoltre, nei paesi EU, non esiste una uniformità normativa e legale che permetta di gestire in maniera omogenea tale problematica.

Allo stato attuale, le forze dell'ordine, gli enti di ricerca, i media e le organizzazioni internazionali attive nella conoscenza dei contenuti illegali online possono riscontrare grandi difficoltà nel raccogliere e gestire la mole di documenti/contenuti relativi ad uno specifico argomento e/o crimine. Per tali motivi, strumenti atti a supportare gli analisti nell'identificazione, selezione ed analisi dei contenuti online illegali possono migliorare drasticamente i tempi di apprendimento di un fenomeno; strumenti che possano, cioè, "cacciare", contenuti illegali nascosti all'interno della pletora dei contenuti testuali presenti in rete.
L'utilizzo di uno strumento strategico come SICH offre ai suoi utilizzatori la possibilità di ottenere una migliore e più rapida comprensione della criminalità su Internet, di fornire risposte rapide e mirate nelle attività di indagine, di analizzare le tendenze e di supportare la cooperazione tra esperti del settore, LEA e privati.
maggiori info