Programmazione.it v6.4
Ciao, per farti riconoscere devi fare il login. Non ti sei ancora iscritto? Che aspetti, registrati adesso!
Info Pubblicità Collabora Autori Sottoscrizioni Preferiti Bozze Scheda personale Privacy Archivio Libri Corsi per principianti Forum
Greenpeace
Forum :: Programmazione.it :: Java :: Similarità tra stringhe
Scritto da magicopino il 11-07-2011 ore 22:22
Salve sto utilizzando la libreria secondstring che contiene una serie di algoritmi per trovare la similirarità tra stringhe. Il problema è che tra tutti questi algoritmi non so quale è quello adatto alle mie esigenza. In particolare ho l'esigenza di confrontare migliaia di stringhe tra di loro e trovare quelle che si refiriscono allo stesso concetto...

Un esempio è il confrontro tra le seguenti stringhe che si riferiscono allo stesso concetto...

1. Conference of the American Association for Artificial Intelligence
2. AAAI - NATIONAL CONF. ON ARTIFICIAL INTELLIGENCE
3. AAAI National Conference of the American Association for Artificial Intelligence

Oltre a queste stringhe potrei avere in questa lista altre stringhe che si riferiscono allo stesso concetto ma che non posso trovare a mano visto che le stringhe sono tantissime.
In altre parole avendo una lista di stringhe di questo tipo devo trovare ed unificare le stringhe che si riferiscono allo stesso concetto. Una possibilità a cui ho pensato è analizzare le prime lettere della stringa in quanto nella maggior parte dei casi due stringhe che iniziano con le stesse iniziali si riferiscono allo stesso concetto (Es. AAAI - NATIONAL CONF..... e AAAI Nationa.....).

Qualcuno ha qualche idea??
Precedente: Un array...poco array!
Successiva: Problema con TransferHandler
Copyright Programmazione.it™ 1999-2013. Alcuni diritti riservati. Testata giornalistica iscritta col n. 569 presso il Tribunale di Milano in data 14/10/2002. Pagina generata in 0.236 secondi.