Les termes repris dans le top 10 ne permettent pas d'obtenir un résultat exploitables. Dans l'idéal, il faudrait que les mots de liaisons ou les articles par exemple soient ignorés. (the, and, re: ...)
Une possibilité de résolution serait lors de la récupération des termes, de faire un filtre qui éliminerait de lui même les termes inutiles. Il faudrait alors analyser l'ensemble des termes dans les objets afin d'extraire quels sont les termes inutiles et en faire une liste complète ou qui pourrait être complétée.
Diff:
Problème vis à vis de l'amélioriation : certains termes sont identiques mais différent par leur casse, considéré donc comme des termes différents