Le japonais est une langue sans espace. Pour traiter, mon corpus j’ai dû installer le module janome basé sur un langage Python. pip install janome J’ai écrit le script Python suivant : J’ai utilisé les options tokenizer et analyzer pour tokenizer et compter le nombre d’occurrence par mot. L’option sorted=True permet de ranger dans l’ordre […]
Catégories