Catégories
Exercices Journal de Travail Kenza

Segmentation du Japonais

Le japonais est une langue sans espace. Pour traiter, mon corpus j’ai dû installer le module janome basé sur un langage Python. pip install janome J’ai écrit le script Python suivant : J’ai utilisé les options tokenizer et analyzer pour tokenizer et compter le nombre d’occurrence par mot. L’option sorted=True permet de ranger dans l’ordre […]

Catégories
Exercices Kenza

Exercices de Kenza

****A******Ecrire un script bash (que vous mettrez dans le dossier PROGRAMMES) permettant de générer dans le répertoire DUMP-TEXT un fichier txt contenant 2 lignes (sur la première, votre nom, sur la seconde, le mot choisi pour votre projet)** J’ai utilisé la commande echo qui permet d’écrire dans un fichier à l’aide d’un chevron suivi d’un […]