mardi 31 janvier 2012

Finalement le Trameur!

On est arrivé à construire finalement notre concaténation des mots dans le logiciel Trameur. On a réuni d'abord les fichiers correspondant au Contexte des fichiers globaux dans le tableau final. On a décidé de réunir les trois fichiers parce que dans presque chaque page web des URLS choisis on peut rencontrer l'utilisation des deux mots (à l'exception des URLs anglais). Donc on a voulu voir la fréquence d'utilisation des deux motifs dans le contexte général. On a vérifié bien l'encodage UTF-8 de notre fichier, après quoi on a lancé la partie Cooc du logiciel. Voilà ce qu'on a obtenu:
Les graphes de co-occurrence des mots dépassant le seuil de 10. D'abord on a pris en cosidération le mot "blague".













Enfin, la co-occurrence du mot "joke" dans notre contexte,  limitée de 10 mots également.
La poly-occurrence de mot "blague" limitée à 10 mots de seuil.









En effet, le programme nous donne à peu près l'entourage du mot inséré dans le contexte. Ainsi, peut-on voir, avec quels mots notre "motif" s'utilise le plus souvent. On indique la quantité de co-occurrences ce qui nous permet de délimiter un peu le lexique que le logiciel traite. Nous, on a indiqué la limite de 10 mots pour chaque motif. On aurait pu évidemment indiquer n'importe quel nombre de co-occurrences à la limite, par contre, voici ce qui se passe si on ne l'indique pas:





1 commentaire: