Chimrod

Entretenir le bot

Au fur et à mesure que le bot apprend de nouveaux mots, son dictionnaire s'étoffe. Cependant, il arrive un moment ou celui-ci est saturé, et où les réponses deviennent incohérentes. Voici quelques méthodes pour avoir un dictionnaire propre et qui permette de bonnes phrases :

Les commandes en ligne :

Il s'agit des commandes qui permettent d'agir sur le dictionnaire alors que le programme est lancé. Cela permet d'avoir des informations ( !words ) ou de supprimer des mots de manière ponctuelle ( !unlearn word )

Il est possible de supprimer des mots de manière globale, avec la commande !purge mais cela est déconseillé quand le bot est en conversation : d'une part parce que cela va mettre toutes les conversations du bot en attente, et d'autre part car lorsque la commande sera terminée, le bot enverra tout les messages en attente au serveur, ce qui peut provoquer sa déconnexion à cause d'un trop grand nombre de messages envoyé subitement.

Le fichier words.txt :

Ce fichier contient l'ensemble des mots que le bot peut connaître, trié par ordre croissant : ceux qui apparaissent dans un grand nombre de contexte seront mis à la fin. Deux parties nous intéressent dans ce fichier : le début et la fin !


  • La fin du fichier contient les mots les plus fréquents. Normalement, cela devrait correspondre aux alias ou aux mots fréquents du langage courant. Il est possible de se servir de ces mots pour créer des alias qui permettront au bot d'enrichir la diversité de ses phrases. Il est également possible de repérer un mot qui n'aurait pas sa place et qui brouillerait le dictionnaire ( par exemple un nombre, le plus souvent ici des codes couleurs mirc )

  • Le début du fichier permet de voir quels sont les mots les moins utilisés. Cela permet de les supprimer, et de ne garder que ceux qui sont réellement important pour éviter de faire gonfler la taille du dictionnaire en mémoire. Pour supprimer une liste de mots, il suffit de ne garder que les mots dont nous voulons nous débarrasser, et les placer dans un fichier nommé unlearn.txt. Au chargement du bot, ce fichier sera lu par le programme, et tous les mots qui y figurent seront supprimés du dictionnaire.

Les Alias :

Le système d'alias permet de mettre de la variation de manière assez souple. les mots bisous et bizous ( avec une liberté d'orthographe ) ont le même sens, mais le bot va les considérer comme deux mots différents. Il existe de nombreux cas similaires sur le chat... et le système d'alias permet de créer des règles de compréhensions pour pouvoir interpréter ces deux mots comme un seul.

Par exemple pour que bonsoir et bnsr soient tous les deux interprétés comme un seul mot, il suffit de faire une entrée '~bonsoir': ['bo?n?soir'] dans la partie aliases du fichier pyborg.cfg ( les ? indiquent que la lettre qui précède est optionnelle ). Pour assimiler toutes les formes d'écriture de bisous, il est possible de créer une règle telle que '~bisous': ['bi(s|z+)(ou|e?)(s*|x?)']

( Pour avoir l'ensemble des codes utilisables, consultez la documentation de python )

Au démarrage, le bot va consulter la rubrique aliases du ficher pyborg.cfg et mettre à jour ses alias si de nouveaux ont étés rajoutés.

Il est également possible de modifier les alias en lignes à l'aide de la commande !alias mais cela offre moins de possibilités ( par exemple il n'est pas possible de modifier les différents alias enregistrés.

Les mots censurés :

Il s'agit de mots que le bot refusera d'apprendre. La présence d'un de ces mots dans une phrase fera que le bot n'apprendra pas la phrase. Vous pouvez vous en servir pour faire une vrai censure, ou pour empêcher des mots qui n'ont pas de rapport avec la conversation ( ' connection reset by peer', [away] ) etc...

Là encore il est possible d'utiliser les expressions régulières pour mettre en place les variantes de mots..

Généré par ZITE-CMS | Admin