Internet au service de la langue française - ANTIDOTE

Druide informatique - Après Antidote, un dictionnaire électronique de 800 000 cooccurrences

Pour découvrir que le mot « passion » se décline en 469 combinaisons !

834608edd14e79a80f5ddc4ff0141aa7

Le «français québécois standard»


Article du Devoir:
Druide informatique existe depuis 15 ans et ne cesse d'utiliser les ouvrages linguistiques déjà réalisés et les progrès technologiques en constante évolution pour lancer d'autres projets. L'entreprise garnit de la sorte son inventaire numérisé de nouveaux outils de soutien à la langue française. Il y a plus d'un an et demi, le Dictionnaire des cooccurrences ou des combinaisons voyait le jour.
Druide apporte sa contribution à la Semaine québécoise des dictionnaires. Éric Brunelle, son président, qui est aussi le concepteur principal d'Antidote, situe son entreprise par rapport à cet événement: «Depuis nos tout débuts, on s'applique sur un point, soit de mettre l'informatique au service de la langue française, en particulier dans la création de dictionnaires. On en compte maintenant dix dans notre répertoire actuel, qui s'appelle Antidote RX, et on en a même publié deux sous format papier aux Éditions Québec Amérique: ce sont les Dictionnaires des synonymes et des antonymes. On est des auteurs de dictionnaires et on est des lexicographes, bien que notre oeuvre la plus connue, qui est Antidote, existe sous forme informatique. Rien n'empêche que le style de sa lexicographie est tout à fait valable.» L'équation est la suivante: Druide égale dictionnaires électroniques et informatiques de la langue française.
Antidote, c'est plus qu'un correcteur, malgré les croyances de plusieurs: «Il en est un et il est très bon; les gens l'aiment bien, assure-t-il. Mais il y a aussi des dictionnaires à l'intérieur. Les personnes qui l'utilisent découvrent la puissance et l'intérêt de nos dictionnaires.»
Au tour des cooccurrences ou combinaisons
Druide, la compagnie mère d'Antidote, produit un ensemble d'outils linguistiques. Le rejeton des cooccurrences contribue maintenant à l'élargissement de la famille. Le président explique sa raison d'être: «C'est notre plus récent dictionnaire et on l'a sorti pour l'édition RX, soit en 2006; c'était une suite logique. On avait créé auparavant WEBELIXIR, un outil qui parcourt le Web pour détecter des erreurs à partir de la technologie d'Antidote. Après quoi, on s'est dit qu'on était peut-être capable de se servir de ce produit pour augmenter la puissance d'Antidote. On s'est dit qu'on pouvait l'utiliser pour aller siphonner d'immenses quantités de textes afin d'en tirer des éléments utiles, comme par exemple des régularités du français. De là est venue l'idée de créer un dictionnaire des cooccurrences.»
Mais qu'en est-il au juste de ces cooccurrences? «Il existe déjà un tel ouvrage au Québec publié par Jacques Beauchesne chez Guérin éditeur. Les Éditions Le Robert ont aussi sorti un livre du même genre qu'ils ont choisi de baptiser Dictionnaire des combinaisons. J'aime bien ce mot qui décrit bien de quoi il s'agit en l'occurrence: ce sont les différentes combinaisons possibles à partir d'un mot.» Il sert son exemple favori, qui porte sur le mot «passion». Il ressort de cette «passion», en consultant le dictionnaire électronique, qu'elle peut être combinée ou accompagnée de 172 épithètes: celle-ci peut être, entre autres, violente, vive, folle, dominante, voire même dévorante. «Ce sont les cinq exemples avec épithètes qui sont les plus fréquents qu'on a trouvés quand on a examiné notre corpus.»
Sans entrer dans une description exhaustive, les 469 cooccurrences de «passion» laissent encore voir quelles sont les utilisations possibles de ce mot, selon la fonction qu'il remplit dans un texte. Des phrases d'auteurs célèbres et respectés, qui contiennent le mot «passion», sont également citées à titre d'exemples. «On retrouve là l'ensemble des combinaisons les plus fréquentes à partir d'un mot. C'est là quelque chose que les langagiers et les gens qui font profession d'écrire aiment bien d'habitude quand ils cherchent l'expression exacte à utiliser. C'est beaucoup plus parlant que la simple définition d'un mot isolé», ajoute Éric Brunelle.
Il est complexe de s'attacher à une aussi vaste tâche que celle de relever l'ensemble des combinaisons les plus courantes avec un mot, comme il le rapporte: «C'est dur à constituer parce que c'est énorme et complexe. On a compilé 800 000 mots illustrés par un million d'exemples dans notre RX, et il va de soi que faire cela à la main aurait été très long. Par comparaison, dans le Robert, on retrouve environ 70 000 entrées. Heureusement, on a pu profiter des services de notre analyseur d'Antidote, qui a tout effectué le travail automatiquement.»
Bâtir sur les acquis
Druide entend perfectionner ce produit: «On est en train de travailler pour améliorer cet ouvrage en agrandissant le corpus de ce dernier, en ajoutant d'autres façons de visualiser l'information, etc.» Pour l'instant, il n'en demeure pas moins que le Dictionnaire des cooccurrences de Druide occupe la position de tête dans ce domaine. Il est le plus important en raison de son caractère électronique, comme il se plaît à le dire: «D'abord parce qu'il a fallu utiliser notre analyseur pour le réaliser. On s'est aussi servi de WEBELIXIR pour aller ramasser le corpus de 500 millions de mots; c'est une tâche qui ne se fait pas à la main. On avait déjà des outils en main et ont les a mis à profit. En bout de ligne, il fallait présenter le travail à l'utilisateur. Comment y arriver sans le support virtuel? Cela aurait pris plusieurs volumes alors qu'il n'y a aucun problème sur l'écran. L'électronique possède beaucoup d'avantages pour une pareille masse de données.»
Druide n'a de cesse d'ajouter des pierres à l'édifice déjà existant et le travail se poursuit. C'est le propre de l'entreprise que de porter plus loin la technologie linguistique en mettant à profit les produits déjà développés et en cours d'utilisation, tout en amenant celle-ci à la portée du plus grand nombre. Le président Brunelle en convient: «C'est là notre philosophie. On est au début de l'utilisation de la puissance de l'informatique au service de la langue. Nous, ce qu'on essaie de faire, c'est de pousser le plus loin qu'on peut. Notre entreprise n'a pas de frein; la technologie évolue sans cesse et nous nous targuons de la faire évoluer.»
***
Réginald Havey
Collaborateur du Devoir


Laissez un commentaire



Aucun commentaire trouvé

-->