TÉLÉCHARGER CORRECTEUR DORTHOGRAPHE ET GRAMMALECTE GRATUIT FRANÇAIS OPEN OFFICE


Grammalecte est un correcteur grammatical et typographique open source dédié à la langue française, pour Writer (LibreOffice, OpenOffice), Firefox Veillez à télécharger celle pour votre logiciel. Grammalecte est un logiciel open source et gratuit qui a besoin de vos dons pour exister. Vérification de l'orthographe. Vous utilisez LibreOffice ou OpenOffice, les deux plus célèbres suites bureautiques libres, et vous êtes un peu fâché avec l'orthographe? Grammalecte est un. 4 févr. Download extension. System Independent [fr] Grammalecte est un correcteur grammatical dédié à la langue française, basé sur Lightproof.

Nom: correcteur dorthographe et grammalecte gratuit français open office
Format:Fichier D’archive
Version:Dernière
Licence:Usage Personnel Seulement
Système d’exploitation: MacOS. Android. iOS. Windows XP/7/10.
Taille:37.46 MB


Et quelques règles servent réellement à modifier ce qui est écrit, là encore pour simplifier. Surtout quand on voit les exemples de phrases ambiguës, ça donne à réfléchir sur sa propre langue maternelle. Content marketing. Cela aiderait beaucoup les règles suivantes. Pour rappel, elle est appelée à remplacer OpenOffice. Quel est ton objectif ultime? LibreOffice Math : création de formules mathématiques. Le correcteur grammatical ne sait pas décider si ce doit être un nom ou un adjectif.

Téléchargement sécurisé et rapide du logiciel Grammalecte GRATUIT. logiciel classé et orthographique complet qui se greffe aux suites OpenOffice et Libre Office. corrige les erreurs: Orthographe, Grammaire, Doublons, Ponctuation, Espacements, Dernière version disponible en Français classée dans Dictionnaire. Il suffit de le télécharger ici et faire un double clic sur l'exécut. Allez dans Outils pas déjà là Il faut aussi activer l'icône de correction dans la barre d'outils. LanguageTool est une extension Open Office, libre et gratuite, qui permet Telecharger correcteur d'orthographe et grammaire gratuit français.

On aboutit à ceci :. Ces mêmes options existent aussi en version 4. D'où la référence aux dictionnaires. On est Ok mais le dico est intégré dedans , j'ai fait des essais de correction pour voir. Oui, lors de son installation, LibreOffice propose ses propres dictionnaires :. Merci pour vos aides, mais je confirme que la mise à jour de mon fichier était bien 4.

Mais rien ne fait encore sur CALC, comme le montre la feuille ci-jointe, avec mes 3 mots "zétranges" en teste. Je remarque que la langue ne figure pas dans la fenêtre, bien que je la trouve un peu plus loin, en déroulant "outil".

Pas moi, car j'ai fait le choix de toujours rester avec la dernière version stable. En cliquant sur oui à la question posée sur ta copie d'écran , tu devrais voir les fautes relevées. Si la question ne t'est plus posée, mets ton curseur en haut de page, et tu devrais voir les fautes relevées. À droite, Grammalecte en sus des mêmes dictionnaires idem. Bonne soirée. Je capitule : l'ensemble des fichiers se contrôlent bien, sauf quelques uns, dont la copie d'écran!!! Merci à vous, et je garde vos infos.

FRANÇAIS DORTHOGRAPHE ET TÉLÉCHARGER GRATUIT OPEN GRAMMALECTE OFFICE CORRECTEUR

Pour tout vérifier tu dois sélectionner toute la page elle sera colorée en bleu chez moi c'est tout. Je reviens sur ce sujet que je n'ai toujours pas réussi à résoudre. Je confirme, aucune des solutions proposées ci-dessus ne dépanne mes fichiers nouveaux, alors que les anciens fonctionnent. Je viens de télécharger la dernière version, sans plus de résultats. Ta copie d'écran montre que tu as fait le choix de rester en version Beta de LibreOffice.

Je ne sais pas si tes soucis viennent de là, je ne l'affirmerai pas. Tout ce que je peux te dire, c'est qu'avec la dernière version stable 4. Hélas, le problème reste le même!!!! Je me débrouille, en copiant un fichier ancien qui fonctionne. Bonsoir mjd, je ne me lance pas sur ta proposition, je ne m'en sens pas capable. Mais ne ferme pas le sujet. Merci, et bonne soirée. S'inscrire Se connecter. Correcteur orthographique Libre Office.

Ajouter un message à la discussion. Page 1 sur 1. Bonsoir, Je viens de télécharger la dernière version de Libre Office, et je m'étonne de constater que le correcteur orthographique est inopérant.

Ensuite, tu peux utiliser quelques heuristiques niveau de langage du reste du texte, qui permet de choisir une des signification plutôt qu'une autre, domaine de langage du reste, etc…. Au lieu de chercher à réduire à une étiquette par mot, je laisserai l'ensemble des possibles pourquoi pas avec un pourcentage de probabilité et je couperais les étiquettes fausses si on prend la phrase entière. Les probabilités peuvent servir pour trier les suggestions de correction. On est vraiment encore très loin de pouvoir faire ça.

Au lieu de chercher à réduire à une étiquette par mot, je laisserai l'ensemble des possibles pourquoi pas avec un pourcentage de probabilité. Une chose à la fois. Les probabilités ne seront utilisées un jour que lorsque le désambiguïsateur ne suffira pas. Pas en grammaire. Mais sur les mots mal orthographiés, oui.

Grammalecte ·

Encore faudrait-il avoir un correcteur orthographique qui puisse se servir de ça. Merci pour cet article intéressant. Et merci pour Grammalecte, qui comble un manque important dans l'univers du Libre francophone.

Je n'ai pas encore vraiment regardé, mais c'est peut-être une solution intéressante sur laquelle s'appuyer pour faire un tokenizer et plis si affinité…. Super chouette article, merci de partager cela. La partie technique me fait penser aux techniques de compilation : tokenisation, reconnaissance de motifs, optimisations suppression ou remplacement de motifs par d'autres. Quelques remarques qui peuvent t'intéresser ou pas : - Tu opposes le traitement par tokenisation et l'analyse de zones de textes.

Les différentes passes de vérification pare exemple le typage se font sur ces arbres. Un langage proposant de la reconnaissance de motifs en natif est d'une valeur inestimable. Je connais et utilise ocaml qui a fait ses preuves dans ce domaine, mais je suis sur qu'il en existe plein d'autres. Pour m'être brièvement intéressé à la question de l'analyse grammaticale, l'analyse syntaxique de langue naturelle est beaucoup plus compliquée que celle pratiquée dans les compilateurs: la plupart des grammaires des langues naturelles sont des grammaires contextuelles fort propices aux ambiguïtés.

Pour le peu que je comprend le sujet, il semble exister une recherche fort active sur cette question autour des grammaires d'arbres adjoints et le développement de méta-grammaires pour générer automatiquement des grammaires à partir d'un corpus de texte.

Par contre, les applications pratiques de ces modèles pour faire de la correction grammaticale semblent manquer. Il est d'ailleurs un peu déconcertant de voir grammalecte utiliser des simples expressions régulières pour faire de l'analyse grammaticale.

Enfin, le pragmatisme a ses vertus. Et ses limites, ça devient vite un sac de noeud de l'aveu même de l'auteur ou il ne peut toucher à un truc sans être sur d'en casser un autre et ou c'est difficile de se plonger dans la base de code :. Grammalecte doit faire avec ses propres limites, son propre potentiel, et ça ne correspond pas à ce dont les papiers parlent en général.

OFFICE DORTHOGRAPHE TÉLÉCHARGER GRAMMALECTE OPEN CORRECTEUR ET GRATUIT FRANÇAIS

Il faut mettre les mains dans le cambouis pour constater les innombrables micro-problématiques auxquelles il faut faire face. Tu opposes le traitement par tokenisation et l'analyse de zones de textes. En réalité tu n'as pas besoin de choisir, tu peux avoir les deux. Découper chaque phrase en tokens, les mémoriser, les étiqueter, les classer, etc.

Au lieu de composer des syntagmes étiquetés, on réduit les syntagmes à leur plus simple élément, voire on les élimine complètement quand ils ne servent plus. Si un jour, je fais de la tokenisation dans Grammalecte, il sera sans doute cohérent de revoir complètement son mode de fonctionnement.

Bravo pour ce travail énorme et pour ce journal très détaillé. Est-ce qu'il ne serait pas utile, pour améliorer encore cet outil, de trouver des collaborations avec des linguistes ou des enseignants dans ce domaine? La collaboration pourrait se révéler fructueuse!

Je lis le blog des correcteurs du Monde , peut-être seraient-ils intéressés de savoir qu'une telle application existe, ne serait-ce que pour en parler ou pour l'améliorer? Le Net regorge déjà de ressources. Prenons le cas du désambiguïsateur que je prévois de créer, son code devrait être relativement rapide à concevoir. Avant de donner, sur ullule, il me manque une mention à propos de la licence qui sera choisie pour les divers composants serveur, modules…. De plus, l'en-tête du site parle d'open source alors qu'il pourrait parler de libre puisque ce qui existe déjà est sous GPL et MPL.

Lightproof est publié sous triple licence: GPL 2. Du coup, pour éviter les prises de tête, je vais tout mettre tout ce que je peux en MPL 2. En complément d'Hunspell, tu pourrais peut-être utiliser le wictionnaire. En général il donne une version phonétique des mots, ce qui permettrais de donner des suggestions en cas d'homonymes. Super projet, d'autant que refaire tout ça en javascript permettrait aussi de l'utiliser dans des applications firefox os et android.

Sinon, je remarque qu'il n'y a pas de paquet debian pour Grammalecte. C'est pas tellement que je ne peux pas installer une extension à la main, mais j'ai l'impression qu'il n'y a du coup pas de compatibilité : Avec libreoffice 4.

Car il y a des tas de cas où cette suite de mots est correcte. Il y a rarement des erreurs sans confusion basée sur la phonétique. En bref, les ressources sont limitées. Je préfère les consacrer à autre chose. Finalement, pour la crédibilité du correcteur, ça a peut-être un intérêt, mais juste pour ça.

Mais il se trouve que certaines règles du préprocesseur les rendent inopérantes. À revoir donc. Je réalise qu'une extension possible grâce à ton préprocesseur serait de pouvoir faire de la correction de grammaire d'un texte en latex. Actuellement j'utilise LanguageTool dans vim, et pour un texte d'environ une page, j'ai déjà une centaine de faux positifs! En ajoutant une passe à l'étape 0 qui vire toutes les macros, on pourrait donc les éviter facilement.

Tu dis: "Le correcteur ne sait pas où chercher une conjugaison adéquate. Il me semble qu'il existe dans les entrées du dictionnaire un représentation phonétique de chaque mot sinon, ces dictionnaires existent en opensource, par exemple chez eSpeak pour la synthèse vocale, LLIUM pour la reconnaissance vocale, etc…. Du coup, en ajoutant une n-ième passe au préprocesseur lors de la détection d'une erreur , qui aurait pour entrée l'index des mots en "phonétique" qui, par définition est un mapping 1:n, pourrait lors d'un mot incongru Il s'en "fou" , chercher si un des résultats pour l'entrée phonétique "fu" pourrait convenir.

Dans ce cas aussi simple, il trouverait immédiatement le verbe conjugué, et n'aurait plus qu'à choisir la bonne conjugaison parmi "fous, fout". Après, avec un TernarySearchTree indexé sur les clés phonétiques, on pourrait même envisager une recherche approximative type Levenshtein, distance de Hamming pour trouver des mots dont la phonétique est "proche" de l'item erroné - Cela ne donnerait pas de faux positif puisque ceci démarrerait uniquement sur détection d'une erreur, tel qu'actuellement.

On est alors clairement dans l'aide à l'utilisateur, au lieu de détecter une erreur et de ne pas savoir quoi suggérer, on pourrait envisager un menu "Ils son faux.

C'est ce que fait Google pour ses suggestions de correction de recherche. Il faut définir des seuils donc risque de faux positifs quitte à laisser le seuil à 0 par défaut et laisser les utilisateurs aventureux à monter le seuil. Je ne possède aucun des logiciels ci-dessus. Le numéro de version de Grammalecte se veut assez réaliste. Il y a encore beaucoup à faire. Sur la page ulule tu évoques l'utilisation de grammatical dans l'administration, est-ce que tu en sais plus?

À quelle échelle? As-tu des retours de leur part? Ce qui me fait d'ailleurs pensé que j'apprécierai que mes impôts financent de tels projets d'intérêt public plutôt que des produits privés qui ne profiterons pas aux contribuables. En ce qui concerne l'implémentation des tests, je pense qu'il est déjà possible de créer quelques cas unitaires qui se focalisent sur des fonctions élémentaires c'est d'ailleurs une bonne pratique dans le domaine de commencer ainsi, puis sur des fonctions un peu plus évolués et ainsi de suite par exemple, les deux premières phases du préprocesseur ne font, a priori, pas appel au correcteur orthographique.

Enfin, une autre technique serait le bouchonnage, pour simuler les appels au correcteur orthographique et renvoyer les valeurs attendues pour une petite liste de terme. J'entends bien que ce n'est pas la solution idéal, mais c'est un premier pas qui t'aidera un peu dans l'immédiat et qui te permettra également de développer plus rapidement tes tests lorsque tu sera en mesure d'utiliser une implémentation complète.

Toujours dans le même sujet, tu utilise un corpus d'erreurs grammaticales, est-ce toi qui l'a créé? Car il en existe quelques-uns qui ont été créés dans le but justement de tester des outils de vérification grammaticale.

PS : vu l'heure, j'affirme, sans trop prendre de risque que, oui, j'aurai bien besoin d'une intégration de grammalecte dans Firefox.

Les administrations et institutions publiques qui installent LibreOffice le font en principe à partir du SILL et donc disposent de Grammalecte. Grammalecte fait partie du socle interministériel des logiciels libres.

Il est utilisé dans certaines administrations, mais je ne sais plus lesquelles. À quelle échelle, je ne sais pas. Toutes les passes font appel au correcteur orthographique. Je teste ce que le correcteur est censé détecter ce point est à améliorer. Je le déploie dans un Établissement Public Administratif rattaché au ministère de la culture sur environ postes de travail.

Par contre, Grammalecte est bien plus strict et pertinent sur la typographie au passage, serait-il possible de détecter les doubles retours à la ligne et de suggérer de régler les interlignes dans le style de paragraphe? Ça parait très bien quand tu t'es foiré et que ton design ne te permet pas de faire des tests unitaires ou d'intégration, mais ce que ça provoque en vrai ce sont des tests suites extrêmement lentes et des causes d'échecs difficiles à analyser. Le lecteur intéressé pourra trouver pleins de choses intéressantes en cherchant "test ing?

Tu as tout a fait raison pour la pyramide des tests et sur le fait que ce ne sont pas des tests unitaires. Cependant, il faut comparer cette solution avec l'existant a base de vérifications manuelles.

Je trouve que l'approche présentée par Landry MINOZA permettrait d'avoir des aujourd'hui des tests automatisés, bien plus sûrs et rapides que les vérifications manuelles. Lorsque le code s'y prêtera mieux avec un bon design comme tu le soulignes , alors il sera toujours possible de passer sur des tests vraiment unitaires. Mais ce jour n'est pas encore là. D'ailleurs c'est un des buts du financement participatif présenté dans la dépêche.

Maintenant je vais attendre la fin de la campagne.

OPEN TÉLÉCHARGER GRAMMALECTE DORTHOGRAPHE FRANÇAIS ET CORRECTEUR OFFICE GRATUIT

Cependant, pour ta nouvelle version le fameux serveur envisages-tu d'utiliser un langage d'IA par exemple, Prolog ou Lisp qui est adapté à ce genre de choses? Comme l'a suggéré lucio , tu pourrais prendre contact avec des chercheurs avec qui tu pourrais travailler. Je connais le département Informatique et Intelligence Artificielle de Luminy à Marseille - j'y ai fait mes études , et certains chercheurs travaillent sur la reconnaissance du langage naturel : il y aurait peut-être une synergie à créer?

Certains passages de ton article m'ont rappelé mes années d'étudiants je ne fais plus d'IA depuis que j'ai quitté la Fac. Il faudrait déjà résoudre les ambiguïtés grammaticales. Grammalecte est encore un petit projet.

Je peux m'appuyer sur Eclipse JDT pour les analyses lexicales, syntaxiques et sémantiques analyse des types, des variables, etc. Malheureusement, la langue naturelle n'est pas aussi logique, et le processus classique des compilateurs ne fonctionnent pas ou difficilement. Je te tire mon chapeau pour oser t'attaquer à ce problème très difficile. Ton analyse en plusieurs passe qui transforme le texte est une idée très intéressante pour palier aux multiples formes que permet un langage naturel.

Merci d'en avoir expliqué le concept. Comme tu l'as fait remarquer, j'y vois hélas un inconvénient majeur: c'est lorsqu'il s'agit de rapporter les erreurs sur du texte modifié.

Les compilateurs transforment plusieurs fois le code source en interne pour finalement parvenir à générer du code. Pour pouvoir correctement rapporter les erreurs a n'importe quel moment de la phase de compilation, il est impératif de pouvoir toujours revenir vers le texte initial en gardant des marqueurs ou des informations de localisation sur le texte source original.

OFFICE FRANÇAIS OPEN CORRECTEUR DORTHOGRAPHE GRAMMALECTE TÉLÉCHARGER ET GRATUIT

C'est aussi ce qui est fait dans le code généré pour pouvoir se référer au code source original lors de séances de débogage Voir DWARF ou les source maps en javascript. C'est comme ça que le problème est résolu dans les compilateurs. Je ne sais pas si c'est applicable a ton cas ou bien si cela ferait exploser la consommation mémoire, mais bon je me suis dit que ça pourrait être utile d'en parler.

Sur l'utilisation des expressions rationnelles, je sais a quel point cela peut être difficile. J'ai commencé comme ça avant de créer sur AutoRefactor a cause de la difficulté a les utiliser correctement et a les maintenir.

Elles sont souvent imprécises la plupart de l'espace pris par une regexp c'est uniquement pour la gestion des espaces , complètement ignorante de la sémantique de ce qu'elles traitent pas d'informations de type! Réponse: 2 regexps avec duplication de code. Je pense que tu dois passer beaucoup de temps a les mettre au point. Tu as beaucoup de courage.

La ou je te plains, c'est que tu n'as pas de tests unitaires : J'ai commence par un truc sale pour faire les tests: un booléen dans le code du plugin qui exécute les tests sur des exemples de code: Je lançais Eclipse sur le projet avec les exemples. Si la variable booléenne test valait vrai , alors le plugin parcourait le projet pour trouver les exemples avec le code d'entree et le code en sortie, il appliquait les transformations et vérifiait que le résultat final était obtenu.

Il affichait alors une fenêtre avec les résultats. Je t'encourage a faire ça en premier, c'est une investissement qui vaut vraiment le coup. Le temps passé dessus est récupéré plusieurs fois au fil du temps.

Finalement, je vois que tu as créé un outil que l'on retrouve dans le développement: un formatteur. De même dans l' Analyse statique de programmes , on retrouve le problème des faux positifs. Comme je l'ai déjà dit, les parallèles sont rigolos :. Ça va bientôt se faire. Ceux programme ait tous buggais : ils sais mi a clignotez de par-tout puit n'autre ordinateurs as commencer a fumée.

Esse nord mâle? Il a été fait mention, dans d'autres commentaires, au parallélisme entre la correction grammaticale et la compilation de code informatique. Et ta description du fonctionnement de grammalecte n'y ai sans doute pas étrangère. S'il est bien vrai que les compilateurs vérifient la syntaxe et la grammaire du code, ils font aussi de la traduction : c'est leur fonction première.

Grammalecte, correcteur grammatical - zabej.info

Par contre, il t'a été proposé de regarder du côté du langage Ocaml pour écrire ton moteur d'analyse grammaticale. Je pense que ce pourrait être une bonne idée. La manipulation d'arbre de syntaxe abstraite AST , ainsi que leur création, est un domaine dans lequel ce langage excelle.

Les compilateurs manipulent essentiellement ce type de structure de données; et après la lecture de l'article wikipédia sur les syntagmes, il me semble que c'est la structure la mieux adaptée pour résoudre les questions d'analyse grammaticale je ne suis pas programmeur, donc je me trompe peut être. Gérard Huet informaticien émérite français, chercheur inria a publié un article sans rapport apparent : Fondements de l'informatique, à la croisée des mathématiques, de la logique et de la linguistique étonnement c'est un docx!?

Je ne sais pas si on fait encore beaucoup ça, mais de mon temps on décortiquait les phrases : toute phrase doit avoir un verbe, tout verbe doit avoir un sujet. Là, il y a un petit bout de raisonnement aussi.

Et tout cela, dans l'exemple français choisi, n'est qu'une double application de la règle d'inférence logique dite du Modus Ponens si A alors B, or B donc A.

De plus, le même chercheur a en ligne un dictionnaire de sanskrit avec de l'analyse de lexème et de grammaire pour cette langue. Sans doute a-t-il utilisé ce type de technique, et le contacter pourra t'être utile?

Dans le fond, au premier abord, si l'on travaille sur un AST représentant des syntagmes, vérifier la bonne formation grammaticale d'un syntagme me fait penser à de l'inférence de type, voire de la preuve automatique si l'on cherche des suggestions à soumettre à l'utilisateur.

Sapere aude! Aie le courage de te servir de ton propre entendement. Voilà la devise des Lumières. Il y a aussi des fautes de grammaire, comme quoi ce genre d'outil intégré à Firefox serai d'une grande utilité. Il faut bien le dire avant toute chose, OCaml est un langage qui brille dans le domaine de l'analyse statique et la compilation. Il y a plusieurs raisons à cela. La première concerne la programmation fonctionnel. Le principe de la programmation fonctionnel est que tout est fonction. Mais en disant cela, on a rien dit.

En vérité, la programmation fonctionnel offre une manière de penser qui, justement, est parfaite pour ce qui est de l'analyse et de la transformation. Un langage impératif offre une vision d'états de la machine un nombre d'état qui peut devenir exponentielle dès qu'il s'agit de faire de multi-threads de manière séquentielle comme la recette de cuisine qu'on nous ressort à chaque fois qu'on souhaite apprendre l'informatique. Mais dans une problématique de recherche et de transformation, cette notion d'état n'a pas grande importance.

Ce qui est important dans un compilateur par exemple, ce n'est pas l'état de celui-ci, c'est les règles de transformations qu'il va appliquer, et c'est bien là la nature d'un compilateur, c'est les règles lexicales, syntaxiques et sémantiques de transformation qui nous intéresse.

C'est en ce premier point qu'OCaml mais tout langage fonctionnel de manière général est plus propice au travail de compilation et d'analyse du code. La deuxième concerne le milieu d'OCaml. OCaml est un langage qui vient de l'Inria et qui est encore maintenu par pas mal de chercheur notamment le laboratoire Gallium. Il est au final très plaisant de travailler avec où l'important n'est pas la date de la prochaine release d'OCaml mais l'intégration d'un travail qui correspond à l'état de l'art de toutes leurs recherche.

Ceci donne alors un compilateur associé à pas mal de papiers de recherches pas si difficile à lire que ça qui offre un aspect qui va bien au delà du simple hype au langage. Et c'est bien un des rares langages à pouvoir mélanger les deux. La troisième raison concerne bien entendu son système de type qui fait qu'OCaml est OCaml. Dans un domaine comme celui de la compilation, le premier point le plus important est que le compilateur ne produise pas quelque chose qui ne fonctionne pas.

Ce serait bête de faire un "Hello World! Sur ce point qui parait bête, les problématiques de la compilation vont bien plus loin que de simplement produire ce qu'on nous demande. On doit aussi vérifier ce que nous produisons. Une des solutions aujourd'hui est le test unitaire qui permet à fortiori de savoir si le comportement de notre programme correspond à nos attentes. Bien que cette manière est très bien, elle n'est pas exhaustive, elle se limite à l'imagination que peut avoir le développeur sur les cas d'utilisations possibles de son logiciel.

Ainsi, les chercheurs ont cherché c'est leurs jobs il parait une solution permettant de vérifier statiquement la validité d'un programme. Bien entendu, ce n'est pas possible de vérifier qu'un programme ne plantera jamais mais on a déjà pas mal de piste qui permettent d'élaguer le plus de bugs possibles et l'une de ces solutions est le système de type.

GRATUIT OPEN CORRECTEUR OFFICE ET DORTHOGRAPHE TÉLÉCHARGER GRAMMALECTE FRANÇAIS

Au final, au travers de ces trois points, et de manière simplifié, on comprends pourquoi OCaml brille dans ces domaines là mais le mieux reste de le pratiquer pour s'en rendre compte. J'ai vraiment l'intime conviction qu'OCaml peut être une très bonne solution pour ton logiciel bien qu'il faut ré-apprendre un nouveau langage et surtout ré-implémenter le moteur dans ce langage.

Cela peut paraître chiant et ça l'est je pense mais le gain que tu gagneras est juste énorme. Un vieux fou m'a demandé de faire mon petit interpréteur de Scheme en OCaml alors que je le faisais en C, il reste fou mais il avait raison de me demander ça et c'est bien un des meilleurs conseils qu'on m'ai donné.

J'ai perdu alors pas mal de temps à ré-implémenter mais force est de constater que je suis allé beaucoup plus loin qu'un simple interpréteur de Scheme aujourd'hui et c'est bien grâce à OCaml. Pour que le don soit gratuit, il ne suffit pas que celui qui donne donne gratuitement, mais il faut aussi que celui qui reçoit reçoive gratuitement.

Celui-là devrait être simple à éradiquer. Comme beaucoup de monde, à la suite de cette dépêche, j'utilise Grammalecte. Et il est fort utile! Je ne sais pas si c'est le bon endroit pour rapporter un faux positif, mais vu que tu as l'air d'y tenir, j'en ai détecté un en rédigeant un rapport : En régime stationnaire, cette hypothèse est tout à fait valable, comme le montre le graphe ci-dessous.

L'erreur est la suivante au niveau de le montre : Acccord de genre érroné : "montre" est féminin. Les rapports de faux positifs se font dans un fil dédié.

Les nouveaux faux positifs arrivent au fur et à mesure des nouvelles versions et sont résolus plus ou moins vite. Il me semble qu'Antidote se trompe pour les phrases 2 et 3. L'expression "ce que" introduit le pronom relatif "que" avec un antécédent indéterminé, d'où le "ce" la construction "celui qui" est identique , est joue le rôle de complément d'objet de sa subordonnée "celui qui" joue le rôle de sujet indéfini quant à lui.

Ce qu'il y a, c'est que le verbe "aimer" est le sujet du verbe "signifie" dans la subordonnée, et cela il ne le voit pas. Cela étant, faire du verbe "aimer" le sujet du verbe "être" dans le cas de la phrase 2 est discutable d'un point de vue sémantique.

En résumé : - "aimer signifie quelque chose" est correcte - "je sais ce que signifie aimer" l'est aussi, la proposition est devenue complément d'objet du verbe "savoir" et "ce que" joue le rôle de "quelque chose" - "je sais ce que aimer signifie" l'est tout autant. Antidote ne tiquerai peut-être pas sur une phrase du genre : je sais ce que je veux dire ici le sujet de la subordonnée étant "je".

Très très belle dépêche. Ça fait plaisir à lire. Petite question : la campagne de financement participatif actuelle vise à porter grammalecte sous Firefox et Thunderbird. Est ce qu'ensuite il est prévu de fournir une sorte de module autonome de manière à pouvoir l'utiliser sur un texte brut ou avec LaTeX par exemple, genre un truc comme aspell qui peut s'utiliser en ligne de commande.

Ça serait vraiment une super avancée. Mais les gens motivés pourront ajouter des règles optionnelles dans le préprocesseur de texte pour effacer les balises qui gênent. Par exemple, en vérifiant un commentaire linuxfr avec LanguageTool, je me suis aperçu que j'avais également des faux positifs du markdown.

Après, on peut toujours utiliser des utilitaires tels que spellutils ou pospell, pour dépouiller le texte de ses attributs, comme on le fait avec Aspell. Très bonne idée!

Je serais aussi très intéressé par un programme indépendant, pour parser du latex ou un texte brut! C'est une question plus a titre informatif qu'autre chose. Pourquoi est-tu passé par ulule pour faire une campagne de financement participatif plutôt qu'autre chose?

Ça me parait dommage dans le sens ou un financement flexible aurait peut-être été plus adapté si l'objectif n'est pas atteint, alors tu y consacres moins de temps. En cas d'échec de la campagne ce que je ne te souhaite pas ou en complément, tu pourrais peut-être créer un projet sur patreon. J'en avais fait une présentation ici. Ça permet un peu plus de souplesse sur le temps et la vitesse de développement.

Pourquoi es-tu si réticent vis-à-vis de la "tokenisation"? Après-tout la grammaire se base dessus, et c'est le processus "naturel" que chacun applique.

Ne crains-tu pas que l'explosion combinatoire des règles que tu mets en place même après les phases de simplification et la cohérence entre ces règles ne finissent par rendre le logiciel trop lent? De même pourrais-tu détailler un peu la solution que tu envisages pour la "désambiguisation", car même après la lecture de ton billet je ne comprends pas très bien ce que serait un "index de balises"? Concernant ta structure pour stocker le vocabulaire et la nature grammaticale des mots, ne crains tu pas que ceci ne puisse plus te permettre de proposer des suggestions sur des mots mal orthographiés dès le début.

Par exemple: embiguïté. Enfin aurais-tu quelques références à nous indiquer pour effleurer ce sujet, car des adjectifs épicènes, des lemmes, des thesaurus, …, je comprends un peu ce dont il pourrait s'agir mais j'imagine que ca doit être bien décrit de façon formelle quelque part. Encore merci pour ce billet captivant et très bien écrit et bonne chance pour ta campagne de dons.

Après tout la grammaire se base dessus, et c'est le processus "naturel" que chacun applique. De même pourrais-tu détailler un peu la solution que tu envisages pour la "désambiguisation", car même après la lecture de ton billet, je ne comprends pas très bien ce que serait un "index de balises"?

Enfin aurais-tu quelques références à nous indiquer pour effleurer ce sujet, car des adjectifs épicènes, des lemmes, des thesaurus, … Je comprends un peu ce dont il pourrait s'agir, mais j'imagine que ça doit être bien décrit de façon formelle quelque part.

LibreOffice : installer un dictionnaire et un correcteur grammatical

Je ne suis pas réticent vis-à-vis de la tokenisation en général. Parce que Grammalecte est basé sur un autre concept, pas incompatible avec la tokenisation, mais utiliser cet autre procédé juste pour faire de la désambiguïsation, ce serait du gaspillage de ressources. Ou alors il faudrait que ça serve à autre chose, ou tout réécrire depuis le commencement. Ça fait partie des problèmes à gérer. Il y a encore pas mal de choses optimisables çà et là.

Il y a justement le remplacement de Hunspell qui fournit les données en vrac en XML, la refonte des dictionnaires avec des étiquettes plus adaptées, et diverses parties du code qui peuvent être améliorées. Sinon il interrogera le lexique.

Le graphe de mots devrait pouvoir servir de base pour faire des suggestions orthographiques reste à trouver un algo efficace.

Je ne sais pas quoi conseiller. J'ai vu que le code source était disponible sur le site du projet, mais pas sous une forme très accessible un fichier 7z.

Ne serait-il pas plus simple de le mettre à disposition dans un dépôt git? Surtout que vu l'enthousiasme qu'a suscité le projet, des contributeurs pourraient aider à améliorer le correcteur. Je pense changer de nom de domaine au passage.

Comme ta conclusion l'évoque, je ne crois pas que l'on soit obligé de désespérer à l'idée que les gens n'écrivent pas bien notre langue. Une langue n'est belle que parce qu'elle est utilisée et comprise. Je crois avoir lu une étude quelque part indiquant qu'il y avait tout autant de fautes d'orthographe dans les copies des certificats d'études d'hier que dans celles du brevet et pourtant…. Seulement aujourd'hui, tous peuvent écrire.

La réduction du nombre de correcteur dans les journaux, l'auto-publication qui n'a jamais écrit une phrase publique sur Internet , la multiplication des supports de communication écrits sont autant d'occasion de voir faire des fautes ceux qui les cachaient auparavant.

Je ne crois pas que cela soit bien en soi, mais ce dont je suis convaincu c'est qu'il est bien en soi que les gens écrivent. C'est en forgeant qu'on devient forgeron, non? Il manque tout plein de temps au conjugueur parce qu'il manque tout plein de temps au concepteur!

Cela dit, pour avoir déjà communiqué avec ce concepteur, pour l'autre projet, Dicollecte, bien avant cette campagne de financement, je l'ai trouvé à l'écoute des utilisateurs. Il est au présent ce qu'il était au passé et ce qu'il sera au futur, à moins que j'eusse eu tort, ce qui serait moins-que-parfait…. L'auteur dit aimer travailler seul. J'aurais préféré une équipe de développeurs ou une équipe avec un chef pour un projet de cette ampleur. Je pense que c'est encore plus que recommandé dans le monde où nous vivons de spécifier la licence d'une création.

Ça protège l'auteur et permet, dans le cas des utilisateurs d'une création sous licence libre, de continuer à utiliser le code peu importe les aléas de la vie si belle ou si cruelle soit-elle.

Combien de fois ai-je entendu "je n'ai plus de temps à consacrer au projet" de la part de développeurs, cavaliers seuls, autrefois si motivés… Merci à l'auteur d'avoir fait un choix spécifié dans le lien licence! Pour conclure, quels temps manquent pour faire une critique encore plus constructive pour les lecteurs de la dépêche? Ce n'est pas vraiment en dire du mal ce que tu as fait, c'est de donner un retour d'un point que tu juges négatif. Il ne manque que des exemples pour voir si tes temps existent ou si tu n'as pas fait tout plein d'erreurs parce qu'il te manquait tout plein de temps pour apprendre cette langue avec tout plein de temps et tout plein d'exceptions!

Mon texte est tout plein de mots, il doit y avoir tout plein d'erreurs. Vivement un bon correcteur! Correcteur : Il y a tout plein de tout plein dans ton texte! Moi : Mauvais correcteur, tai-toi! Correcteur : Mauvais correcteur, tais-toi! Moi : A-tu fini le perroquet? Correcteur : As-tu fini le perroquet? Moi : Bon correcteur, donne la pâte! Il manque dans l'image quatre temps de l'indicatif présent, imparfait, passé simple, et futur simple , deux du subjonctif présent et imparfait , un du conditionnel présent , un de l'impératif présent , un de l'infinitif passé , et les deux gérondifs.

Peut-être sont-ils présents dans le logiciel…. Oui, ils sont présents dans le logiciel. Ça protège l'auteur […]. Non, les licences libres permettent de céder des droits.

Par défaut l'auteur est tout puissant sur sa création. Tous les contenus que j'écris ici sont sous licence CC0 j'abandonne autant que possible mes droits d'auteur sur mes écrits.

Attention, par défaut Ulule permet de consulter les prénoms et noms des contributeurs. Dans les préférences du compte, il est possible d'être anonyme ou d'afficher un pseudo personnellement, je trouve ça plus normal qu'un site utilise les pseudos par défaut. Olivier: J'essaye de trouver des informations sur l'existence d'un dictionnaire grammatical pour l'Anglais. Est-ce qu'il existe? Si non, est-il prévu? Celui de LanguageTool, qui contient environ formes fléchies.