Ce manuscrit expose le travail de recherche effectue dans le cadre de ma these de doctorat et qui s'interesse au traitement automatique de la langue Arabe. Il decrit d'abord l'outil concu pour la construction de corpus de l'Arabe; cet outil permet de recueillir automatiquement une liste de site, extrait leur contenu et le normalise. Le corpus ainsi constitue peut etre utilise dans diverses applications de TAL et plus particulierement dans le calcul de modeles statistiques. Il presente ensuite les experimentations menees en terme de modelisation statistique et qui ont pour objectif de trouver comment modeliser le mieux la langue Arabe . Le manque de donnees m'a conduit a entreprendre d'autres solutions sans pour cela augmente la taille du corpus. J'ai procede a une segmentation des mots du corpus afin d'augmenter sa viabilite statistique. une meilleure performance en terme de perplexite normalisee fut constatee. Finalement, ce livre expose les resultats d'une etude comparative des modeles statistiques de l'Arabe et ceux d'autres langues a savoir le Francais, l'Anglais, le Grec, le Portugais et le Finnois."
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.