Cette thèse présente un modèle de construction automatique et approximatif de la représentation du sens d'un texte. On adapte des techniques de documentation automatique à des bases documentaires non indexées. Les techniques classiques reposent sur une indexation vectorielle. Chaque document est représenté par un descripteur, on définit une distance entre ces descripteurs. L'accès aux documents pertinents est basé sur des calculs de proximité entre ces descripteurs. Une structuration du domaine, couvert par des documents, est obtenue par une classification (en anglais "clustering") faisant apparaître des thèmes sémantiques. Il faut améliorer les techniques en leur permettant de traiter les documents non indexés, en améliorant les résultats par une adaptation de connaissances linguistiques et une analyse des relations que marquent les cooccurrences entre termes.
Produktkennzeichnungen
ISBN-10
6131563403
ISBN-13
9786131563409
eBay Product ID (ePID)
164267220
Produkt Hauptmerkmale
Produktart
Sprachkurs
Sprache
Französisch
Anzahl der Seiten
272 Seiten
Verlag
Editions Universitaires Europeennes Eue
Publikationsname
Apprentissage Statistique Et Extraction de Concepts À Partir de Corpus
Autor
Nicolas Turenne
Format
Taschenbuch
Erscheinungsjahr
2011
Zusätzliche Produkteigenschaften
Hörbuch
No
Inhaltsbeschreibung
Paperback
Item Length
22cm
Item Height
1cm
Item Width
15cm
Item Weight
421g
Meistverkauft in Studium & Erwachsenenbildung
Aktuelle Folie {CURRENT_SLIDE} von {TOTAL_SLIDES}- Meistverkauft in Studium & Erwachsenenbildung