Document Mining For DSS
La composante « données » des SIAD fut au départ composée d'enregistrement et de bases de données. Ceci s'est poursuivi avec les entrepôts de données et la fouille de données. Mais une bonne part de l'information importante pour les SIAD se présente sous forme de documents. Les technologies pour la gestion des documents et la fouille de documents sont balbutiantes mais vont être cruciales pour l'avancement des SIAD. Dans ce papier, nous nous intéressons à la fouille de documents comme une technologie majeure pour les SIAD. La première partie définit et établit le cadre de la fouille de documents et montre ses relations avec la fouille des données, la gestion de documents, la gestion des connaissances et de l'information en général. La section suivante discute des avantages et de la valeur ajoutée apportés par la fouille de documents. La troisième section s'intéresse aux fonctionnalités. Enfin, on constate que malgré les avancées en technologie pour la gestion des informations contenues dans les documents, très peu a été fait pour intégrer ces résultats dans les SIAD.
The data component of DSS has consisted primarily of data records and data bases. This trend has continued recently with the growth of data warehousing and data mining. But much of the information that is important to DSS is in the form of documents. Technologies for document management and document mining are emerging and will be crucial for the continued advancement of DSS. The purpose of this paper is to explore and organize the topic of document mining as a major new technology for DSS. The first section of the paper establishes the definition and scope of document mining and shows how it relates to other currently popular topics such as data mining, document management, knowledge management, and information management in general. The next section discusses the value, benefit, and the ultimate objectives of document mining. The third section outlines the desired functionality of document mining. In spite of all the new technologies for managing information in documents, there has been minimal progress in integrating these technologies into DSS.
R.SPRAGUE
fouille de documents, recherche dans les textes, gestion des contenus, information non structurée, gestion des connaissances, technologie documentaire.
document mining, text mining, content management, unstructured information, knowledge management, document technologies.
Anglais
|