Titre : |
Construction semi-automatique des ontologi à partir des documents textuels arabes |
Type de document : |
texte imprimé |
Auteurs : |
BENABDALLAH, Ali, Auteur ; ABDERRAHIM, Mohammed El Amine, Auteur |
Editeur : |
Université tlemcen |
Année de publication : |
2017 |
Importance : |
100 p. |
Présentation : |
ill. |
Format : |
30 cm |
Accompagnement : |
cd |
Langues : |
Français (fre) Langues originales : Français (fre) |
Résumé : |
La tâche de construction d’une ontologie à partir d'un corpus textuel commence par la
phase de conceptualisation, qui consiste à extrait les concepts de l'ontologie. Ces concepts
sont reliés par des relations sémantiques. Dans le cadre de cette thèse, nous présentons une
contribution pour la construction semi-automatique d'une ontologie à partir d'un corpus
textuel arabe, en commençant d'abord par la collecte des documents et le prétraitement du
corpus à travers la normalisation, puis la suppression des mots vides et la lemmatisation;
Ensuite, pour extraire les termes de notre ontologie, une méthode statistique pour extraire des
termes simples et complexes appelée « méthode des segments répétés » est appliquée. Pour
sélectionner les segments avec un poids suffisant, nous appliquons deux filtres : un filtre de
pondération TF-IDF (Term Frequency-Inverse Document Frequency) et un filtre coupant.
Pour relier ces termes par des relations sémantiques, nous appliquons une méthode
d'apprentissage automatique des marqueurs linguistiques à partir du texte. Cette méthode
nécessite un ensemble de paires de relations, qui sont extraites à partir de deux ressources
externes: un dictionnaire arabe de synonymes et d'antonymes et une base de données lexicale
Arabe.
A la fin de cette thèse, nous présentons les résultats de notre expérimentation en utilisant
notre corpus textuel. L'évaluation de notre approche montre des résultats encourageants en
termes de rappel et de précision. |
Construction semi-automatique des ontologi à partir des documents textuels arabes [texte imprimé] / BENABDALLAH, Ali, Auteur ; ABDERRAHIM, Mohammed El Amine, Auteur . - Université tlemcen, 2017 . - 100 p. : ill. ; 30 cm + cd. Langues : Français ( fre) Langues originales : Français ( fre)
Résumé : |
La tâche de construction d’une ontologie à partir d'un corpus textuel commence par la
phase de conceptualisation, qui consiste à extrait les concepts de l'ontologie. Ces concepts
sont reliés par des relations sémantiques. Dans le cadre de cette thèse, nous présentons une
contribution pour la construction semi-automatique d'une ontologie à partir d'un corpus
textuel arabe, en commençant d'abord par la collecte des documents et le prétraitement du
corpus à travers la normalisation, puis la suppression des mots vides et la lemmatisation;
Ensuite, pour extraire les termes de notre ontologie, une méthode statistique pour extraire des
termes simples et complexes appelée « méthode des segments répétés » est appliquée. Pour
sélectionner les segments avec un poids suffisant, nous appliquons deux filtres : un filtre de
pondération TF-IDF (Term Frequency-Inverse Document Frequency) et un filtre coupant.
Pour relier ces termes par des relations sémantiques, nous appliquons une méthode
d'apprentissage automatique des marqueurs linguistiques à partir du texte. Cette méthode
nécessite un ensemble de paires de relations, qui sont extraites à partir de deux ressources
externes: un dictionnaire arabe de synonymes et d'antonymes et une base de données lexicale
Arabe.
A la fin de cette thèse, nous présentons les résultats de notre expérimentation en utilisant
notre corpus textuel. L'évaluation de notre approche montre des résultats encourageants en
termes de rappel et de précision. |
|