Identification d opinions dans les journaux arabes
6 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Identification d'opinions dans les journaux arabes

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
6 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Sujets

Informations

Publié par
Nombre de lectures 402
Langue Français

Extrait

Identification d’opinions dans les journaux Arabes
1 Département d’informatique, Université Badji Mokhtar-Annaba (Algérie), lazhar3000@hotmail.com 2 Département d’informatique, Université Badji Mokhtar-Annaba (Algérie), guiyam@yahoo.fr Résumé:L’identification d’opinions est un ensemble de techniques qui fait partie du domaine de traitement automatique du langage naturel et plus précisément de recherche de l’information. Elle s’intéresse au développement des systèmes capables d’extraire et d’explorer les opinions présentes dans des corpus de textes. La présence d’une masse textuelle sous forme d’articles de journaux en langue arabe en format électronique impose une technique d’exploration particulière. Nous présentons dans ce papier un système pour l’identification d’opinions, en se basant sur le modèle de Aila (AILA R, 2008), qui représente l’opinion comme un objet conformé de quatre éléments: prédicat,source,sujet etcontenu. Deux propriétés:polarité etintensité, inspirées des travaux de (PLANTIEM. et al. 2007) sont ajoutées à ce modèle pour établir des relations entre les opinions d’un texte selonleur différent degré d'intensitéet leur valeur de polarité. En présentant son architecture générale, notre système utilise plusieurs techniques telles que la représentation XML d’opinions extraites, l’expansion sémantique de ces opinions en utilisant la méthode expLSA expliquée par (NICOLAS B. et al, 2008) en vue d’avoir une bonne représentation statistique d’opinions, et enfin une représentation statistique des opinions sous forme de matrice d’occurrences pour faciliter le calcul de similarité entre les opinions lors de la phase de classification.
1 2 Farek Lazhar , Tlili-Guiassa Yamina
L’identification d’opinions présente une tâche difficile à maitriser, et cela est dû à la complexité de savoir comment représenter une opinion, de quoi se compose une opinion, et comment extraire ses différents constituants à partir du texte. En se basant sur le modèle proposé par(AILA R, 2008), nous présentons un système d’identification d’opinons dans les journaux arabes en utilisant plusieurs techniques telle que l’expansion sémantique des opinions avec la méthode expLSA (NICOLAS B. et al, 2008), la représentation XML d’opinions, et la classification non supervisée des opinions extraites.
1Introduction
Mots-clés: Identification, Opinion, Langue arabe, TALN.
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents