Cours tal IRIT – partie 3.2
32 pages
Latin
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
32 pages
Latin
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Plan1. Exemple d’ application : extraction d’ information2. Les ressources terminologiques et ontologiquesThésaurus vs ontologie formelleOntologies formelles et représentation des connaissances3. Traitement de l’ information textuellePb posésExemple de l’ extraction d’ information à partir de textesOutils de TAL pour extraire et structurer24 juin 2003 P. St Dizier, P. Muller, N. Aussenac-Gilles 1Exemples d’ applicationsConstituer des ressources terminologiques ou ontologiques pourRechercher des textes répondant à une requêteRechercher des information dans des bases de données hétérogènes sur le webExtraction d’ information à partir de textes pour constituer des bases de données24 juin 2003 P. St Dizier, P. Muller, N. Aussenac-Gilles 2               Nom Scénario : « Transactions  Dassault Systèmes acquiert SRACBoursières »  Extraction  WeDassault Systèmes vient de réaliser une nouvelle acquisition : l'un des fleurons de la famille Dassault va  b mettre la main sur la société américaine SRAC dans une transaction de 22 millions de dollars en actions.    d’ information  Barbara Guerra, ancienne vice­présidente de SRAC, en devient le directeur général et opérationnel.  Le groupe français a indiqué qu'il allait bénéficier des solutions COSMOS de SRAC pour ses propres   développements des produits de CAE en 3D.  SRAC continuera d'exercer son activité sous son propre nom en offrant des outils d'analyse 3D mais   ...

Informations

Publié par
Nombre de lectures 105
Langue Latin

Extrait

1. 2.
3.
Plan
Exemple d’ application : extraction d’ information Les ressources terminologiques et ontologiques Thésaurus vs ontologie formelle Ontologies formelles et représentation des connaissances Traitement de l’ information textuelle Pb posés Exemple de l’ extraction d’ information à partir de textes Outils de TAL pour extraire et structurer
24 juin 2003
P. St Dizier, P. Muller, N. Aussenac-Gilles
1
Exemples d’ applications
Constituer des ressources terminologiques ou ontologiques pour Rechercher des textes répondant à une requête Rechercher des information dans des bases de données hétérogènes sur le web Extraction d’ information à partir de textes pour constituer des bases de données
24 juin 2003
P. St Dizier, P. Muller, N. Aussenac-Gilles
2
 ,.  juin 2003.  42ons caitarsn« T oi: arénScm No- . ,AC Dassauiert SRmèsea qclu tyStsnDiosaasfoinatrmoitcd nEbeWartxde lons leures fssua eaDimll aafa  lrettmea  vlticos al rus niamèmes vieult Systlasireu tnd  eére llquac nneveou'l :d nutisi noi ncasre .sB itnora Garbaa, auerr enneicnérp-ecive ntdesiC,RA Sdeté émaréciiaenS RAC dans une tracasnnoit ed m 22liils on ddelaolénéb tialla li'u quéiqnd i aisçaedS OM SC SOoisnolutes ser dficinég laréceriruett en dlen  evidepu erfna .eLg orationnel et opérerrcxe'ect aon stnoc CARd areunie noropr offm en éosvitinop sus esprév dopelmepe CARruopses orp  de CAE en 3D. Stn sed srpdoiusten vs teaieldes iatn serppuseméltèmes quault Sysl  ànur  irtuoevdea ercifinébés ssaD ed iuppa'l ils  out desrantm ia eD3lasy'dnaetrairana ta cevM)IB"S. C RAt es'snicsir tadsnl e cadre de son poja ne( nu tnaturtpeexe i que isses eds oisnlotuia V Caton 5ersiahlrse¤.ernard Cle PDG Bemmo étn,"enc a evr yoerane fod tymi ,naeherrewyD evde 3gie ratéts erton snad epta éleeluvnoe unreprise Cédée : lu tyStsmèseE tnetchseeu D :saasnoitrtnEirpeA eson :actiuisi AcqeryTsrèiarsnept acnsra Tou Bontics moN: oiranéBanacé Ses lurpoL MX seénnod ed esastcoi n :22m liSRACMontant Tran onlides ol drslallimsnoismro 835Accsisque  danfraslu tyStioiDnsaAC22 milstèmesSRsrallod ed snoil-CVIoIicenngAIOPm li553,aMetehkclars dols delionosri                                     Type trnaastcoiEntnerrpheAce isnteEuste esirpernoMeédéCCesstanteutsionDaBknhc eeuW aBqn
Extraction
Nom scénario :natiNomio n Nom employé :Barbara Guerra Entreprise A :Dassault Systèmes Poste A :Vice-présidente Entreprise B :SRAC Poste B :Directeur général et opérationnel
 US
setxetsusocesu pron dsatiamituaot n :taoiéur
Analyse Syntaxique
Analyse Lexicale
Segmentation
Extraction
ts otcurecSiran 42002 niujtcar noinidmrofnaseGic-esllxt4E .uMllre ,.NA su3P. St Dizier, P
textes
Extraction d’ information : segmentation
Dassault Systèmes acquiert SRAC.
Dassault Systèmes vient de réaliser une nouvelle acquisition : l'un des fleurons de la famille Dassault va mettre la
Dassault va mettre la main sur la sociétéaméricaine SRAC dans une transaction de 22 millions de dollars en actions.
Dassault Systèmes acquiert SRAC
Dassault Systèmes vient de réaliser une nouvelle acquisition :s u'l ed n fleurons de la famille Dassault va mettre la main sur la société américaine SRAC dans une transaction de 22 millions de dollars en actions.
24 juin 2003 P. St Dizier, P. Muller, N. Aussenac-Gilles
5
Dassault Systèmes vie réaliser une nouvelle acquisition: l'un des fleurons de la famille Dassault va mettre la main sur la sociétéaméricaine SRAC dans une transaction de 22 millions de dollars en actions.
Etiqueteur grammaticaDictionnaires et désambiguïsatilexiques Identification des expressions ré ulières
P. St Dizier, P. Muller, N. Aussenac-Gilles
Extraction d’ information : analyse lexico-syntaxique
24 juin 2003
< >Vl>NGos atéicamé icérneaiGN</av/<>V< VGm>terte la main sur</Gasnart eed noitc<M> GN</>2nttaonS>AR >E< >P<<CE/s</P>danN>un> <Gioct</nsN><G aen.>NGns de do2 millionoattn >llra<sM/6maliel/<NG<>PND>assault</NP> <V>< : l>NG nu' sedeuflnsroe  d flaenn reu ll euoevisitacqu/GV>ion<<tneiv>Vd>P< >V/<G> /Pe<isalréV>>Dassaul<Ese/<>E<  tyStsmè
n 200342iuj uq eatixs nyyles anaon :matinforid noitcartxE7 ne>NG< >tnatnoM
P. St Dizier, P. Muller, N. Aussenac-Gilles
.N>/Gs<ontiacliil22m na>toMtnrs</ollade dons t ensnar< >Pu>NG/Ge< <N>tiac don>N< >ERSacni<eG/P>dans</AC</E> <doe  dnsens arll2 ed noioillim 2ssauE>Daystèlt Soisna tc>2<./<OCV></P> <</de <P><sem >E/v>V<tneinouvelle acquisiVGr>aéiles rnu enoruelf sed nu'lN><G: > GV</ontiuatlaDssN<>PG/>Nlle<fami la s del eram a>VG<ttema<>v> /VNP</<V> éta émirals coéiGV> <GN>in sur</notctef leeloinnassa<S>DSystult >S/<semèeiv>VG< rée  dnt</erisalVG >C<DOu>enn uovelle acquisitioC/<n >DOS< :u'l>den fls roeu dns Dasille fame la>Vav >G<<tS/asluCO <V>/Ge<tret m >DOC/<niam al>D la soci<CO1>surciiaenS té émaré<C> >dO2C<RAO1/Cnarttcas sna enu
Extraction d’ information : extraction <S>Dassault Systèmes</S> vient Création des règlesderéaliser une nouvelle acquisition: <CR = Dassault Systèmes>s den 'ul Coréférencefleurons de la famille Dassault</CR> Spécificationvamettre la main surla société américaineSRACdans une transaction de22 millions de dollars en actions. <E>Dassault Systèmes</E> <V>vient</V> <P>de</P><GV>réaliser une nouvelle acquisition</GV> :Nom scénario : Transaction Boursière <GN>a de lons leursef nud 'l famille</GN><NP>Dassault</NP>Type transaction : Acquisition <V>va</V> <GV>mettre la mainEntreprise Acheteuse : Dassault sur</GV> <GN>la société Systèmes américaine</GN><E>SRAC</E> Entreprise Cédée : SRAC <P>dans</P><GN>une transactionMontant Transaction : 22 millions de de</GN> <Montant>22 millions de dollars</Montant><GN>endollars Scenario structuré actions</GN>. 24 juin 2003 P. St Dizier, P. Muller, N. Aussenac-Gilles 8
nioat: n indrmfop edortamexe elp24 A su ,.N-ciGesan9Extllesion ract002 niujD tS .P3 Pr,ieizerllMu. 
de
E
être en discussion pour V
après avoir mis mettant mettre
afin de
E
usines Chiffre% la main sur NPL Nom opération
Automate du patron « mettre la main sûr »
activités
filiale
du capital de actions de
<?xml version="1.0" encoding="utf-8"?>Extraction <xsd:schema  xmlns:xsd="http://www.w3.org/2000/10/XMLSchema">d’ informatio  <xsd:element name="dépêche">n : résultats   <xsd:complexType>  <xsd:sequence> <xsd:element name="titre" type="xsd:string"/> <xsd:element name="date" type="xsd:date"/> <xsd:element name="auteur" type="xsd:string"/>Schéma XML correspondant  </xsd:sequence>  </xsd:complexType>au scénario des Transactions Boursières   <xsd:complexType>  <xsd:sequence> <xsd:element name="catégories" type="xsd:string"/> <xsd:element name="secteur" type="xsd:string"/> <xsd:element name="compagnies" type="xsd:string"/>  </xsd:sequence>  </xsd:complexType> <xsd:complexType>  <xsd:sequence> <xsd:element name="scenario Transactions Boursières">  <xsd:element name="nom opération" type="xsd:string"/>  <xsd:element name="entreprise acheteuse" type="xsd:string"/>  <xsd:element name="entreprise cédée" type="xsd:string"/>  <xsd:element name="montant transaction" type="xsd:string"/>  </xsd:element>  </xsd:sequence>  </xsd:complexType>10 </xsd:element>
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents