Une approche générique pour l analyse croisant contenu et usage des sites Web par des méthodes de bipartitionnement
194 pages
Français

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Une approche générique pour l'analyse croisant contenu et usage des sites Web par des méthodes de bipartitionnement

-

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
194 pages
Français
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Sous la direction de Gilbert Saporta, Mohamed Ben Ahmed, Yves Lechevallier
Thèse soutenue le 22 mars 2010: ENSI Tunisie, CNAM
Dans cette thèse, nous proposons une nouvelle approche WCUM (Web Content and Usage Mining based approach) permettant de relier l'analyse du contenu à l'analyse de l'usage d'un site Web afin de mieux comprendre le comportement général des visiteurs du site. Ce travail repose sur l'utilisation de l'algorithme CROKI2 de classification croisée implémenté selon deux stratégies d'optimisation différentes que nous comparons à travers des expérimentations sur des données générées artificiellement. Afin de pallier le problème de détermination du nombre de classes sur les lignes et les colonnes, nous proposons de généraliser certains indices proposés initialement pour évaluer les partitions obtenues par des algorithmes de classification simple, aux algorithmes de classification simultanée. Pour évaluer la performance de ces indices nous proposons un algorithme de génération de biclasses artificielles pour effectuer des simulations et valider les résultats. Des expérimentations sur des données artificielles ainsi qu'une application sur des données réelles ont été réalisées pour évaluer l'efficacité de l'approche proposée.
-Classification simultanée
-Algorithme Croki2
-Biclustering
-Fouille du web
-Classification croisée
-Fouille de l'usage du web
-Block clustering
-Nombre de biclasses
-Fouille du contenu du web
In this thesis, we propose a new approach WCUM (Web Content and Usage Mining based approach) for linking content analysis to usage analysis of a website to better understand the general behavior of the web site visitors. This work is based on the use of the block clustering algorithm CROKI2 implemented by two different strategies of optimization that we compared through experiments on artificially generated data. To mitigate the problem of determination of the number of clusters on rows and columns, we suggest to generalize the use of some indices originally proposed to evaluate the partitions obtained by clustering algorithms to evaluate bipartitions obtained by simultaneous clustering algorithms. To evaluate the performance of these indices on data with biclusters structure, we proposed an algorithm for generating artificial data to perform simulations and validate the results. Experiments on artificial data as well as on real data were realized to estimate the efficiency of the proposed approach.
-Web Usage Mining
-Web Content Mining
-Text mining
Source: http://www.theses.fr/2010CNAM0694/document

Sujets

Informations

Publié par
Nombre de lectures 44
Langue Français
Poids de l'ouvrage 13 Mo

Extrait

`Marcheur,crfoulerdeseOnsontntesMactrenacqueesau.caselachemin,Etetgarrieni?rdelaplusOn;?Marcheur,cheur,ailchemin,nlages'yAnachemin,penasededantchemiarrne,voitLsenteejamaischeminneseacnouveonstruitMarenilmar'ychant.pEndemarSeulementchantsilsesurcmer.'onstruittoniolehadoRemerciementsLeehargerguid?toutJejeunededotscteurdeschassatraenctiensorteenquelquesmomenrdire?sidusvdeaidecsacrierotquilvle,A,tscienquelquessuptas,maisetremerciefutSAPORcauonfus?menttcdeonscienttdelanen'appasadministrativ?trdeetoutarriv?LLIER,l??touttseul...deJe?dagogiquestienstoujourstoutsadnon'lesabsuccorddans?diciles.remerciertmonGilbdirecteurA,dedeth?seatoireMohamedetBEersNacAH-maMED,remercieprofesseuroutre?m?riteeuse?del'?coleail,Nationaleh?sit?dessonSciencesmedcertainese(notammel'Informatique,laquith?se).aremerciguid?tmesLECHEVpremiersdirec-pashercetRbm'aeaucouppdesquatresuivSesanettsonsurm'onlasvexprimeroieconancedicilemoi,deseulemenladansrecmomenhercdehe?setaussidonlesttslesJenom?galemenbreuseslcritiquesprofesseurm'onerttTpmonermiscteurd'ath?sevConservancerNationaldansArtslaM?r?alisationided'amaoirth?se.cept?Jedirigerleth?se.remercielevivdoublemenemencar,tsonppr?ciourdanssar?alisationdispceonibilit?,vmalgr?ilsonpasemploidededetempstempscourharg?,d?csesdeencouragemenlourdeurstsesent?sesnpr?cieuxmaconseilsJepro?digu?sertoutparticuli?remenauYlongesdeAcemontteurrarecvheail.l'INIlIaquifait?norm?menpreuvaid?eendand'unmessoutienanssansth?se.faillequalit?settiquesaptm'otuetjtouriiipermisd'allerl'qu'ilquiplusquandloin.amisJedelereconnaissanceremerci?espvivCHABIRemenremotivtmepleurourfamillesaparendispncouragemenonibilit?,desessaconseiparticulierlsDaetencourag?,ptouretlesprodiscussionslequegratitudelmem'ontoujoursapas.puetapvsoutienoiaccord?runeetpquisessecoll?gues,sonSiwtAlzenntVo'onuujpouressvr?vtous?l?esbrestr?sAxisinpt?ressanaccueiltesJ'exprimeetmainstructivtouses.deJeonsouhaitel?,?galemen'aln?tmesadressereursmesbremerciemenleurstset?etG?rardm'onGOauV?tudes.AERtionT?etsonSadokhensionBENts.YetAHenIA?d'aarvetoiryraccept?SILd'?Atrmetlessoutenrappetorteurs?deendanmacth?seann?esettradeaill'in-?t?r?tlesqu'ilsmaduvjetaiendetINRIApourorurt?et?amabilit?.monmatraetvprofondeail.?JelesremerciebresausmasiquiElisabteth?t?METm?meA?aISlaitetMerciMohamedmesNADIFts,defr?resmso'aetvmonoireau-fr?refaitourl'hon-eneurtsd'?trelememmoralbresnancierdusjurytdetoutmalongth?se.mesMesEnn,remerciemenattentstoutev?cialeonMohamedtouraussisoutien,?compr?-touetsencouragemenmesivR?sum?DanscettetoCUbth?se,ExpnousunderstandpropbosonsfuneConnouvtenellisegapprocolumns,cobtainedheforWtoCUMe(WUsageebofConthetenctofandgeneratedUsageumMuseiningsimplebasedTapproacbiclustersh)sipellermettanapproactsimdenewreConlierh)l'analyseusdusiteconbtenvisitors.uuse?CRl'analyseodeel'usageerimend'unmitigatesitedeterminationWclustersebstansdpartitionseevmieuxultaneouscomprendretheleindicescompproportementtvg?n?ralarticialdedatasofvisiteursordsduWsite.thesis,Ceosetrahv(Wailtrepbasedoselinkingsuranalysisl'utilisationgedewl'algorithmebCRgeOKI2viordeebclassicationwcrois?eonimpl?menthet?clusteringselonimplemendeuxtstrat?giestd'optimisationthatdi?renomparedtesequeonnousTcoprmparonemsthe?ertralinesveersgeneralizedessomeexpprop?rimenaluatetationsbsuralgorithmsdesluatedonn?esyg?n?r?eslusteringarticievellemenet.ofAndatadewpallieranlearticialprobl?mepdeulationsd?terminationthedutsnomasbreondeereclassesthesurproplesKeylignesWettlesUsagecolonnes,clustering.nouswpropproposonsadeapproacg?n?raliserWcertainsMindicesebproptenos?sandinitialemenMiningtapproacpforourcon?vtaluertolesapartitionsanalysisobtenaueseb-partodesetteralgorithmesthedeneralclassicationehasimple,ofauxwalgorithmessitedeThisclassicationorksimbasedultan?e.thePofourblo?vkalueralgorithmlaOKI2ptederformanceydewcesdierenindicesstrategiesnousoptimizationpropwosonscunthroualgorithmehdexpg?n?rationtsdearticiallybicldata.assesoarticiellesthepoourleectuerofdesofsimnulationsbetofvonaliderandleswr?sultats.suggeDestoexpthe?rimenoftationsindicesuoriginallyroseddesevdonn?esthearticiellesobtainedainsiyqu'uneclassicationapplicationtosura-dbipartitionsebssimdonn?escr?ellesalgorithms.onotaluate?t?pr?ali-rs?esormanceptheseouron?vwithalstructure,uerel'ecacit?oseddealgorithml'approgeneratingcdataheoproperformos?e.mMotsandcl?salidate:results.FerimenouilleondudataconwtenasurealduwWrealizedeb,estimatefouilleeciencydethelosed'usageh.duwW:eb,ebclassicationtensimMining,ultan?e.ebAbstractMining,InultaneousthisvviTabledesmati?res.ymologie.RemerciemenRepr?sents1.3.1iii.Liste.des.gures.xi.Liste.des.tableaux16xiii.In.troconnaissancesduction.1.0.1.In.tr.o.duction.au1.4.1W.eb.Mining1.4.3.....ectorie.......do...........1.3.2.......de.......descripteurs1.0.1.1.Axedescripteurss.de.d?vdescripteurselopp.emen.ttextesdu.W1.5.1eb.Mining..21.cat?gorisation.........ts........2mmatisation0.1.2.Pro.cessus.du.W.eb.Mining..............1.4...............ection......3.0.2.Probl?mesExtractionouv.erts.en.W.eb.Miningbre.us.......20.terminologique.........tation...........Extraction.our4.0.3.Probl?matique1.6.1etd?nitionsc.on.tributions....26.cumen.textuels...............15.Le............7.0.4.Organisation.du.m?moire....15.?tiquetage...........................16.Choix.descripteurs........8.I.?tat.de.l'art.11.1.Le.W16ebS?lCondeten.t.Mining.appliqu?.aux.do.cumen.ts.textuels.:.?t1.4.2atdede.l'art.13.1.1.In.tro.duction......19.Nom.de.reten.................1.5.tation.des...............21.Repr?sen.v.lle....13.1.2.Pro.cessus.du.W.CM.appliqu?1.6auxdestextesp.la.........25.?t.et............14.1.3.Pr?traitemen.ts.desvii1.6.2Clas..ablsitcation,52Cat?gorisation.et.Segmen.tation.desAld.o.cumen62ts4.2.127.1.6.3TCla.s.si.cationbipartitionnemendes.do.cumen.tsconstruction.....dologie.3.3...des.........hes...t...me.3.6.3..27.1.6.4deCat?g.orGaloisidesation.des.do.cumen.tsAlgorithme.......es.tionnemen.....yp.......biclasses.....3.4.2..27.1.6.551Segtmen.tation.desbdo.cumen.ts..t.3.6.2.binaires.bipartitionnemen.tin-.......59.......3.7.1.math?matique.60.n..283.7.31.7GaloisConclusionSyn.........tributions.In.........donn?e...g?n?ration...art.et.........3.4.et...........50.e....29.2.Le.W.ebdesUsage.Mining.:.?tat.de.l'artAppro31bipartitionneme2.1.In.tro.duction....Algorithmes.par.onnemen.........53.de.tableaux.re.gorithmes.des...gorithmes.des.de.................Les......31.2.2.In.t?r?ts.etreillisapplicationsFdu.WUM..T.et.men.......gorithmes.treillis...61.h?..............31.2.3IPro5cessus67deductionWUM..............4.2.g?n?ration.articielles.....gorithme.donn?es...68.P.i.t.bipartitionnemen..............32.2.3.149ColTlecteedesstructuredonn?esbiclasses.....................3.4.1.yp.des................32.2.3.2.Pr?traite.men50tStructuredesbiclassesdonn?es....................3.5.c.de.n..........37.2.3.3.F.ouille.de.donn?es3.6etdeanalyseidestir?sultatsi.t................42.2.43.6.1Tgorithmesrabipartitionnemenvdesauxdeexistansuts53etAlprobl?mesdeouvtertstableaux...58.Al.de.t.t.eaux.con.gence............45.2.5.Syn.t.h?.se........3.7.treillis.Galois.........................60.T.de.:.ormalisme.........3.7.2.reillis.Galois.bipartitio.ne46t3.Appro.c.hes.et.algorithmes61deAlrecdehercdeshedede.biclasses.47.3.13.8Inttroseduction................................I.Con.6.4.Croki2.4.1.tro................47.3.2.Princip.e.g?n?ral.de.bipartitionnemen.t67.M?tho.de.des.s.........67.Al.de.des.articiell......48viii2
ulationd'unsite...W.eb....clustering.bas?s.bipartitionnemen.r?sultats.o.......sur.bre...bi-.de.....o.125.eb69.4.3.Algorithme.Croki2..100.....drogramme...bre.indices.........th?se.....d'un.....Con.....des..........7.1.4.3.1.Princidep.eesg?n?ralindeD?l'algorithmelaCroki2......5.3.l.5.3.1.aux.......10.tielle72Exp4.3.2.D?.rou.l.emen.t.de.l'algorithmenouvCroki2CUM.125.........he.Usage...textuelle.....126..73.4.3.3.?tapenes.de.repr?sen6.3.3tation.et.d'aectation..S?man.............Indic.alidation.crit?res74.4.3.45.2.2Croki2vadesv.ec104optimisationdualtern?eclasses.du...............du.classes.cadre...daptation.v78des4.3.5tCroki2.a.v.ec.optimisation.globale..R?solution.la...116.tations...........5.5........79.4.4.Comparaison.des.deux6algorithmesapp.he.our.W.In.................Appro.W.t....81.4.4.16.3Indicsitees.de.v.alidation.externe..T.............6.3.2.des...........c....81.4.4.2.Comparaison.du.Sim6.3.4.Laten4.2.2........7.................5.2.1.es.v.bas?s.des.relatifs.....101.Indic85de4.4.3alidationComparaisonsurdescrit?resbipartitionsternes.....5.2.3.termination.nom.de.par.coupure.den-..............87.4.4.4.Comparaison.des.bipartitions.a.v109ecChoixdesnomclassesdenondansviadesde.t.11090A4.4.5desPdeerformancealidationdansm?tholde'idenpartitionnementicatio.n.de.la.structure.initiale.des.donn?es..........1.5.3.2.graphique/M?tho.de.di?ren.......5.4.?rimen.et.....................119.Syn..92.4.4.6.Comparaison.de.la.c.omplexit?.des.deux.algorithmes.........95.4.5124SynUneth?seelle.r.c.W.p.l'analyse.site.eb.6.1.tr.duction...............................6.2.c.de.eb.ten.and.Mining97.5.Choix.du.nom.bre125deAnalyseclassesd'undansWl'algorithme.Croki2.99.5.1.In.tr.o.duction......6.3.1.ypage.pages.......................128.Pr?traitem.t.textes...................13499Blo5.2kD?termination.du.nom.bre.de.classes.dans.les.m?.t.ho.des.de136classi-Analysecationtiqueautomatiquete.................13.ix6.3.5Evaluation...de.la.structure.du.site.?.tra.v.ers7.1la153cat?gorisation.desgpages..Anal...de.......7.........Articles.....157...........A.W.....t....137.6.4.Analyseerspdelal.'usage.d'un.siteectiv.......154.conf?rences...................144.de..........1381496.4.1anIcd.e.n.tication.des.sessions6.7etsedes.utilisateurs..............et.es139orts6.4.2.I.d.e.n.tication.des.naPvigations................157.dans..........2.de..140.6.4.3.Structuration.des.donn?es178du.con.te.n.u.et.de.l'usage..6.5.2.yse.l'usage..140.6.4.4.Cla.s.si.cation.oue........6.6.v.tages.l'appro.he.CUM...................151.Syn.h?..141.6.4.5.Ev.aluation.de.la.structure.du.site.?.tra.v.ers.l'analyse.de.l'usage152.Conclusion.p.ectiv.153.App.de.th?se...........................7.2.ersp.es............144.6.5.Applic

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents