3 4 Ecole Polytechnique de l’Université de Nantes Faculté des Sciences Economiques et de Gestion Rue Christian Pauc – BP 50609 Chemin de la Censive du Tertre – BP 52231 F44306 Nantes Cedex 3 F44322 Nantes Cedex 3 Tel : (+33) 2 40 68 30 00 Fax : (+33) 2 40 68 30 66 Tel : (+33) 2 40 14 17 17 Fax : (+33) 2 40 14 17 00 Email : pkuntz@ireste.fr Email : Claude.Belleil@sceco.univnantes.fr [Catégorie Chercheur – Application industrielle]
Résumé : Pour attirer le plus grand nombre possible de clients potentiels, un site Web dédié au commerce électronique doit être conçu ergonomiquement, mais aussi, et surtout, être référencé avec soin, afin d’engendrer un flux de visiteurs important. Pour être en mesure de faire des choix de référencement judicieux, le webmaster doit disposer de représentations adaptées de réseaux de sites candidats. Cette communication se focalise sur les représentations de type cartographique et présente un outil de génération de cartes intégrant à la fois des relations sémantiques liées au contenu des sites et des relations combinatoires déduites des liens hypertextes. Pour l’aspect sémantique, nous exploitons des techniques mises en œuvre dans un outil detext miningd’extraire des concepts permettant représentant le contenu d’un ensemble de pages Web. Pour l’aspect combinatoire, nous tirons parti, d’une part, du nombre de liens hypertextes existant entre chaque couple de sites, et d’autre part, de l’étude du voisinage des sites. Des expérimentations effectuées à l’aide d’un outil prototype sur des données réelles permettent de démontrer la faisabilité et la pertinence d’une telle approche. Motsclés : Référencement de sites Web, Cartographie, Extraction de concepts, Classification
Abstract : To attract numerous customers, a Web site dedicated to the emerging field of ecommerce must be carefully designed and promoted. Therefore the webmaster has to ask for the creation of links towards his site on pages visited by a great number of Internet users. To catch easily the information contained in sites and then be able to make sensible choices, he needs handy representations of parts of the Web. This communication focuses on cartographic representations and presents a tool capable of generating maps that integrate semantic as well as combinatorial relationships. The semantic dimension deals with concepts that are extracted from the contents of sites by means of a text mining tool and aims at representing the main subjects that are handled. The combinatorial dimension exploits the properties of the graphs that can be deduced from hyperlinks. The experiments we made on real data tend to prove that such an approach can be implemented and give promising results. Keywords : Web site promotion, Cartography, Concept extraction, Classification