Exploration collaborative de cubes de données, Collaborative exploration of data cubes

De
Publié par

Sous la direction de Arnaud Giacometti, Patrick Marcel
Thèse soutenue le 01 décembre 2009: Tours
Data warehouses store large volumes of consolidated and historized multidimensional data to be explored and analysed by various users. The data exploration is a process of searching relevant information in a dataset. In this thesis, the dataset to explore is a data cube which is an extract of the data warehouse that users query by launching sequences of OLAP (On-Line Analytical Processing) queries. However, this volume of information can be very large and diversified, it is thus necessary to help the user to face this problem by guiding him/her in his/her data cube exploration in order to find relevant information. The present work aims to propose recommendations, as OLAP queries, to a user querying a data cube. This proposal benefits from what the other users did during their previous explorations of the same data cube. We start by presenting an overview of the used framework and techniques in Information Retrieval, Web Usage Mining or e-commerce. Then, inspired by this framework, we present a state of the art on collaborative assistance for data exploration in (relationnal and multidimensional) databases. It enables us to release work axes in the context of multidimensional databases. Thereafter, we propose thus a generic framework to generate recommendations, generic in the sense that the three steps of the process are customizable. Thus, given a set of sequences of queries, corresponding to the previous explorations of various users, and given the sequence of queries of the current user, our framework proposes a set of queries as recommendations following his/her sequence. Then, various instantiations of our framework are proposed. Then, we present a Java prototype allowing a user to specify his/her current sequence of queries and it returns a set of recommendations. This prototype validates our approach and its effectiveness thanks to an experimentations collection. Finally, in order to improve this data cube exploration collaborative assistance and, in particular, to share, navigate or annotate the launched queries, we propose a framework to manage queries. Thus, an instantiation to manage recommendations is presented.
-Cubes de données
Les entrepôts de données stockent de gros volumes de données multidimensionnelles, consolidées et historisées dans le but d'être explorées et analysées par différents utilisateurs. L'exploration de données est un processus de recherche d'informations pertinentes au sein d'un ensemble de données. Dans le cadre de nos travaux, l'ensemble de données à explorer est un cube de données qui est un extrait de l'entrepôt de données que les utilisateurs interrogent en lançant des séquences de requêtes OLAP (On-Line Analytical Processing). Cependant, cette masse d'informations à explorer peut être très importante et variée, il est donc nécessaire d'aider l'utilisateur à y faire face en le guidant dans son exploration du cube de données afin qu'il trouve des informations pertinentes. Le travail présenté dans cette thèse a pour objectif de proposer des recommandations, sous forme de requêtes OLAP, à un utilisateur interrogeant un cube de données. Cette proposition tire parti de ce qu'ont fait les autres utilisateurs lors de leurs précédentes explorations du même cube de données. Nous commençons par présenter un aperçu du cadre et des techniques utilisés en Recherche d'Informations, Exploration des Usages du Web ou e-commerce. Puis, en nous inspirant de ce cadre, nous présentons un état de l'art sur l'aide à l'exploration des bases de données (relationnelles et multidimensionnelles). Cela nous permet de dégager des axes de travail dans le contexte des bases de données multidimensionnelles. Par la suite, nous proposons donc un cadre générique de génération de recommandations, générique dans le sens où les trois étapes du processus sont paramétrables. Ainsi, à partir d'un ensemble de séquences de requêtes, correspondant aux explorations du cube de données faites précédemment par différents utilisateurs, et de la séquence de requêtes de l'utilisateur courant, notre cadre propose un ensemble de requêtes pouvant faire suite à la séquence de requêtes courante. Puis, diverses instanciations de ce cadre sont proposées. Nous présentons ensuite un prototype écrit en Java. Il permet à un utilisateur de spécifier sa séquence de requêtes courante et lui renvoie un ensemble de recommandations. Ce prototype nous permet de valider notre approche et d'en vérifier l'efficacité avec un série d'expérimentations. Finalement, afin d'améliorer cette aide collaborative à l'exploration de cubes de données et de permettre, notamment, le partage de requêtes, la navigation au sein des requêtes posées sur le cube de données, ou encore de les annoter, nous proposons un cadre d'organisation de requêtes. Ainsi, une instanciation adaptée à la gestion des recommandations est présentée.
Source: http://www.theses.fr/2009TOUR4023/document
Publié le : jeudi 27 octobre 2011
Lecture(s) : 33
Nombre de pages : 150
Voir plus Voir moins

JUR
Conférences,
Sup
FRANÇOIS
ranc
RABELAIS
Professeur,
TOURS
ersité
École
Univ
Doctorale
Conférences,
SST
Univ
Labora
ours
toire
P
d'Inf
F
orma
UNIVERSITÉ
tique,
ellier
Équipe
at
BdTln
ersité
THÈSE
Mok
présen
ersailles
tée
rançois
par
Hebrail
:
unications,
Elsa
Maître
NEGRE
elais
souten
v
ue
ersité
le
oncelet
:
Mon
01
M.
décem
Ra
bre
d
2009
Un
p
oulouse
our
:
obtenir
Bouzeghoub
le
de
grade
Arnaud
de
ersité
:
elais
Do
Geo
cteur
Ecole
de
des
l'Univ
aris
ersité
k
F
Conférences,
rançois
rançois
Rab
ours
elais
k
T
Maître
ours
U
Discipline
oulouse
/
P
Sp
Professeur,
écialité
ersité
:
tp
Informatique
2
EXPLORA
F
TION
k
COLLAB
v
ORA
Maître
TIVE
e
DE
HDR,
CUBES
iv
DE
T
DONNÉES
I
THÈSE
Y
dirigée
M.
par
rane
:
Professeur,
M.
ersité
Arnaud
V
Giacometti
M.
Professeur,
Giacometti
Univ
Univ
ersité
F
F
Rab
rançois
T
Rab
M.
elais
rges
T
Professeur,
ours
Nationale
M.
érieure
P
Télécomm
atric
P
k
M.
Marcel
atric
Maître
Marcel
de
de
Conférences,
Univ
Univ
F
ersité
Rab
F
T
rançois
M.
Rab
ranc
elais
Ra
T
at
ours
de
RAPPOR
HDR,
TEURS
niv
:
T
M.
I
P
ascalo
(Pro
apr
olia
erb
p
V
as
enia.
morir
v
la
e
vièlha
ccitan)
que
totjorntrop
t
À
tous
partis
ceux
tôt...
qui
sonp
l'Ecole
souhaite
ts
t
Je
ou
souhaite
m'on
tout
l'honneur
d'ab
c
ord
:
exprimer
Khandjari,
ma
paren
sincère
V
gratitude
P
en
de
v
tenne
ers
en
mes
que
encadran
Hassina
ts
Lamine
:
Dam
Arnaud
Enn,
Giaco-
u
metti,
l
Professeu
Hébrail,
r
des
à
t
l'Univ
er
ersité
remerciemen
F
l'équip
rançois
de
Rab
IA
e
p
l
mes
a
anciens
i
Ba,
s
onio
T
do
ours
n
et
e,
directeur
el
de
onne
ma
pas
thèse
et
et
ou
P
e
atric
ersité
k
et
Marcel,
r
Maître
Sup
de
unications
conférences
qui
à
i
l'Univ
de
ersité
mon
F
èse.
rançois
v
Rab
à
elais
de
T
iv
ours.
enseignan
Leurs
heurs
eorts
J'ai
en
t
terme
toute
d'encadremen
u
t
de
actif,
soit
d'encouragemen
ctoran
ts
driana,
et
Ch
surtout
et
de
andmac
patience
futurs
ainsi
ts
que
E
leurs
l
qualités
Ndia
scien
Niang
tiq
en
u
qui
es
e
et
de
h
n'oubl
umaines
m
on
ma
t
amis
con
de
tribu
loin
é
souten
à
encouragée.
l'épanouissemen
'Univ
t
de
de
ersailles
ce
Georges
tra
Professeu
v
à
ail.
Nationale
Je
érieure
su
Télécomm
is
de
très
aris,
reconnaissan
m'on
te
fa
à
t
P
d'accepter
ascal
particip
P
à
oncelet,
jury
Professeur
th
à
Mes
l'U
ts
niv
on
ersité
aussi
de
toute
Mon
e
tp
l'An
ellier
Un
2
ersitaire
et
Blois,
à
ts-
F
herc
ranc
et
k
TOS.
Ra
cep
v
dan
at,
une
Maître
ensée
de
particulière
conférences
o
HDR
r
à
compagnons
l'Univ
galère
ersité
ce
de
les
T
do
oulouse
ts
I,
A
d'a
Cheikh
v
Ahmed
oir
eriat,
été
Mouloudi
rapp
T
orteurs
W
de
her
mon
les

anciens
moire.
ctoran
Je
:
les
Baldé,
remercie
y
viv
o
emen
lah
t
Marie
p
y
our
Cheikh
le
et
tra
i
v
Nouv
ail
à
qu'i
je
ls
un
on
b
t
n
consacré
thèse.
à
je
son
ie
év
:
alu
es
a
ts,
ti
famille
o
mes
n
q
.
i,
Je
près
remercie
de
égalemen
,
t
t
Mokrane
u
Bouzeghoub,
et
Professeur
Remerciemen
à

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.

Diffusez cette publication

Vous aimerez aussi