La lecture à portée de main
Découvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDécouvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDescription
Sujets
Informations
Publié par | ludwig-maximilians-universitat_munchen |
Publié le | 01 janvier 2008 |
Nombre de lectures | 10 |
Poids de l'ouvrage | 3 Mo |
Extrait
DataA2008dvancedA?falgAnalysisralonJohannesTM?nchenempoausAM?ncdvancedStatistikAnalysisvondenTLudwigMaximiliansUnivempvoJohannesralM?ncDataundJohannesderA?falgersit?tDissertationhenanorgelegtderonFA?falgakult?tAugsburgf?rhen,Mathematik,19.05.2008Informatikr.Erstgutachenhagter:.Prof.KeimDr.mHans-P14.07.2008eterDKDanielriegelTZwdereitgutac?ndlichPr?fung:ter:ProfSte-AouldcresearcknoterestingwledgemenintextremelyThiseterwElkorkAwallouldiknotarehaparticularvPryedatabasebkeeubnofptoossiblethatwithoutuctheFsupptheortcolleaguesoftimesormanRenz,yypofeo-completedple.hIBorgwwDr.ouldanklikZimek.eatowtakbeethefooppouortunitIymtoFthankproblemsthemtforAsidetheirersitcontotributionsteam,toPthisDr.thesis.Dr.FirstDr.ofIalltheIwithwou.ouldwlikyeAtoThomasthankDr.mt,yBrecsupScervisoStefanier,Prof.thDtorou.onderfulHans-Ptime.eterlikKriegel.SusanneHewhogaadmin-vork,eemonethanktheeryoppFortunitouldytotothankswKroorkwwithwhenevhisccurredgrouphnicalasnewanasexternalmPhDthestudenIt.likNothankonlyserieshasinheDr.sharedeehisKr?ger,expPerienceKunath,andMatthiasknoandwledgeAlexeywiakhin.tenjohedallin-memdiscussionsballersyofThehisgroupresearcashbgroup.Dr.Heehascalsotert,succeededBerneciner,creatingKarstenaarduniqueDr.wfanorkingheisen,atmosphereMatthiaswithinhtheert,databaseWgroup.aIandamralsourvThankseryallgratefulytoforProf.wDr.andDanielterestingKeimIfromouldtheeUnivthankersitGrienyerger,ofshoulderedKtheonstanzistrativwhowhsoasn'wtcouldhesitatedcusaoursecondh,whenyaskvedmtoh.burthermore,ewthelseconderefereeextendforythistothesis.ranzIjer.oranzwasehelpfulmerucohwithtotecmequipmenyorchardwolleagueswfromrequired.thefromdatabaseygroup,fromespuniveciallyythewmemalsobeerstofithewholeiiestmreyortedcolleagueerenafromouldthemsd&morkingAespGthsinA?falg,Municexpressh.yInMyparticularnotIbutw,anetduringtobthankneedeDr.yMarcoePy?tktoeandwhofamilyinspiredtsmencouragedywhileinthisterestminFisimilaritwyciallysearcthankhheronlastcomplexdobthjectserwhenher.Ih,wworklikedtoinmhisdeepGeolusthanksteam.mThanksfriendstotoallythe.mparenysuppotherandsd&mmecolleaguesonlyforwtheirforpatiencethesis,whenthroughoutonceyagainlife.InallywIasouldwe-orkinglikfortomVyforthesispatienceinsteadtheofmonbaneingforateingtheewhenevsd&mIoce.dLastJohannesbutMunicnotMaleast2008IandAbstractandDuemeasure,toanalysistheTincreasewsisemannaCPUindexpthresholdowwseerofandandtheothevilaritertlyincreasingofdatasimilar,storagefromcapabilities,represenmoreeandinmoreadatacostofyallactualkiendanndThisiserecorded,erincludingtimetempworalbdata.alTimeyseries,seriestheedmostinprevsalwenintthreshold-basedtOurypec-eFirst,ofticstemyptheoralthedatasimilariarealue.derivisedyinhighlyaonbroadatnaddressesumects.btroerumofnewapplicationmeasuresdomains.esProminenwtcanexampleseincludemeansstoandcTheknewpriceisdataoinconsideredeconomtheyyuser-giv,similargeneals.expressiondeningdatamilaritinebiologyw,timethehcourseyofcanentlyvironmentationtaltheparametersecialinterest.meteorologythe,manorofdatasimilaritoffunctionmosecond,vingcomputationalobforjectscalculationrecordedabtyvtracThesensors.ticsThisthelargesimilaritamounnotiontisofdepratwthedatataskcanhand.onlythesisbbeaspanalyzedWbinyduceautomatedndatabminingofalgorithmssim-inyorderfortoserigeneratedatanewshoknohowledge.theyOneecienofbthecalculatedmostybasicofdatastructuresminingqueryopgorithms.erationsrstisthethesimilaritsimilaritmeasuresythreshold-based.queryw,timewhicarehascomputesifaexcesim-ailaritenyduringortimedistancetervvAsidealueformallyforthistiwyowobshojects.hoTtowtoseriesaspsucectsaofasucthathqueriesanbsecienicalculated.milaritrepresenyallofunctionforarespofiiispaivareicationthatofwtheinthresholdevvaluepresenat,queryutime.loadedThisaisdueforsuppexamplehresholusefulqueryforobdataortionminingseriestaskandthathatrytimetoance.determinetimecrucialointhresholds.inTheenextlastsimilariteydmeasuretimeconsiderswatherelevtanrelativteamplitudeproprange.hTchidistancestimerangebisthescanneddowithknoaecertainforresolutioneralandorforThiseacrecordingshthatconsideredeamplitudewvuncertainaluethesisfeaturesmethoarevextracted.theWFeminingconsidercorresptheInctryhangeoidintimethetsfeaturemainvonlyaluessmalloaviserWtheaamplitudetationvbaluesdanduppthwus,ounds,generateaso-calledobfeatureesequences.cDierenrened.tanfeaturestervcanhanallybbine,combinedytodanswwhereervamplitude-levenel-basedhsimilaritinybqueries.mIntoconts,trastex-tocantraditionalecied.approacwheeciensquerieswhicseries.hofaggregatewsglobalmifeaturecanvtoaluescrucialalongparametersthedtimeydimension,wwaeolcaptures.loondingcal.cparticularhearactoter-visticsloadingandcompletemonitorseriestheirjeccinhangeoformemorydiereniftaamplitudeelyvpalues.ofFtimurthermore,seriesourofmethoterest.deenablesosethetimeuserrepresentowhicspcanecifyeaserelevtoanalculateterrloaernbgesoofonlyamplitudefewvseriesaluesjectstovbtoeeconsideredompletelyandandsoAgain,therelevsimilarittyinnotionalscannotbvetoadaptedetowntheadvcurrenFinallytwrequiremendets.neNext,similaritwmeasureeso-calleinuncertaintroseries,ducesevso-calamplitudeledaluesingivtervfaeacl-fopcusedtsimilarittime.ycanqueries.eAtouserultiplecanorsperrorsecifymeasuremenonesoornosevacteralaluetimebinsptervWalsshothathoshouldtobtlyeortconsideredonfortimetheThecalculationpartofthistheshosimhoilaritdatayningvdsalue.bOurusedmaindiscofoercustfordthisforsimilthresholarit-baseysimilaritmeasuremeasure.wurthermoreasetheteciendatattosuppforortserieofthekZusammenfassungVMiteinendembVtikoranscmithreiten-derderEnjektteitwiclerklungtarstenvzwoneiRecdenierendenhenleistungMengeundeitsfunktionst?ndigjektwderacgenauhsendenzurDatenspveicAnfragealhernlerw?hnlicerdenjektenimmerzumehrAspDatenSemanallerundArteitsfunktiongespereceictikhert,wdarunzutertetauchgradighwtesicmpeidenoraleerscDaten.estimmDieseanderenDaten,jewinsbonesonderederZeitreihen,erationenfal-Mi-lenistineitsanfrage,eineriVielzahl?hnlicveitswoneist.AnzwwvendungsbBedeutung:ereicderhenhkan.Ezienz,D?hnlicazueinerz?hlenDatenbweiDies?hnlicpiescels-einw?hnliceiseanderenBetrac?rseDiesenhodatevnderinDiederescWirtscdaherhaft,senGen-Expressionsdatenekten.inerdenderVBiologie,hkTtempempeingef?hrt,eratur-f?rundMethoLuftvgezeigt,ersclfehmundutzungsdatenvinelemenderOpMeteorologiealoDataderningBewerfahrene-diegungsdatenhkbdieeiederObErfassungeinenvhonkVerterkwehrsstr?men.DabDar?bsindereihinausektelassenonsicesondererhdieauctikhzuDaten?hnlicauseitsfunktiondemdieMultimediabmitereiceinehhkalsauftempgro?enoraleanDatenbauassen,hnetz.B.erdendieann.aufeinanderfolgendenSemanT?neeinereineshkMusikst?cbks.hreibt,DieannimmerObgr??eralswherdendeeinemMengeObanbRohdatenhmacwird.hSemantisteineccomputerge-abh?ngigst?tzteonAnalyseArtdieserAnDatenendung.mitArbMethobdenh?ftigtdeshDatamitMiningsdieunerl?sslbicAsph,Zumumwanscvhlie?hiedeneenderfahrenp?hnlicoteneitsbtiellungnora-?tzlicDatenhezumScwirdhlussfolgerungendiebasierendorgestelltenaufdendeneilsDatenwieziehenHizuvkIndexstrukturen?nngeeignetenegorith-n.EineFvivmenimdasusgew?nsceierhUnseretestellenErgebnissollezienFtbbhseerecSchnetcwdenierterdenhr?nkkeingelesenann.ergebDasdieerstebinieneuep?hnliceature-hkitreiheeitsma?erlaufbasiertMethoaufeeinemaktuellGrenzw?hnlicert,Zeitr?u-den?hnliceineiBenteutzerndynamiscstimmhsczureAnfragezeit?hnlicveorgebEnenhkkteann.herkZweneiuZeitreihenWwescer-alendenanndannanalserten?hnlicundhbbwetractenhvtet,einenwsicennBerecderwgewDas?hlteaufGerden,renzwdenertuss,zuert?hnlicbhenwZeitensic?bheerdie-ungundeitunmitetersckhrittenwwird.heidendNacdiesemhdiederitudenformaledernzuDenitionhendeserten,?hn-derlicwhkdieeitsma?esaufzeigencwirdeanscdenhlie?end,onwieeature-WmanhZeitreiheneiineineineBereicRepr?-Amplitudensenentatione?bdaserf?hrt,kdieanesAnforderungenerlaubt,AnscGrenzwdieert-basierteterv?hnlickhkDabeitsanfragenBeneziendertaufzuderbeierecunghnen.eEnbtscsollheidendliegtdabAnfrageteiEzienz.ist,ermiedendassdiederinformationsp?tereicverdenerwwende-eintemehrereGrenzweatureserte-nictherden,tenbhekhlie?licannmehrereteature-Vseinktormn,uss.f?rDiesBestimmerlaubtderbhkeispielswzweiseZeitreihenaucinandhrdieomEnrttdecerden.kungtscvistoneib?hnlicesonderseitsma?relevamanltenbasier-GrenzwAbtastungertenZeitreihemitGegensatzMethodenden?mmlicdesFDataWMining.dieDastlangn?cZeitachsteabgeleitetneueerden?hnlicndhkZeeitsma?sobasiertglobaleaufeiseeinemharakterisieren.relevMethoanbtenhreibtAmpli-VtudenvblokereicFh.erten.Derhlie?licrelevkanbteunsererBereidecrelevhterwirdhmitoneinerwbangegebestimmwtenrdAu?sungnabgetastet.damitF?r?hnlijedenh-abgetasteteneitsma?Amplitudenesserwdieertenbangepassterecerden.hnenhlie?endwirwirbsogenannestimm-Inteall-fokusiertenMerkmale,h-sogenanneitsanfragenteor.Feieatures.derF?rutzerjedenoFmehrereeaturetme,ypdieergibthsicAnfragealgorithmhbdamitdereinehnsogenanndestehkFits-eature-Sequenz,ertesdieescdenenV.erlaufHauptaugenmerkderbAmplitudendiesemwypertederbEse-vscwhreibt.dassDagesamf?rZeitreihen-jedeninbHauptspetracherhwtemtobeohlnurAmplitudenw