RapidMiner 4.6

icon

695

pages

icon

English

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

695

pages

icon

English

icon

Ebook

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

RapidMiner 4.6
User Guide
Operator Reference
Developer Tutorial 2
Rapid-I GmbH
Stockumer Str. 475
44227 Dortmund, Germany
http://www.rapidminer.com/
Copyright 2001-2009 by Rapid-I
October 1, 2009 Contents
1 Introduction 29
1.1 Modeling Knowledge Discovery Processes as Operator Trees . . 30
1.2 RapidMiner as a Data Mining Interpreter . . . . . . . . . . . 30
1.3 Di erent Ways of Using RapidMiner . . . . . . . . . . . . . . 32
1.4 Multi-Layered Data View Concept . . . . . . . . . . . . . . . . 32
1.5 Transparent Data Handling . . . . . . . . . . . . . . . . . . . . 33
1.6 Meta Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.7 Large Number of Built-in Data Mining Operators . . . . . . . . 33
1.8 Extending RapidMiner . . . . . . . . . . . . . . . . . . . . . 34
1.9 Example Applications . . . . . . . . . . . . . . . . . . . . . . . 35
1.10 How this tutorial is organized . . . . . . . . . . . . . . . . . . . 36
2 Installation and starting notes 37
2.1 Download . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2 Installation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.1 Installing the Windows executable . . . . . . . . . . . . 37
2.2.2 the Java version (any platform) . . . . . . . . 38
2.3 Starting RapidMiner . . . . . . . . . . . . . . . . . . . . . . 38
2.4 Memory Usage . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.5 Plugins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.6 General settings ...
Voir icon arrow

Publié par

Nombre de lectures

242

Langue

English

Poids de l'ouvrage

2 Mo

RapidMiner 4.6 User Guide Operator Reference Developer Tutorial 2 Rapid-I GmbH Stockumer Str. 475 44227 Dortmund, Germany http://www.rapidminer.com/ Copyright 2001-2009 by Rapid-I October 1, 2009 Contents 1 Introduction 29 1.1 Modeling Knowledge Discovery Processes as Operator Trees . . 30 1.2 RapidMiner as a Data Mining Interpreter . . . . . . . . . . . 30 1.3 Di erent Ways of Using RapidMiner . . . . . . . . . . . . . . 32 1.4 Multi-Layered Data View Concept . . . . . . . . . . . . . . . . 32 1.5 Transparent Data Handling . . . . . . . . . . . . . . . . . . . . 33 1.6 Meta Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1.7 Large Number of Built-in Data Mining Operators . . . . . . . . 33 1.8 Extending RapidMiner . . . . . . . . . . . . . . . . . . . . . 34 1.9 Example Applications . . . . . . . . . . . . . . . . . . . . . . . 35 1.10 How this tutorial is organized . . . . . . . . . . . . . . . . . . . 36 2 Installation and starting notes 37 2.1 Download . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2 Installation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2.1 Installing the Windows executable . . . . . . . . . . . . 37 2.2.2 the Java version (any platform) . . . . . . . . 38 2.3 Starting RapidMiner . . . . . . . . . . . . . . . . . . . . . . 38 2.4 Memory Usage . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.5 Plugins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.6 General settings . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.7 External Programs . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.8 Database Access . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3 4 CONTENTS 3 First steps 45 3.1 First example . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.2 Process con guration les . . . . . . . . . . . . . . . . . . . . . 48 3.3 Parameter Macros . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.4 File formats . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.4.1 Data les and the attribute description le . . . . . . . . 51 3.4.2 Model les . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.4.3 Attribute construction les . . . . . . . . . . . . . . . . 55 3.4.4 Parameter set les . . . . . . . . . . . . . . . . . . . . . 56 3.4.5 Attribute weight les . . . . . . . . . . . . . . . . . . . 56 3.5 File format summary . . . . . . . . . . . . . . . . . . . . . . . 57 4 Advanced processes 59 4.1 Feature selection . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.2 Splitting up Processes . . . . . . . . . . . . . . . . . . . . . . . 61 4.2.1 Learning a model . . . . . . . . . . . . . . . . . . . . . 61 4.2.2 Applying the model . . . . . . . . . . . . . . . . . . . . 61 4.3 Parameter and performance analysis . . . . . . . . . . . . . . . 63 4.4 Support and tips . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5 Operator reference 69 5.1 Basic operators . . . . . . . . . . . . . . . . . . . . . . . . . . 70 5.1.1 ModelApplier . . . . . . . . . . . . . . . . . . . . . . . 70 5.1.2 ModelGrouper . . . . . . . . . . . . . . . . . . . . . . . 70 5.1.3 ModelUngrouper . . . . . . . . . . . . . . . . . . . . . . 71 5.1.4 ModelUpdater . . . . . . . . . . . . . . . . . . . . . . . 72 5.1.5 OperatorChain . . . . . . . . . . . . . . . . . . . . . . . 72 5.2 Core operators . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5.2.1 CommandLineOperator . . . . . . . . . . . . . . . . . . 74 5.2.2 DataMacroDe nition . . . . . . . . . . . . . . . . . . . 75 5.2.3 Experiment . . . . . . . . . . . . . . . . . . . . . . . . 76 October 1, 2009 CONTENTS 5 5.2.4 FileEcho . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.2.5 IOConsumer . . . . . . . . . . . . . . . . . . . . . . . . 78 5.2.6 IOMultiplier . . . . . . . . . . . . . . . . . . . . . . . . 79 5.2.7 IORetriever . . . . . . . . . . . . . . . . . . . . . . . . 79 5.2.8 IOSelector . . . . . . . . . . . . . . . . . . . . . . . . . 80 5.2.9 IOStorer . . . . . . . . . . . . . . . . . . . . . . . . . . 81 5.2.10 MacroConstruction . . . . . . . . . . . . . . . . . . . . 82 5.2.11 MacroDe nition . . . . . . . . . . . . . . . . . . . . . . 85 5.2.12 MaterializeDataInMemory . . . . . . . . . . . . . . . . . 86 5.2.13 MemoryCleanUp . . . . . . . . . . . . . . . . . . . . . . 87 5.2.14 Process . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5.2.15 SQLExecution . . . . . . . . . . . . . . . . . . . . . . . 88 5.2.16 Script . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 5.2.17 SingleMacroDe nition . . . . . . . . . . . . . . . . . . . 90 5.3 Input/Output operators . . . . . . . . . . . . . . . . . . . . . . 92 5.3.1 AccessExampleSource . . . . . . . . . . . . . . . . . . . 92 5.3.2 Ar ExampleSetWriter . . . . . . . . . . . . . . . . . . . 93 5.3.3 Ar ExampleSource . . . . . . . . . . . . . . . . . . . . 93 5.3.4 AttributeConstructionsLoader . . . . . . . . . . . . . . . 95 5.3.5 AttributeConstructionsWriter . . . . . . . . . . . . . . . 96 5.3.6 AttributeWeightsLoader . . . . . . . . . . . . . . . . . . 97 5.3.7 AeightsWriter . . . . . . . . . . . . . . . . . . 97 5.3.8 BibtexExampleSource . . . . . . . . . . . . . . . . . . . 98 5.3.9 C45ExampleSource . . . . . . . . . . . . . . . . . . . . 99 5.3.10 CSVExampleSetWriter . . . . . . . . . . . . . . . . . . 101 5.3.11 CSVExampleSource . . . . . . . . . . . . . . . . . . . . 102 5.3.12 CachedDatabaseExampleSource . . . . . . . . . . . . . 103 5.3.13 ChurnReductionExampleSetGenerator . . . . . . . . . . 105 5.3.14 ClusterModelReader . . . . . . . . . . . . . . . . . . . . 106 5.3.15delWriter . . . . . . . . . . . . . . . . . . . . 106 The RapidMiner 4.6 Tutorial 6 CONTENTS 5.3.16 DBaseExampleSource . . . . . . . . . . . . . . . . . . . 107 5.3.17 DasyLabExampleSource . . . . . . . . . . . . . . . . . . 108 5.3.18 DatabaseExampleSetWriter . . . . . . . . . . . . . . . . 108 5.3.19 DatabaseExampleSource . . . . . . . . . . . . . . . . . 110 5.3.20 DirectMailingExampleSetGenerator . . . . . . . . . . . . 112 5.3.21 ExampleSetGenerator . . . . . . . . . . . . . . . . . . . 112 5.3.22 ExampleSetWriter . . . . . . . . . . . . . . . . . . . . . 113 5.3.23 ExampleSource . . . . . . . . . . . . . . . . . . . . . . 116 5.3.24 ExcelExampleSetWriter . . . . . . . . . . . . . . . . . . 118 5.3.25 ExcelExampleSource . . . . . . . . . . . . . . . . . . . . 118 5.3.26 GnuplotWriter . . . . . . . . . . . . . . . . . . . . . . . 120 5.3.27 IOContainerReader . . . . . . . . . . . . . . . . . . . . 120 5.3.28 IOContainerWriter . . . . . . . . . . . . . . . . . . . . . 121 5.3.29 IOObjectReader . . . . . . . . . . . . . . . . . . . . . . 122 5.3.30 IOObjectWriter . . . . . . . . . . . . . . . . . . . . . . 122 5.3.31 MassiveDataGenerator . . . . . . . . . . . . . . . . . . 123 5.3.32 ModelLoader . . . . . . . . . . . . . . . . . . . . . . . . 124 5.3.33 ModelWriter . . . . . . . . . . . . . . . . . . . . . . . . 124 5.3.34 MultipleLabelGenerator . . . . . . . . . . . . . . . . . . 126 5.3.35 NominalExampleSetGenerator . . . . . . . . . . . . . . . 126 5.3.36 ParameterSetLoader . . . . . . . . . . . . . . . . . . . . 127 5.3.37 ParameterSetWriter . . . . . . . . . . . . . . . . . . . . 128 5.3.38 PerformanceLoader . . . . . . . . . . . . . . . . . . . . 128 5.3.39 PerformanceWriter . . . . . . . . . . . . . . . . . . . . 129 5.3.40 ResultWriter . . . . . . . . . . . . . . . . . . . . . . . . 130 5.3.41 SPSSExampleSource . . . . . . . . . . . . . . . . . . . 130 5.3.42 SalesExampleSetGenerator . . . . . . . . . . . . . . . . 131 5.3.43 SimpleExampleSource . . . . . . . . . . . . . . . . . . . 132 5.3.44 SingleTextObjectInput . . . . . . . . . . . . . . . . . . . 134 5.3.45 SparseFormatExampleSource . . . . . . . . . . . . . . . 135 October 1, 2009 CONTENTS 7 5.3.46 StataExampleSource . . . . . . . . . . . . . . . . . . . 136 5.3.47 TeamPro tExampleSetGenerator . . . . . . . . . . . . . 137 5.3.48 TextCleaner . . . . . . . . . . . . . . . . . . . . . . . . 138 5.3.49 TextExtractor . . . . . . . . . . . . . . . . . . . . . . . 138 5.3.50 TextObject2ExampleSet . . . . . . . . . . . . . . . . . . 139 5.3.51 TextObjectLoader . . . . . . . . . . . . . . . . . . . . . 140 5.3.52 TextObjectWriter . . . . . . . . . . . . . . . . . . . . . 140 5.3.53 TextSegmenter . . . . . . . . . . . . . . . . . . . . . . 141 5.3.54 ThresholdLoader . . . . . . . . . . . . . . . . . . . . . . 142 5.3.55 ThresholdWriter . . . . . . . . . . . . . . . . . . . . . . 142 5.3.56 TransfersExampleSetGenerator . . . . . . . . . . . . . . 143 5.3.57 URLExampleSource . . . . . . . . . . . . . . . . . . . . 144 5.3.58 UpSellingExampleSetGenerator . . . . . . . . . . . . . . 145 5.3.59 WekaModelLoader . . . . . . . . . . . . . . . . . . . . . 145 5.3.60 Xr ExampleSetWriter . . . . . . . . . . . . . . . . . . . 146 5.3.61 Xr ExampleSource . . . . . . . . . . . . . . . . . . . . 147 5.4 Learning schemes . . . . . . . . . . . . . . . . . . . . . . . . . 150 5.4.1 AdaBoost . . . . . . . . . . . . . . . . . . . . . . . . . 150 5.4.2 AdditiveRegression . . . . . . . . . . . . . . . . . . . . 151 5.4.3 AgglomerativeClustering . . . . . . . . . . . . . . . . . 152 5.4.4 AssociationRuleGenerator . . . . . . . . . . . . . . . . . 153 5.4.5 AttributeBasedVote . . . . . . . . . . . . . . . . . . . . 154 5.4.6 Bagging . . . . . . . . . . . . . . . . . . . . . . . . . . 155 5.4.7 BasicRuleLearner . . . . . . . . . . . . . . . . . . . . . 156 5.4.8 BayesianBoosting . . . . . . . . . . . . . . . . . . . . . 156 5.4.9 BestRuleInduction . . . . . . . . . . . . . . . . . . . . . 158 5.4.10 Binary2MultiClassLearner . . . . . . . . . . . . . . . . . 159 5.4.11 CHAID . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 5.4.12 Classi cationByRegression . . . . . . . . . . . . . . . . 162 5.4.13 Cluster2Prediction . . . . . . . . . . . . . . . . . . . . . 162 The RapidMiner 4.6 Tutorial 8 CONTENTS 5.4.14 ClusterModel2ExampleSet . . . . . . . . . . .
Voir icon more
Alternate Text