diff options
author | Jan Klemkow <j.klemkow@wemelug.de> | 2012-05-14 19:50:54 +0200 |
---|---|---|
committer | Jan Klemkow <j.klemkow@wemelug.de> | 2012-05-14 19:50:54 +0200 |
commit | a02815b86c8e2e37f5d00133ebf4305cbfbc87a1 (patch) | |
tree | deefff28eb1310150ac94097b09273819614a953 /doc/document.asciidoc | |
parent | 59eb4ffc229edb1d6274337e7d18116a5281efe3 (diff) | |
download | dmc-a02815b86c8e2e37f5d00133ebf4305cbfbc87a1.tar.gz dmc-a02815b86c8e2e37f5d00133ebf4305cbfbc87a1.tar.bz2 dmc-a02815b86c8e2e37f5d00133ebf4305cbfbc87a1.zip |
doc: Add opt_pred and sevenday.
Diffstat (limited to 'doc/document.asciidoc')
-rw-r--r-- | doc/document.asciidoc | 36 |
1 files changed, 36 insertions, 0 deletions
diff --git a/doc/document.asciidoc b/doc/document.asciidoc index 5b02a03..2e413da 100644 --- a/doc/document.asciidoc +++ b/doc/document.asciidoc @@ -30,6 +30,12 @@ Mittelwert Mittelwert eines Produktes ueber die Trainingsdaten sind die Daten zur Vorhersage. +Sevenday-Verfahren +~~~~~~~~~~~~~~~~~~ + +Beim Sevenday-Verfahren wird fuer jeden Wochentag ein Mittelwert gebildet und +Vorhergesagt. + Liniare-Approximation Zeit -> Quantitaet ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Der Verlauft der Quantitaet ueber die Trainingsdaten wird linear angenaehert und @@ -44,3 +50,33 @@ Grundidee: Die Absatz eines Produktes setzt sich aus verschiedenen Einflussfaktoren zusammen. Zum eine die Wochen- und die Preisschwankung. + + +Optimierungsverfahren +~~~~~~~~~~~~~~~~~~~~~ + +Das Optmierungsverfahren ist Post-Clustering und wurde im Script 'opt_pred.m' +implementiert. +Dieses Meta-Verfahren bestimmt fuer jedes Produkt eines der oben genannten +Verfahren, welches den geringsten Fehlerwert bei der Vorhersage ueber der +Trainingsmenge ergab. +Dabei werden die Vorhersage-Matrizen der Verfahren mit den Real-Daten ueber die +Manhatten-Distanz verglichen. +Als Ergebnis erhaelt man nun einen Vektor, welches die Indizes der jeweils +besten Verfahren enthaelt. +Die Position des Indizes spiegelt dabei das Produkt wieder, fuer die dieses +Verfahren am besten geeignet ist. + +Mit diesem Vektor koennen nun die Vorhersagen der einzelnen Produkte fuer den +unbekannten Zeitraum zusammen gelegt werden. + +Dieses Verfahren wuerde sich auch gut zur Bestimmung des Abgabe-Datensatzes fuer +den Daten-Mining-Cup eignen. +Dabei koennten alle Teams fuer ihre Verfahren einmal ihre Vorhersage fuer die +Tage 29 bis 42 in Form der "train.txt" und ihre Vorhersagen fuer den unbekannten +Zeitraum abgeben. +Anhand der verschiedenen Fehler der Vorhersagen pro Produkt koennte wie oben +beschrieben ebenfalls ein Vektor mit den Indizes der Verschiedenen Einreichungen +erstellt werden und damit auch der Datensatz fuer die Einreichung im Wettbewerb. + + |