doc: Add opt_pred and sevenday.

author: Jan Klemkow <j.klemkow@wemelug.de> 2012-05-14 19:50:54 +0200
committer: Jan Klemkow <j.klemkow@wemelug.de> 2012-05-14 19:50:54 +0200
commit: a02815b86c8e2e37f5d00133ebf4305cbfbc87a1 (patch)
tree: deefff28eb1310150ac94097b09273819614a953 /doc
parent: 59eb4ffc229edb1d6274337e7d18116a5281efe3 (diff)
download: dmc-a02815b86c8e2e37f5d00133ebf4305cbfbc87a1.tar.gz
dmc-a02815b86c8e2e37f5d00133ebf4305cbfbc87a1.tar.bz2
dmc-a02815b86c8e2e37f5d00133ebf4305cbfbc87a1.zip
1 files changed, 36 insertions, 0 deletions
diff --git a/doc/document.asciidoc b/doc/document.asciidoc
index 5b02a03..2e413da 100644
--- a/doc/document.asciidoc
+++ b/doc/document.asciidoc
@@ -30,6 +30,12 @@ Mittelwert
 Mittelwert eines Produktes ueber die Trainingsdaten sind die Daten zur
 Vorhersage.
 
+Sevenday-Verfahren
+~~~~~~~~~~~~~~~~~~
+
+Beim Sevenday-Verfahren wird fuer jeden Wochentag ein Mittelwert gebildet und
+Vorhergesagt.
+
 Liniare-Approximation Zeit -> Quantitaet
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 Der Verlauft der Quantitaet ueber die Trainingsdaten wird linear angenaehert und
@@ -44,3 +50,33 @@ Grundidee:
 
 Die Absatz eines Produktes setzt sich aus verschiedenen Einflussfaktoren zusammen.
 Zum eine die Wochen- und die Preisschwankung.
+
+
+Optimierungsverfahren
+~~~~~~~~~~~~~~~~~~~~~
+
+Das Optmierungsverfahren ist Post-Clustering und wurde im Script 'opt_pred.m'
+implementiert.
+Dieses Meta-Verfahren bestimmt fuer jedes Produkt eines der oben genannten
+Verfahren, welches den geringsten Fehlerwert bei der Vorhersage ueber der
+Trainingsmenge ergab.
+Dabei werden die Vorhersage-Matrizen der Verfahren mit den Real-Daten ueber die
+Manhatten-Distanz verglichen.
+Als Ergebnis erhaelt man nun einen Vektor, welches die Indizes der jeweils
+besten Verfahren enthaelt.
+Die Position des Indizes spiegelt dabei das Produkt wieder, fuer die dieses
+Verfahren am besten geeignet ist.
+
+Mit diesem Vektor koennen nun die Vorhersagen der einzelnen Produkte fuer den
+unbekannten Zeitraum zusammen gelegt werden.
+
+Dieses Verfahren wuerde sich auch gut zur Bestimmung des Abgabe-Datensatzes fuer
+den Daten-Mining-Cup eignen.
+Dabei koennten alle Teams fuer ihre Verfahren einmal ihre Vorhersage fuer die
+Tage 29 bis 42 in Form der "train.txt" und ihre Vorhersagen fuer den unbekannten
+Zeitraum abgeben.
+Anhand der verschiedenen Fehler der Vorhersagen pro Produkt koennte wie oben
+beschrieben ebenfalls ein Vektor mit den Indizes der Verschiedenen Einreichungen
+erstellt werden und damit auch der Datensatz fuer die Einreichung im Wettbewerb.
+
+
author	Jan Klemkow <j.klemkow@wemelug.de>	2012-05-14 19:50:54 +0200
committer	Jan Klemkow <j.klemkow@wemelug.de>	2012-05-14 19:50:54 +0200
commit	a02815b86c8e2e37f5d00133ebf4305cbfbc87a1 (patch)
tree	deefff28eb1310150ac94097b09273819614a953 /doc
parent	59eb4ffc229edb1d6274337e7d18116a5281efe3 (diff)
download	dmc-a02815b86c8e2e37f5d00133ebf4305cbfbc87a1.tar.gz dmc-a02815b86c8e2e37f5d00133ebf4305cbfbc87a1.tar.bz2 dmc-a02815b86c8e2e37f5d00133ebf4305cbfbc87a1.zip