doc: Explain rand/chi prediction.

author: Jan Klemkow <j.klemkow@wemelug.de> 2012-05-17 11:17:15 +0200
committer: Jan Klemkow <j.klemkow@wemelug.de> 2012-05-17 11:17:15 +0200
commit: 8989122d2a4b109c6b1004a60406bda72784b24a (patch)
tree: 7a6bbe7fa7d063862bcfd7d9e82d84ff1fb4b1dd /doc/document.asciidoc
parent: a02815b86c8e2e37f5d00133ebf4305cbfbc87a1 (diff)
download: dmc-8989122d2a4b109c6b1004a60406bda72784b24a.tar.gz
dmc-8989122d2a4b109c6b1004a60406bda72784b24a.tar.bz2
dmc-8989122d2a4b109c6b1004a60406bda72784b24a.zip
1 files changed, 29 insertions, 4 deletions
diff --git a/doc/document.asciidoc b/doc/document.asciidoc
index 2e413da..b3aba3b 100644
--- a/doc/document.asciidoc
+++ b/doc/document.asciidoc
@@ -48,13 +48,38 @@ Grundidee:
 	und eine Approximation fuer reinen Preis->Quantitaets-Zusammenhang.
 - 7-Tage-Einbrueche hinein rechnen.
 
-Die Absatz eines Produktes setzt sich aus verschiedenen Einflussfaktoren zusammen.
+Der Absatz eines Produktes setzt sich aus verschiedenen Einflussfaktoren
+zusammen.
 Zum eine die Wochen- und die Preisschwankung.
 
+Zufallsverfahren
+~~~~~~~~~~~~~~~~
+Dieses Verfahren wurde entwickelt um Plausibitaet der anderen Verfahren zu
+Testen und um der Vermutung nach zu gehen, das es Produkte gibt, welche
+gar nicht vorhersagbar sind.
+
+Bei dieses Verfahren wurde fuer jedes Product der Mittelwert und die
+Standardabweichung ermittelt.
+Mit dieses Parametern konnten fuer jedes Product 14 Werte zufaellig fuer die
+Vorhersage bestimmt werden.
+Zur Zufallsbestimmung wurden Octave-interen Zufallsfunktionen mit Normal- und
+mit Chi-Verteilung benutzt.
+Beide Verteiltungen lieferten aehnliche Ergebnisse.
+
+Der Gesammtfehler bei diesem Verfahren schankte zwischen 640 und 590
+Fehlerpunkten.
+Im Vergleich mit anderen Verfahren (siehe Optimierungsverfahren) stellte sich
+herraus, dass es immer wieder Produkte gab, welche mit diesesm Verfahren bessere
+Werte lieferten.
+Circa 7% der Podukte liessen sich mit Zufall besser vorhersagen, als duch die
+Zuvor beschriebenen Verfahren.
+Es stellte sich aber herraus, dass es bei jedem duchlauf andere Produkte waren,
+welche mit dem Vergleich zu den Realendaten besser vorhergesagt wurden.
+Somit war dieses Verfahren keine Option fuer eine serioese Vorhersage fuer
+unbekannten Datensaetze.
 
 Optimierungsverfahren
 ~~~~~~~~~~~~~~~~~~~~~
-
 Das Optmierungsverfahren ist Post-Clustering und wurde im Script 'opt_pred.m'
 implementiert.
 Dieses Meta-Verfahren bestimmt fuer jedes Produkt eines der oben genannten
@@ -70,6 +95,8 @@ Verfahren am besten geeignet ist.
 Mit diesem Vektor koennen nun die Vorhersagen der einzelnen Produkte fuer den
 unbekannten Zeitraum zusammen gelegt werden.
 
+image::image/opt_pred_pie.svg[OptimizePie]
+
 Dieses Verfahren wuerde sich auch gut zur Bestimmung des Abgabe-Datensatzes fuer
 den Daten-Mining-Cup eignen.
 Dabei koennten alle Teams fuer ihre Verfahren einmal ihre Vorhersage fuer die
@@ -78,5 +105,3 @@ Zeitraum abgeben.
 Anhand der verschiedenen Fehler der Vorhersagen pro Produkt koennte wie oben
 beschrieben ebenfalls ein Vektor mit den Indizes der Verschiedenen Einreichungen
 erstellt werden und damit auch der Datensatz fuer die Einreichung im Wettbewerb.
-
-
author	Jan Klemkow <j.klemkow@wemelug.de>	2012-05-17 11:17:15 +0200
committer	Jan Klemkow <j.klemkow@wemelug.de>	2012-05-17 11:17:15 +0200
commit	8989122d2a4b109c6b1004a60406bda72784b24a (patch)
tree	7a6bbe7fa7d063862bcfd7d9e82d84ff1fb4b1dd /doc/document.asciidoc
parent	a02815b86c8e2e37f5d00133ebf4305cbfbc87a1 (diff)
download	dmc-8989122d2a4b109c6b1004a60406bda72784b24a.tar.gz dmc-8989122d2a4b109c6b1004a60406bda72784b24a.tar.bz2 dmc-8989122d2a4b109c6b1004a60406bda72784b24a.zip