summaryrefslogtreecommitdiff
path: root/doc/document.asciidoc
diff options
context:
space:
mode:
Diffstat (limited to 'doc/document.asciidoc')
-rw-r--r--doc/document.asciidoc61
1 files changed, 59 insertions, 2 deletions
diff --git a/doc/document.asciidoc b/doc/document.asciidoc
index b3aba3b..f9dec59 100644
--- a/doc/document.asciidoc
+++ b/doc/document.asciidoc
@@ -27,22 +27,79 @@ image::image/opt_pred_pie.svg[Anteil der Verfahren an der Gesammtloesung]
Mittelwert
~~~~~~~~~~
-Mittelwert eines Produktes ueber die Trainingsdaten sind die Daten zur
-Vorhersage.
+Beim Mittelwertverfahren wird fuer jedes Produkte ueber die Trainingsmenge
+der Mittelwert gebildet und fuer den unbekannten Zeitraum Vorhergesagt.
+Dabei wurde eine Fehlerpunktzahl von 489 erreicht.
Sevenday-Verfahren
~~~~~~~~~~~~~~~~~~
+Wenn man die Summe ueber dem Absatz alle Produkte fuer alle 42 Tage in einem
+Diagram abtraegt, sieht man eine sehr deutliche periodische Schwankung der
+Werte.
+Diese Schwanken in einem Sieben-Tage-Rhythmus.
+Unter der Anahme, das dieses Verhalten jedem oder zumindest in den meisten
+Produkte zu grunde liegt, wurde das Sevenday-Verfahren entwickelt.
+Der Ansazt geht davon aus, dass der Absatz im mittel ueber eine Woche immer
+gleich ist und sich nur ueber Absatzstarke und -schwache Tage verteilt.
Beim Sevenday-Verfahren wird fuer jeden Wochentag ein Mittelwert gebildet und
Vorhergesagt.
+In der Summer versucht man also ueber sieben Tage einen mittlere Schwingung
+der Sieben-Tage-Schankung zu erzeugen und dieses dann fuer den unbekannten
+Zeitraum vorherzusagen.
+
+image::image/sevenday-qsum-pred.svg[SevendayQsum]
+
+In diesem Diagramm ist die mittlere kurve in den Vorhersagezeitraum abgetragen
+worden.
+Das Ergebniss sieht optisch gut aus, aber enttaeuscht in der Fehlerzahl von 484
+Punken.
+Wenn fuer eine Produkt an einem Tage ein zu hoher Wert vorhergesagt wird und
+fuer ein anderes Produkt ein zu niedriger im Vergleich zu den Realwerten,
+dann gleichen sich die Negativen- und Positvenabstaende in der Summer wieder
+aus.
+Daher kann das Verhalten der Siebentagesschwankung nicht alleine Auschlaggebend
+fuer den Absatz eines Produktes sein.
Liniare-Approximation Zeit -> Quantitaet
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+Bei der Approximation der Quantitaetskurve zu einer geraden, wird versucht einen
+allgemein steigenden oder fallenden Trend eines Produktes zu erkennen.
+Hierbei wird davon ausgegangen, dass sich ein Produkt ueber eine grosseren
+Zeitraum im mittelveraender.
+Anders als beim Mittelwertverfahren, welches von einer immer gleichbleibenden
+Grundabsatzmenge ausgeht, wird hier ein Trend mit bedacht.
+
Der Verlauft der Quantitaet ueber die Trainingsdaten wird linear angenaehert und
fuer den die Vorhersage benutzt.
+Das Ergebniss dieses Verfahrens lieferte fuer einige Produkte z. B. dem Ersten
+eine etwas besseres Ergebniss als der Reine Mittelwert.
+Fuer andere allerdings einen viel zu steilen Anstieg, der ziemlich grosse
+Fehlerwerte verussachte.
+
+TODO: Fehlerwerte noch mal bestimmen!
+
Lineare-Regresion (special)
~~~~~~~~~~~~~~~~~~~~~~~~~~~
+Am Produkt Nr. 335 kann man examplarisch sehr gut erkennen, dass der Absatz
+von den beiden Einflussgroessen Siebentage-Schwankung sowie der Preisaenderung
+abhaengt.
+Mit diesem Verfahren wird versucht beide Einflussgroessen bei der Vorhersage
+zu beachten.
+
+Dabei wurde zunaechte eine Fourie-Analyse der Kurve der Absatzsumme alle
+Produkte ueber die 42 Tage der Vorhersagemenge durchfuehrt, um die Frequenzen
+der Siebentagesschwankung empirisch zu bestimmen.
+Es wurde jeweil einzelne Frequenzen entfernt und bei der Ruecktransformation
+ein Digramm erwartet, welches dem mittelwert aehnelt.
+
+...
+
+Die so ermittelten Frequenzen wurden dann nach der normalen Preis -> Quantitaets
+approxiamtion wieder hinzu genommen.
+
+
Grundidee:
- herrausrechnen der 7-Tage-Einbruche aus den Trainingsdaten fuer die Regression
und eine Approximation fuer reinen Preis->Quantitaets-Zusammenhang.