summaryrefslogtreecommitdiff
path: root/doc
diff options
context:
space:
mode:
authorJan Klemkow <j.klemkow@wemelug.de>2012-05-18 22:48:16 +0200
committerJan Klemkow <j.klemkow@wemelug.de>2012-05-18 22:48:55 +0200
commit889d74513baa9f2623edd029f42c10fbb63a9551 (patch)
tree57f41141c513ff2778143aa92ed82acd1a5dfb48 /doc
parent5db246dbea5420dad6eb96704dcd6cb8a5e4c90e (diff)
downloaddmc-889d74513baa9f2623edd029f42c10fbb63a9551.tar.gz
dmc-889d74513baa9f2623edd029f42c10fbb63a9551.tar.bz2
dmc-889d74513baa9f2623edd029f42c10fbb63a9551.zip
doc: Describe Datenvorbetrachtung.
Diffstat (limited to 'doc')
-rw-r--r--doc/document.asciidoc49
1 files changed, 30 insertions, 19 deletions
diff --git a/doc/document.asciidoc b/doc/document.asciidoc
index 559c13f..de3fc48 100644
--- a/doc/document.asciidoc
+++ b/doc/document.asciidoc
@@ -54,6 +54,36 @@ price_{day56,product1} & price_{day56,product2} & \cdots & price_{day56,product5
\]
++++++++++++++++++++++++++++++++++++++++++++
+Vorbetrachtung der Daten
+------------------------
+Zu Beginn des Datamining-Cups wurden die Daten mit verschieden Diagrammen
+visualisiert um erste Eindruecke und Ideen zu gewinnen.
+Dabei fand ein Brainstorming statt, bei dem Folgende Ideen entstanden sind.
+
+Zeitintervalle
+~~~~~~~~~~~~~~
+Dabei wurde die Summe aller Verkaeuft ueber einen Tag fuer alle 42 Tage
+abgetragen.
+Die sich daraus ergebene Kurve gab den inspiration fuer das Sevenday-Verfahren.
+Da deutlich wurde, das der Absatz sich periodisch schwank.
+
+Mittelwert und Lineare-Approximation
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+Bei der Approximation der Quantitätskurve zu einer geraden, wird versucht einen
+allgemein steigenden oder fallenden Trend eines Produktes zu erkennen.
+Hierbei wird davon ausgegangen, dass sich ein Produkt über eine größeren
+Zeitraum im mittelveränder.
+Anders als beim Mittelwertverfahren, welches von einer immer gleichbleibenden
+Grundabsatzmenge ausgeht, wird hier ein Trend mit bedacht.
+
+Der Verlauf der Quantität über die Trainingsdaten wird linear angenähert und
+für den die Vorhersage benutzt.
+
+Das Ergebniss dieses Verfahrens lieferte für einige Produkte z. B. dem Ersten
+eine etwas besseres Ergebniss als der Reine Mittelwert.
+Für andere allerdings einen viel zu steilen Anstieg, der ziemlich große
+Fehlerwerte verussachte.
+
Verfahren zur Vorhersage
------------------------
@@ -103,25 +133,6 @@ aus.
Daher kann das Verhalten der Siebentagesschwankung nicht alleine Auschlaggebend
für den Absatz eines Produktes sein.
-Lineare-Approximation Zeit -> Quantität
-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
-Bei der Approximation der Quantitätskurve zu einer geraden, wird versucht einen
-allgemein steigenden oder fallenden Trend eines Produktes zu erkennen.
-Hierbei wird davon ausgegangen, dass sich ein Produkt über eine größeren
-Zeitraum im mittelveränder.
-Anders als beim Mittelwertverfahren, welches von einer immer gleichbleibenden
-Grundabsatzmenge ausgeht, wird hier ein Trend mit bedacht.
-
-Der Verlauf der Quantität über die Trainingsdaten wird linear angenähert und
-für den die Vorhersage benutzt.
-
-Das Ergebniss dieses Verfahrens lieferte für einige Produkte z. B. dem Ersten
-eine etwas besseres Ergebniss als der Reine Mittelwert.
-Für andere allerdings einen viel zu steilen Anstieg, der ziemlich große
-Fehlerwerte verussachte.
-
-TODO: Fehlerwerte noch mal bestimmen!
-
Lineare-Regression Preis -> Quantität
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Angenommen wurde, dass ein direkter Zusammenhang, zwischen dem Preis und der