diff options
author | Jan Klemkow <j.klemkow@wemelug.de> | 2012-05-18 22:48:16 +0200 |
---|---|---|
committer | Jan Klemkow <j.klemkow@wemelug.de> | 2012-05-18 22:48:55 +0200 |
commit | 889d74513baa9f2623edd029f42c10fbb63a9551 (patch) | |
tree | 57f41141c513ff2778143aa92ed82acd1a5dfb48 /doc | |
parent | 5db246dbea5420dad6eb96704dcd6cb8a5e4c90e (diff) | |
download | dmc-889d74513baa9f2623edd029f42c10fbb63a9551.tar.gz dmc-889d74513baa9f2623edd029f42c10fbb63a9551.tar.bz2 dmc-889d74513baa9f2623edd029f42c10fbb63a9551.zip |
doc: Describe Datenvorbetrachtung.
Diffstat (limited to 'doc')
-rw-r--r-- | doc/document.asciidoc | 49 |
1 files changed, 30 insertions, 19 deletions
diff --git a/doc/document.asciidoc b/doc/document.asciidoc index 559c13f..de3fc48 100644 --- a/doc/document.asciidoc +++ b/doc/document.asciidoc @@ -54,6 +54,36 @@ price_{day56,product1} & price_{day56,product2} & \cdots & price_{day56,product5 \] ++++++++++++++++++++++++++++++++++++++++++++ +Vorbetrachtung der Daten +------------------------ +Zu Beginn des Datamining-Cups wurden die Daten mit verschieden Diagrammen +visualisiert um erste Eindruecke und Ideen zu gewinnen. +Dabei fand ein Brainstorming statt, bei dem Folgende Ideen entstanden sind. + +Zeitintervalle +~~~~~~~~~~~~~~ +Dabei wurde die Summe aller Verkaeuft ueber einen Tag fuer alle 42 Tage +abgetragen. +Die sich daraus ergebene Kurve gab den inspiration fuer das Sevenday-Verfahren. +Da deutlich wurde, das der Absatz sich periodisch schwank. + +Mittelwert und Lineare-Approximation +~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ +Bei der Approximation der Quantitätskurve zu einer geraden, wird versucht einen +allgemein steigenden oder fallenden Trend eines Produktes zu erkennen. +Hierbei wird davon ausgegangen, dass sich ein Produkt über eine größeren +Zeitraum im mittelveränder. +Anders als beim Mittelwertverfahren, welches von einer immer gleichbleibenden +Grundabsatzmenge ausgeht, wird hier ein Trend mit bedacht. + +Der Verlauf der Quantität über die Trainingsdaten wird linear angenähert und +für den die Vorhersage benutzt. + +Das Ergebniss dieses Verfahrens lieferte für einige Produkte z. B. dem Ersten +eine etwas besseres Ergebniss als der Reine Mittelwert. +Für andere allerdings einen viel zu steilen Anstieg, der ziemlich große +Fehlerwerte verussachte. + Verfahren zur Vorhersage ------------------------ @@ -103,25 +133,6 @@ aus. Daher kann das Verhalten der Siebentagesschwankung nicht alleine Auschlaggebend für den Absatz eines Produktes sein. -Lineare-Approximation Zeit -> Quantität -~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ -Bei der Approximation der Quantitätskurve zu einer geraden, wird versucht einen -allgemein steigenden oder fallenden Trend eines Produktes zu erkennen. -Hierbei wird davon ausgegangen, dass sich ein Produkt über eine größeren -Zeitraum im mittelveränder. -Anders als beim Mittelwertverfahren, welches von einer immer gleichbleibenden -Grundabsatzmenge ausgeht, wird hier ein Trend mit bedacht. - -Der Verlauf der Quantität über die Trainingsdaten wird linear angenähert und -für den die Vorhersage benutzt. - -Das Ergebniss dieses Verfahrens lieferte für einige Produkte z. B. dem Ersten -eine etwas besseres Ergebniss als der Reine Mittelwert. -Für andere allerdings einen viel zu steilen Anstieg, der ziemlich große -Fehlerwerte verussachte. - -TODO: Fehlerwerte noch mal bestimmen! - Lineare-Regression Preis -> Quantität ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Angenommen wurde, dass ein direkter Zusammenhang, zwischen dem Preis und der |