From 889d74513baa9f2623edd029f42c10fbb63a9551 Mon Sep 17 00:00:00 2001 From: Jan Klemkow Date: Fri, 18 May 2012 22:48:16 +0200 Subject: doc: Describe Datenvorbetrachtung. --- doc/document.asciidoc | 49 ++++++++++++++++++++++++++++++------------------- 1 file changed, 30 insertions(+), 19 deletions(-) (limited to 'doc') diff --git a/doc/document.asciidoc b/doc/document.asciidoc index 559c13f..de3fc48 100644 --- a/doc/document.asciidoc +++ b/doc/document.asciidoc @@ -54,6 +54,36 @@ price_{day56,product1} & price_{day56,product2} & \cdots & price_{day56,product5 \] ++++++++++++++++++++++++++++++++++++++++++++ +Vorbetrachtung der Daten +------------------------ +Zu Beginn des Datamining-Cups wurden die Daten mit verschieden Diagrammen +visualisiert um erste Eindruecke und Ideen zu gewinnen. +Dabei fand ein Brainstorming statt, bei dem Folgende Ideen entstanden sind. + +Zeitintervalle +~~~~~~~~~~~~~~ +Dabei wurde die Summe aller Verkaeuft ueber einen Tag fuer alle 42 Tage +abgetragen. +Die sich daraus ergebene Kurve gab den inspiration fuer das Sevenday-Verfahren. +Da deutlich wurde, das der Absatz sich periodisch schwank. + +Mittelwert und Lineare-Approximation +~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ +Bei der Approximation der Quantitätskurve zu einer geraden, wird versucht einen +allgemein steigenden oder fallenden Trend eines Produktes zu erkennen. +Hierbei wird davon ausgegangen, dass sich ein Produkt über eine größeren +Zeitraum im mittelveränder. +Anders als beim Mittelwertverfahren, welches von einer immer gleichbleibenden +Grundabsatzmenge ausgeht, wird hier ein Trend mit bedacht. + +Der Verlauf der Quantität über die Trainingsdaten wird linear angenähert und +für den die Vorhersage benutzt. + +Das Ergebniss dieses Verfahrens lieferte für einige Produkte z. B. dem Ersten +eine etwas besseres Ergebniss als der Reine Mittelwert. +Für andere allerdings einen viel zu steilen Anstieg, der ziemlich große +Fehlerwerte verussachte. + Verfahren zur Vorhersage ------------------------ @@ -103,25 +133,6 @@ aus. Daher kann das Verhalten der Siebentagesschwankung nicht alleine Auschlaggebend für den Absatz eines Produktes sein. -Lineare-Approximation Zeit -> Quantität -~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ -Bei der Approximation der Quantitätskurve zu einer geraden, wird versucht einen -allgemein steigenden oder fallenden Trend eines Produktes zu erkennen. -Hierbei wird davon ausgegangen, dass sich ein Produkt über eine größeren -Zeitraum im mittelveränder. -Anders als beim Mittelwertverfahren, welches von einer immer gleichbleibenden -Grundabsatzmenge ausgeht, wird hier ein Trend mit bedacht. - -Der Verlauf der Quantität über die Trainingsdaten wird linear angenähert und -für den die Vorhersage benutzt. - -Das Ergebniss dieses Verfahrens lieferte für einige Produkte z. B. dem Ersten -eine etwas besseres Ergebniss als der Reine Mittelwert. -Für andere allerdings einen viel zu steilen Anstieg, der ziemlich große -Fehlerwerte verussachte. - -TODO: Fehlerwerte noch mal bestimmen! - Lineare-Regression Preis -> Quantität ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Angenommen wurde, dass ein direkter Zusammenhang, zwischen dem Preis und der -- cgit