summaryrefslogtreecommitdiff
path: root/doc/document.asciidoc
diff options
context:
space:
mode:
authorBenjamin Franzke <benjaminfranzke@googlemail.com>2012-05-18 23:36:24 +0200
committerBenjamin Franzke <benjaminfranzke@googlemail.com>2012-05-18 23:36:24 +0200
commitbba67510d55c6177de8bd625e9a9bd9be1a6ced3 (patch)
tree80ec40ec06361750ef1160b6f7351c146c1229e8 /doc/document.asciidoc
parentdbc358e83151eb9bd877b2730750a20f1ee7c90a (diff)
downloaddmc-bba67510d55c6177de8bd625e9a9bd9be1a6ced3.tar.gz
dmc-bba67510d55c6177de8bd625e9a9bd9be1a6ced3.tar.bz2
dmc-bba67510d55c6177de8bd625e9a9bd9be1a6ced3.zip
doc: Fix linear regression with pre-filter
Diffstat (limited to 'doc/document.asciidoc')
-rw-r--r--doc/document.asciidoc33
1 files changed, 17 insertions, 16 deletions
diff --git a/doc/document.asciidoc b/doc/document.asciidoc
index 23ef02e..0546e1b 100644
--- a/doc/document.asciidoc
+++ b/doc/document.asciidoc
@@ -146,6 +146,7 @@ aus.
Daher kann das Verhalten der Siebentagesschwankung nicht alleine Auschlaggebend
für den Absatz eines Produktes sein.
+[[anchor-regress]]
Lineare-Regression Preis -> Quantität
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Angenommen wurde, dass ein direkter Zusammenhang, zwischen dem Preis und der
@@ -161,13 +162,17 @@ Fehlerwert stieg jedoch. Die Benutzung einer zusätzlichen logarithmischen
Vorverarbeitung latexmath:[quantity = f(log(price))] führte zu dem Kleinsten für
reine Regressions-Verfahren erzielten Fehlerwert.
-Lineare-Regresion (special)
-~~~~~~~~~~~~~~~~~~~~~~~~~~~
+<<<
+Lineare-Regression mit Vorfilterung von Frequenzen
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Am Produkt Nr. 335 kann man examplarisch sehr gut erkennen, dass der Absatz
von den beiden Einflussgrößen Siebentage-Schwankung sowie der Preisänderung
abhängt.
Mit diesem Verfahren wird versucht beide Einflussgrößen bei der Vorhersage
zu beachten.
+Die Grundidee besteht darin eine Vorverarbeitung der Testdaten vorzunehmen,
+um dann ein besseres funktionales Verhältnis zwischen Preis und Quantität
+errechnen zu können.
Dabei wurde zunächst eine Fourie-Analyse der Kurve der Absatzsumme aller
Produkte über die 42 Tage der Vorhersagemenge durchführt, um die Frequenzen
@@ -176,20 +181,16 @@ Es wurden jeweils einzelne Frequenzbereiche entfernt und bei der
Rücktransformation ein Digramm erwartet, welches einer linearen Preiszuordnung
unterliegt.
-...
-
-Die so ermittelten Frequenzen wurden dann nach der normalen Preis -> Quantitäts
-approxiamtion wieder hinzu genommen.
-
-
-Grundidee:
-- herrausrechnen der 7-Tage-Einbruche aus den Trainingsdaten für die Regression
- und eine Approximation für reinen Preis->Quantitäts-Zusammenhang.
-- 7-Tage-Einbrüche hinein rechnen.
-
-Der Absatz eines Produktes setzt sich aus verschiedenen Einflussfaktoren
-zusammen.
-Zum eine die Wochen- und die Preisschwankung.
+Der Algorithmus erstellt im weiteren für jedes Produkt eine
+Fourier-Transformation, entfernt die zuvor empirisch ermittelten Frequenzen,
+und führt eine inverse Fourier-Transformation durch.
+Dann wird die im xref:anchor-regress[] beschriebene Regression auf
+den bereinigten Daten durchgeführt.
+Nach der Anwendung des Regressions-Polynoms auf die Klassifikationsdaten,
+werden die Siebentages-Frequenzen wieder addiert.
+Dazu werden die temporären Vorhersagewerte einer Fourier-Transformation mit
+anschließender Addition der Siebentages-Frequenzen und Rücktransformation
+unterzogen.
Zufallsverfahren
~~~~~~~~~~~~~~~~