diff options
author | Benjamin Franzke <benjaminfranzke@googlemail.com> | 2012-05-18 23:36:24 +0200 |
---|---|---|
committer | Benjamin Franzke <benjaminfranzke@googlemail.com> | 2012-05-18 23:36:24 +0200 |
commit | bba67510d55c6177de8bd625e9a9bd9be1a6ced3 (patch) | |
tree | 80ec40ec06361750ef1160b6f7351c146c1229e8 /doc | |
parent | dbc358e83151eb9bd877b2730750a20f1ee7c90a (diff) | |
download | dmc-bba67510d55c6177de8bd625e9a9bd9be1a6ced3.tar.gz dmc-bba67510d55c6177de8bd625e9a9bd9be1a6ced3.tar.bz2 dmc-bba67510d55c6177de8bd625e9a9bd9be1a6ced3.zip |
doc: Fix linear regression with pre-filter
Diffstat (limited to 'doc')
-rw-r--r-- | doc/document.asciidoc | 33 |
1 files changed, 17 insertions, 16 deletions
diff --git a/doc/document.asciidoc b/doc/document.asciidoc index 23ef02e..0546e1b 100644 --- a/doc/document.asciidoc +++ b/doc/document.asciidoc @@ -146,6 +146,7 @@ aus. Daher kann das Verhalten der Siebentagesschwankung nicht alleine Auschlaggebend für den Absatz eines Produktes sein. +[[anchor-regress]] Lineare-Regression Preis -> Quantität ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Angenommen wurde, dass ein direkter Zusammenhang, zwischen dem Preis und der @@ -161,13 +162,17 @@ Fehlerwert stieg jedoch. Die Benutzung einer zusätzlichen logarithmischen Vorverarbeitung latexmath:[quantity = f(log(price))] führte zu dem Kleinsten für reine Regressions-Verfahren erzielten Fehlerwert. -Lineare-Regresion (special) -~~~~~~~~~~~~~~~~~~~~~~~~~~~ +<<< +Lineare-Regression mit Vorfilterung von Frequenzen +~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Am Produkt Nr. 335 kann man examplarisch sehr gut erkennen, dass der Absatz von den beiden Einflussgrößen Siebentage-Schwankung sowie der Preisänderung abhängt. Mit diesem Verfahren wird versucht beide Einflussgrößen bei der Vorhersage zu beachten. +Die Grundidee besteht darin eine Vorverarbeitung der Testdaten vorzunehmen, +um dann ein besseres funktionales Verhältnis zwischen Preis und Quantität +errechnen zu können. Dabei wurde zunächst eine Fourie-Analyse der Kurve der Absatzsumme aller Produkte über die 42 Tage der Vorhersagemenge durchführt, um die Frequenzen @@ -176,20 +181,16 @@ Es wurden jeweils einzelne Frequenzbereiche entfernt und bei der Rücktransformation ein Digramm erwartet, welches einer linearen Preiszuordnung unterliegt. -... - -Die so ermittelten Frequenzen wurden dann nach der normalen Preis -> Quantitäts -approxiamtion wieder hinzu genommen. - - -Grundidee: -- herrausrechnen der 7-Tage-Einbruche aus den Trainingsdaten für die Regression - und eine Approximation für reinen Preis->Quantitäts-Zusammenhang. -- 7-Tage-Einbrüche hinein rechnen. - -Der Absatz eines Produktes setzt sich aus verschiedenen Einflussfaktoren -zusammen. -Zum eine die Wochen- und die Preisschwankung. +Der Algorithmus erstellt im weiteren für jedes Produkt eine +Fourier-Transformation, entfernt die zuvor empirisch ermittelten Frequenzen, +und führt eine inverse Fourier-Transformation durch. +Dann wird die im xref:anchor-regress[] beschriebene Regression auf +den bereinigten Daten durchgeführt. +Nach der Anwendung des Regressions-Polynoms auf die Klassifikationsdaten, +werden die Siebentages-Frequenzen wieder addiert. +Dazu werden die temporären Vorhersagewerte einer Fourier-Transformation mit +anschließender Addition der Siebentages-Frequenzen und Rücktransformation +unterzogen. Zufallsverfahren ~~~~~~~~~~~~~~~~ |