From bba67510d55c6177de8bd625e9a9bd9be1a6ced3 Mon Sep 17 00:00:00 2001 From: Benjamin Franzke Date: Fri, 18 May 2012 23:36:24 +0200 Subject: doc: Fix linear regression with pre-filter --- doc/document.asciidoc | 33 +++++++++++++++++---------------- 1 file changed, 17 insertions(+), 16 deletions(-) (limited to 'doc/document.asciidoc') diff --git a/doc/document.asciidoc b/doc/document.asciidoc index 23ef02e..0546e1b 100644 --- a/doc/document.asciidoc +++ b/doc/document.asciidoc @@ -146,6 +146,7 @@ aus. Daher kann das Verhalten der Siebentagesschwankung nicht alleine Auschlaggebend für den Absatz eines Produktes sein. +[[anchor-regress]] Lineare-Regression Preis -> Quantität ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Angenommen wurde, dass ein direkter Zusammenhang, zwischen dem Preis und der @@ -161,13 +162,17 @@ Fehlerwert stieg jedoch. Die Benutzung einer zusätzlichen logarithmischen Vorverarbeitung latexmath:[quantity = f(log(price))] führte zu dem Kleinsten für reine Regressions-Verfahren erzielten Fehlerwert. -Lineare-Regresion (special) -~~~~~~~~~~~~~~~~~~~~~~~~~~~ +<<< +Lineare-Regression mit Vorfilterung von Frequenzen +~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Am Produkt Nr. 335 kann man examplarisch sehr gut erkennen, dass der Absatz von den beiden Einflussgrößen Siebentage-Schwankung sowie der Preisänderung abhängt. Mit diesem Verfahren wird versucht beide Einflussgrößen bei der Vorhersage zu beachten. +Die Grundidee besteht darin eine Vorverarbeitung der Testdaten vorzunehmen, +um dann ein besseres funktionales Verhältnis zwischen Preis und Quantität +errechnen zu können. Dabei wurde zunächst eine Fourie-Analyse der Kurve der Absatzsumme aller Produkte über die 42 Tage der Vorhersagemenge durchführt, um die Frequenzen @@ -176,20 +181,16 @@ Es wurden jeweils einzelne Frequenzbereiche entfernt und bei der Rücktransformation ein Digramm erwartet, welches einer linearen Preiszuordnung unterliegt. -... - -Die so ermittelten Frequenzen wurden dann nach der normalen Preis -> Quantitäts -approxiamtion wieder hinzu genommen. - - -Grundidee: -- herrausrechnen der 7-Tage-Einbruche aus den Trainingsdaten für die Regression - und eine Approximation für reinen Preis->Quantitäts-Zusammenhang. -- 7-Tage-Einbrüche hinein rechnen. - -Der Absatz eines Produktes setzt sich aus verschiedenen Einflussfaktoren -zusammen. -Zum eine die Wochen- und die Preisschwankung. +Der Algorithmus erstellt im weiteren für jedes Produkt eine +Fourier-Transformation, entfernt die zuvor empirisch ermittelten Frequenzen, +und führt eine inverse Fourier-Transformation durch. +Dann wird die im xref:anchor-regress[] beschriebene Regression auf +den bereinigten Daten durchgeführt. +Nach der Anwendung des Regressions-Polynoms auf die Klassifikationsdaten, +werden die Siebentages-Frequenzen wieder addiert. +Dazu werden die temporären Vorhersagewerte einer Fourier-Transformation mit +anschließender Addition der Siebentages-Frequenzen und Rücktransformation +unterzogen. Zufallsverfahren ~~~~~~~~~~~~~~~~ -- cgit