国产午夜精品一区二区,色综合久久精品亚洲国产,国产精品亚洲lv粉色,少妇伦子伦精品无码STYLES

當前位置:首頁 > 最新資訊 > 行業資訊

時序分析中的常用算法,都在這里了

時序分析就是利用過去一段時間內某事件時間的特征來預測未來一段時間內該事件的特征。這是一類相對比較復雜的預測建模問題,和回歸分析模型的預測不同,時間序列模型是依賴于事件發生的先后順序的,同樣大小的值改變順序后輸入模型產生的結果是不同的。

時序分析中的常用算法,都在這里了

時序問題都看成是回歸問題,只是回歸的方式(線性回歸、樹模型、深度學習等)有一定的區別。

時序分析包括靜態時序分析(STA)和動態時序分析。

以下為幾種常見的時序分析算法

1 深度學習時序分析

RNN(循環神經網絡)

循環神經網絡是指一個隨著時間的推移,重復發生的結構。在自然語言處理(NLP),語音圖像等多個領域均有非常廣泛的應用。RNN網絡和其他網絡最大的不同就在于RNN能夠實現某種“記憶功能”,是進行時間序列分析時最好的選擇。如同人類能夠憑借自己過往的記憶更好地認識這個世界一樣。RNN也實現了類似于人腦的這一機制,對所處理過的信息留存有一定的記憶,而不像其他類型的神經網絡并不能對處理過的信息留存記憶。

優點:

具有時間記憶功能,適用于解決時間序列中間隔較短的問題;

缺點:

對較遠時間步的數據易產生梯度消失、梯度爆炸的問題;

LSTM(長短時記憶網絡)

長短時記憶網絡(LSTM,Long Short-Term Memory)是一種時間循環神經網絡,是為了解決一般的RNN(循環神經網絡)存在的長期依賴問題而專門設計出來的,所有的RNN都具有一種重復神經網絡模塊的鏈式形式。

優點:

適合于處理和預測時間序列中間隔和延遲非常長的重要事件。

缺點:

參數量過大、易產生過擬合的問題。

2 傳統的時序分析模型

自回歸(Auto Regression, AR)

移動平均線(Moving Average, MA)

自回歸移動平均線(Autoregressive Moving Average, ARMA)

自回歸綜合移動平均線(Autoregressive Integrated Moving Average, ARIMA)

季節性自回歸整合移動平均線(Seasonal Autoregressive Integrated Moving Average, SARIMA)

具有外生回歸量的季節性自回歸整合移動平均線(Seasonal Autoregressive Integrated Moving-Average with Exogenous Regressors, SARIMAX)

自回歸模型 AR

自回歸模型(Autoregressive Model,簡稱 AR 模型)是一種時間序列分析方法,用于描述一個時間序列變量與其過去值之間的關系。AR模型假設當前觀測值與過去的觀測值之間存在線性關系,通過使用過去的觀測值來預測未來的觀測值。

優點:

簡單性:AR模型是一種線性模型,易于理解和實現。它僅使用過去的觀測值作為自變量,沒有其他復雜的因素需要考慮。

建模能力:AR模型可以捕捉時間序列數據的自相關結構,即當前觀測值與過去觀測值之間的關系。它能夠提供對未來觀測值的預測,并揭示數據中的趨勢和模式。

缺點:

只適用于平穩序列:AR模型要求時間序列是平穩的,即均值、方差和自相關不隨時間變化。如果序列不平穩,可能需要進行差分操作或使用其他模型來處理非平穩性。

對過去觀測值敏感:AR模型的預測結果受到過去觀測值的影響,因此在處理長期預測時可能會出現誤差累積的問題。較大的階數可能會導致模型過擬合,而較小的階數可能無法捕捉到時間序列的復雜動態。

無法處理季節性數據:AR模型無法直接處理具有明顯季節性的時間序列。對于具有季節性模式的數據,可以使用季節性AR模型(SAR)或ARIMA模型進行建模。

移動平均法(MA)

移動平均法(MA):該方法基于數據的平均數,并假設未來的值與過去的值之間具有一定的平穩性。

優點:

能夠捕捉到時間序列數據中的移動平均關系。MA模型利用過去時間步白噪聲誤差項的線性組合來預測當前觀測值,因此可以捕捉到數據中的移動平均性。

相對簡單和直觀。MA模型的參數表示過去時間步白噪聲誤差項的權重,可以通過估計這些權重來擬合模型。

缺點:

只能捕捉到移動平均關系,無法捕捉到自回歸關系。MA模型忽略了過去時間步觀測值,可能無法捕捉到數據中的自相關性。

對于某些時間序列數據,MA模型可能需要較高的階數才能較好地擬合數據,導致模型復雜度增加。

自回歸滑動平均模型

自回歸滑動平均模型(ARMA模型,Auto-Regression and Moving AverageModel)是研究時間序列的重要方法,由自回歸模型(AR模型)與滑動平均模型(MA模型)為基礎“混合”而成,具有適用范圍廣、預測誤差小的特點。

自回歸差分移動平均線(Autoregressive Integrated Moving Average, ARIMA)

ARIMA模型全稱為自回歸差分移動平均模型(Autoregressive Integrated Moving Average Model)。ARIMA模型主要由三部分構成,分別為自回歸模型(AR)、差分過程(I)和移動平均模型(MA)。

ARIMA模型的基本思想是利用數據本身的歷史信息來預測未來。一個時間點上的標簽值既受過去一段時間內的標簽值影響,也受過去一段時間內的偶然事件的影響,這就是說,ARIMA模型假設:標簽值是圍繞著時間的大趨勢而波動的,其中趨勢是受歷史標簽影響構成的,波動是受一段時間內的偶然事件影響構成的,且大趨勢本身不一定是穩定的

簡而言之,ARIMA模型就是試圖通過數據的自相關性和差分的方式,提取出隱藏在數據背后的時間序列模式,然后用這些模式來預測未來的數據。其中:

AR部分用于處理時間序列的自回歸部分,它考慮了過去若干時期的觀測值對當前值的影響。

I部分用于使非平穩時間序列達到平穩,通過一階或者二階等差分處理,消除了時間序列中的趨勢和季節性因素。

MA部分用于處理時間序列的移動平均部分,它考慮了過去的預測誤差對當前值的影響。

結合這三部分,ARIMA模型既可以捕捉到數據的趨勢變化,又可以處理那些有臨時、突發的變化或者噪聲較大的數據。所以,ARIMA模型在很多時間序列預測問題中都有很好的表現。

優點:

模型十分簡單,只需要內生變量而不需要借助其他外生變量。(所謂內生變量指的應該是僅依賴于該數據本身,而不像回歸需要其他變量)

缺點:

要求時序數據是穩定的(stationary),或者是通過差分化(differencing)后是穩定的。

本質上只能捕捉線性關系,而不能捕捉非線性關系。

季節性自回歸整合移動平均模型 SARIMA

SARIMA 是一種常用的時序分析方法,它是 ARIMA 模型在季節性數據上的擴展。SARIMA 模型可以用于預測季節性時間序列數據,例如每年的銷售額或每周的網站訪問量。下面是SARIMA模型的優缺點:

優點:

SARIMA模型可以很好地處理季節性數據,因為它考慮了時間序列數據中的季節性因素。

SARIMA模型可以對時間序列數據進行長期預測,因為它可以捕捉到數據中的趨勢和周期性變化。

SARIMA模型可以用于多變量時間序列數據,因為它可以同時考慮多個變量之間的關系。

缺點:

SARIMA模型需要大量的歷史數據來訓練,因此在數據量較少的情況下可能不太適用。

SARIMA模型對異常值比較敏感,因此需要對異常值進行處理。

SARIMA模型的計算復雜度較高,需要進行大量的計算和優化。

具有外生回歸量的季節性自回歸整合移動平均模型 SARIMAX

具有外生回歸量的季節性自回歸整合移動平均模型(Seasonal Autoregressive Integrated Moving-Average with Exogenous Regressors, SARIMAX)是在差分移動自回歸模型(ARIMA)的基礎上加上季節(S,Seasonal)和外部因素(X,eXogenous)。也就是說以ARIMA基礎加上周期性和季節性,適用于時間序列中帶有明顯周期性和季節性特征的數據。

3 其他時序模型

這類方法以 lightgbm、xgboost 為代表,一般就是把時序問題轉換為監督學習,通過特征工程和機器學習方法去預測;這種模型可以解決絕大多數的復雜的時序預測模型。支持復雜的數據建模,支持多變量協同回歸,支持非線性問題。

不過這種方法需要較為復雜的人工特征過程部分,特征工程需要一定的專業知識或者豐富的想象力。特征工程能力的高低往往決定了機器學習的上限,而機器學習方法只是盡可能的逼近這個上限。特征建立好之后,就可以直接套用樹模型算法 lightgbm/xgboost,這兩個模型是十分常見的快速成模方法,除此之外,他們還有以下特點:

計算速度快,模型精度高;

缺失值不需要處理,比較方便;

支持 category 變量;

支持特征交叉。

具體選擇哪種方法需要根據數據的性質、問題的特點以及自身的經驗和能力來綜合考量。

需要根據具體的數據特征、問題要求和自身的能力來選擇合適的時間序列預測方法。有時,結合多個方法可以提高預測的準確性和穩定性。同時,為了更好地選擇模型和評估預測結果,對數據進行可視化分析和模型診斷也是很重要的。

猜你喜歡