什麼是自回歸綜合移動平均線 (ARIMA)?
自回歸積分移動平均線 (ARIMA) 是一種統計分析模型,它使用 時間序列數據來更好地理解數據集或預測未來趨勢。
如果統計模型根據過去的值預測未來值,則該模型是自回歸的。
要點
- 自回歸綜合移動平均(ARIMA)模型根據過去的值預測未來的值。
- ARIMA 利用滯後移動平均線來平滑時間序列數據。
- 它們廣泛用於技術分析以預測未來的證券價格。
- 自回歸模型隱含地假設未來將與過去相似。
- 因此,在某些市場條件下,例如金融危機或技術快速變革時期,它們可能被證明是不准確的。
了解自回歸綜合移動平均線 (ARIMA)
自回歸積分移動平均模型是 回歸分析的一種形式,用於衡量一個因變量相對於其他變化變量的實際值的強度。
可以通過如下概述其每個組件來理解 ARIMA 模型:
- 自回歸(AR):是指顯示變化變量的模型,該變量根據其自身的滯後值或先驗值進行回歸。
- 積分(I):表示原始觀測值的差分,使時間序列變得平穩(即數據值被數據值與之前值之間的差異所取代)。
- 移動平均 (MA): 結合了觀測值與應用於滯後觀測值的移動平均模型的殘差之間的依賴性。
ARIMA 參數
ARIMA 中的每個組件都充當具有標準符號的參數。對於 ARIMA 模型,標準符號是帶有 p、d 和 q 的 ARIMA,其中整數值替代參數以指示所使用的 ARIMA 模型的類型。定義為:
- p:模型中滯後觀測值的數量,也稱為滯後階數。
- d:原始觀測值被區分的次數;也稱為差異度。
- q:移動平均窗口的大小,也稱為移動平均階數。
例如,線性回歸模型包括項的數量和類型。零 (0) 值可用作參數,這意味著模型中不應使用特定組件。這樣,ARIMA 模型可以被構造來執行ARMA 模型,甚至簡單的AR、 I 或MA 模型的功能。
由於 ARIMA 模型很複雜並且在非常大的數據集上效果最好,因此使用計算機算法和機器學習技術來計算它們。
ARIMA 和固定數據
在自回歸綜合移動平均模型中,對數據進行差分以使其平穩。顯示平穩性的模型是表明數據隨時間變化的穩定性的模型。大多數經濟和市場數據都顯示趨勢,因此差分的目的是消除任何趨勢或季節性結構。
季節性,或者當數據顯示在一個日曆年中重複的規律且可預測的模式時,可能會對回歸模型產生負面影響。
一次性衝擊將無限地影響 ARIMA 模型的後續值。因此,金融危機的遺產仍然存在於今天的自回歸模型中。
如何構建 ARIMA 模型
要開始為投資構建 ARIMA 模型,您需要下載盡可能多的價格數據。確定數據的趨勢後,您可以通過觀察自相關來確定差分的最低階 (d)。 1 自相關為零或負數,序列已經微分。如果lag-1 大於零,您可能需要對序列進行更多微分。1
接下來,通過比較自相關和偏自相關來確定回歸階數 (p) 和移動平均階數 (q)。獲得所需信息後,您可以選擇要使用的模型。
ARIMA 的優點和缺點
ARIMA 模型有其優點,並且擅長根據過去的情況進行預測,但在使用ARIMA 時有更多理由要謹慎。與“過去的表現並不代表未來表現的指標……”的投資免責聲明形成鮮明對比, ARIMA模型假設過去的值對當前或未來的值有一些殘餘影響,並使用過去的數據來預測未來的事件。
下表列出了展示好特性和壞特性的其他 ARIMA 特徵。
-
有利於短期預測
-
只需要歷史數據
-
對非平穩數據建模
-
不適用於長期預測
-
不善於預測轉折點
-
計算成本昂貴
-
參數是主觀的
ARIMA 有何用途?
ARIMA 是一種基於歷史時間序列預測或預測未來結果的方法。
自回歸模型和移動平均模型有什麼區別?
ARIMA 將自回歸特徵與移動平均線相結合。例如,AR(1) 自回歸過程是當前值基於前一值的過程,而 AR(2) 過程是當前值基於前一值的過程基於前兩個值。移動平均值是一種用於分析數據點的計算,通過創建完整數據集的不同子集的一系列平均值來平滑異常值的影響。ARIMA 模型可以考慮趨勢、週期、季節性和其他非靜態類型的數據進行預測時。
ARIMA 預測如何運作?
ARIMA 預測是通過插入感興趣變量的時間序列數據來實現的。統計軟件將識別要應用於數據的適當滯後數或差異量並檢查平穩性。然後輸出結果,這些結果通常是解釋與多元線性回歸模型類似。
底線
ARIMA 模型用作預測工具,根據過去的表現來預測未來的行為。
ARIMA 建模通常不足以進行長期預測,例如未來六個月以上的預測,因為它使用受人類思維影響的過去數據和參數。