如何用Python做輿情時(shí)間序列可視化?
盡管我們針對(duì)時(shí)間序列模型專(zhuān)門(mén)撰寫(xiě)了一系列大數(shù)據(jù)分析培訓(xùn)課程python時(shí)間序列預(yù)測(cè)SARIMAX模型教程文章,但我們尚未討論一個(gè)非常重要的主題-季節(jié)性。
到目前為止,我們檢查的每個(gè)模型-AR,MA,ARMA,ARIMA或ARIMAX都有季節(jié)性等效項(xiàng)。
您可能會(huì)猜到,這些對(duì)應(yīng)項(xiàng)的名稱(chēng)分別是SARMA,SARIMA和SARIMAX,其中“ S”代表季節(jié)性。
因此,模型的全名將是季節(jié)性自回歸綜合移動(dòng)平均外生模型。
我們都可以同意這是一個(gè)嘴,所以我們會(huì)堅(jiān)持使用縮寫(xiě)。
此外,SARMA和SARIMA可以看作是SARIMAX的簡(jiǎn)單案例,在這里我們不使用積分或外生變量,因此在大數(shù)據(jù)分析培訓(xùn)課程python時(shí)間序列預(yù)測(cè)SARIMAX模型教程中,我們將主要關(guān)注SARIMAX。
什么是季節(jié)性?
如果需要提示,當(dāng)某些模式不一致時(shí)會(huì)發(fā)生季節(jié)性變化,但會(huì)周期性出現(xiàn)。例如,每周查看YouTube搜索的圣誕節(jié)歌曲,例如“ Jingle Bells ”。
在每年的12月的節(jié)日期間,這種情況的發(fā)生頻率更高。但是,這些歌曲的播放次數(shù)通常在6月或7月要低得多。
因此,簡(jiǎn)單的自回歸組件不能很好地描述數(shù)據(jù)。
詳細(xì)地說(shuō),一個(gè)簡(jiǎn)單的AR組件會(huì)嚴(yán)重地低估基于11月(滯后1年)的統(tǒng)計(jì)數(shù)據(jù),圣誕節(jié)歌曲在12月播放的次數(shù)。同時(shí),它也將大大夸大1月份的數(shù)字,以12月份記錄的數(shù)值為基礎(chǔ),因?yàn)檫@種類(lèi)型通常在圣誕節(jié)后有所下降。
我們?nèi)绾翁幚砑竟?jié)性問(wèn)題?
為了說(shuō)明這種模式,我們需要將上一個(gè)節(jié)日期間記錄的值包括到模型中。在此特定示例中,這意味著要依賴(lài)于去年12月播放歌曲的次數(shù)。當(dāng)然,我們還可以包含兩個(gè)12月甚至更晚的數(shù)據(jù)。
有點(diǎn)像有另一個(gè)系列比我們最初的系列在時(shí)間上進(jìn)一步擴(kuò)展。回到音樂(lè)示例,原始時(shí)間序列包含相隔一個(gè)月的值,而季節(jié)性序列包含相隔12個(gè)月的值。
SARIMAX模型定義
現(xiàn)在我們已經(jīng)熟悉了季節(jié)性模型的一般概念,接下來(lái)讓我們看看我們使用的符號(hào)以及每個(gè)值的含義。與ARIMAX相比,SARIMAX需要另外4個(gè)訂單。
這聽(tīng)起來(lái)可能很多,但無(wú)需擔(dān)心!
這4個(gè)訂單中的前3個(gè)只是ARIMA訂單的季節(jié)性版本。
換句話說(shuō),我們有一個(gè)以大寫(xiě)字母P表示的季節(jié)性自回歸階,以大寫(xiě)字母D表示的季節(jié)性積分階和以大寫(xiě)Q表示的季節(jié)性移動(dòng)平均階。為便于區(qū)分,計(jì)量經(jīng)濟(jì)學(xué)家同意使用小寫(xiě)字母表示非季節(jié)性的字母。
第四個(gè)也是最后一個(gè)順序是循環(huán)的長(zhǎng)度。例如,如果我們有每小時(shí)的數(shù)據(jù),并且周期長(zhǎng)度為24,則季節(jié)性模式每24小時(shí)出現(xiàn)一次。
季節(jié)性模型的周期長(zhǎng)度是多少?
另一種思考的方式是“趨勢(shì)重新出現(xiàn)之前必須經(jīng)過(guò)的時(shí)間段數(shù)”。如果要檢查季節(jié)性趨勢(shì),則需要確保設(shè)置適當(dāng)?shù)闹芷陂L(zhǎng)度。我們用小寫(xiě)的“ s”表示最后一個(gè)訂單,因?yàn)樗O(shè)置了每個(gè)季節(jié)的時(shí)長(zhǎng)。
我們?nèi)绾谓忉尲竟?jié)性訂單?
讓我們快速解釋這四個(gè)新訂單如何協(xié)同工作。
本質(zhì)上,長(zhǎng)度“ s”表示季節(jié)要素與當(dāng)前期間的距離。因此,如果我們有一個(gè)季節(jié)順序?yàn)?2,0,1和5)的模型,那么我們將包括5、10個(gè)周期之前的滯后值以及5個(gè)周期之前的誤差項(xiàng)。大數(shù)據(jù)分析培訓(xùn)課程python時(shí)間序列預(yù)測(cè)SARIMAX模型教程https://www.aaa-cg.com.cn/data/2434.html每個(gè)周期為“ 5”個(gè)周期,我們采用2個(gè)滯后的季節(jié)性值。因此,我們僅包括5和10個(gè)周期前的值。同樣,我們添加了5個(gè)周期前的誤差項(xiàng)。
概括地說(shuō),我們對(duì)每個(gè)“ s”值都感興趣。我們從第“ s”個(gè)開(kāi)始,一直到“ s,乘以p”。季節(jié)性積分值和季節(jié)性誤差也是如此。
SARIMAX模型的方程是什么?
讓我們看看階(1,0,1)和季節(jié)性階(2,0,1,5)的SARIMAX模型的方程是什么樣的。
有趣的是,每個(gè)季節(jié)性要素還包含其他滯后值。如果要了解原因,可在此處找到SARIMAX模型背后數(shù)學(xué)的詳細(xì)說(shuō)明。
那么,從方程式中我們可以看到什么呢?我們估計(jì)的系數(shù)總數(shù)等于季節(jié)性和非季節(jié)性AR和MA訂單的總和。換句話說(shuō),我們正在查看“ P加Q,加p加q”的總數(shù)–許多系數(shù)。
非季節(jié)性的用小寫(xiě)的?和θ表示; 而其季節(jié)性對(duì)應(yīng)物分別用大寫(xiě)Φ和Θ表示。就像訂單一樣,大寫(xiě)字母表示季節(jié)性成分,小寫(xiě)字母表示非季節(jié)性成分。
因此,這是您需要的季節(jié)性模型的基本知識(shí)。但是,如果您想了解有關(guān)時(shí)間序列和時(shí)間序列數(shù)據(jù)的更多信息,請(qǐng)務(wù)必查看有關(guān)該主題的文章。
如果您不熟悉 Python,并且熱衷于了解更多信息,那么這篇有關(guān)學(xué)習(xí)Python編程的綜合文章將指導(dǎo)您從安裝到Python IDE,庫(kù)和框架,再到最佳Python職業(yè)發(fā)展道路,以及工作前景。
https://www.toutiao.com/i6849974616836964867/