平稳性检验方法的有效性研究


 ——针对客观类平稳性检验方法进行分析,从时间序列的样本长度视角探讨检验方法的实际性能,ADF 检验和PP 检验是相对较好的判定方法,在仿真实验中呈现较好的性能

简介

定义

时间序列是一类典型的随机数据,基于随机变量的历史和现状来推测其未来需要假设随机变量的历史和现状具有代表性或可延续性,样本时间序列展现了随机变量的历史和现状。如果随机变量基本性态维持不变,则要求样本数据( 时间序列) 的本质特征仍能延续到未来; 统计量( 均值、方差、协方差)的取值在未来仍能保持不变,则样本时间序列具有平稳性

通常随着时间t 取值变动,时间序列的期望值、方差和延迟k 阶自协方差的绝对取值一般是变动的,时间序列平稳性特征将判定为非平稳

方法

实践中时间序列平稳性的检验,大都是从时间序列样本数据取值的角度来分析一些统计量特征,其本质是得到一个平稳性检验的“近似结果”。现有的时间序列数据平稳性检验方法较多,主要包括主观检验方法( 如自相关函数图) 和客观检验方法( 如单位根检验) 两类方法。

刘田的研究采用单位根,并针对AR 系列模型展开,本文从样本长度的视角展开,对AR( Auto-Regression) 系列、MA( Moving Average) 系列、ARMA( Auto-Regressive and Moving Average) 系列和ARIMA( Autoregressive Integrated Moving Average) 系列四种模型展开分析,并采用ADF 检验( AugmentedDickey-Fuller test) 、PP 检验( Phillips-Perron test) 、KPSS 检验( Kwiatkowski-Phillips-Schmidt-Shin test) 、LMC 检验( Leybourne-McCabe stationarity test) 四种方法展开实证,分析这些平稳性检验方法的实际性能。

实验影响因素

从平稳性定义和“近似检验”的分析可知,样本长度将会对检验方法的效果造成明显的影响。刘田[2]探讨了单位根检验中的样本长度问题,发现单位根检验在分析低维度样本数据时,其实际效果偏差。因此,实证中所采集的数据样本长度太短,则其得到的平稳性分析结果显得不可靠,然而,在实际应用中,仍有大量学者在实证分析时所采集的时间序列样本长度较短。,因此,其检验结果和后续分析值得怀疑。

研究必要性/意义

平稳性分析是不同领域的时间序列数据建模的共性问题,时间序列平稳是经典回归分析赖以实施的基本假设。如果数据非平稳,则作为大样本下统计推断基础的“一致性”要求便被破坏,基于非平稳时间序列的预测也就失效。因此,平稳性检验是时间序列分析的一个关键问题



一平稳性检验方法及性能评价

如何有效地判定时间序列的平稳性,最基本的方法就是平稳性检验。现有方法主要包括主观检验方法和客观检验方法,具体如下:

主观检验方法的典型方式是借助图形判断时间序列的平稳性特征。比如,时间路径图法可以绘制出时间序列的散点图,然后观察散点是否围绕其均值上下波动,如果是,则判断序列为平稳的,否则,判断为非平稳的[5],该方法受判断者的主观意识影响比较大。其次,时间序列相关函数图为平稳性判定提供了一个有效的途径,这包括自相关函数图、偏自相关函数图和逆自相关函数图。对给定的时间序列数据样本,若其自相关函数序列迅速收敛到0,则判定为平稳的,反之,则判定为非平稳的。偏自相关函数图和逆自相关函数图的应用与自相关函数图相似,这些方法对序列收敛状态的判断带有一定的主观性,因此都属于主观类检验方法。

缺点:1.对大批量的时间序列数据,工作量大2.主观判定结果因人而异,难以得到一致的结果,因此,实际应用中,这些主观方法常用于对平稳性特征的粗略判定。

客观检验方法的典型代表是单位根检验。单位根检验( Dickey-Fuller test,DF 检验) 是平稳性检验中常用到的一种方法。ADF 检验是一种扩充的DF 检验,可以解决DF 检验中对随机项误差白噪声假设的问题。DF 单位根检验和ADF 单位根检验是通过建立时间序列的自回归方程,引入滞后算子构建特征方程,根据其特征根的绝对值来判断序列的平稳性,其准确性主要受到自回归方程精确性的影响,实践中只能从统计建模角度给出一个最优的模型。此外,PP 检验、KPSS 检验[17-18]、LMC 检验等检验方法也得到了广泛的研究和应用,这些方法都沿用了统计分布的检验方式。国内外学者的相关研究极大地丰富了时间序列平稳性检验的理论和应用研究。

缺点:借助统计分布临界表的平稳性判定方式,本质上是给出统计意义上的近似结果。尽管客观检验方法已经成为平稳性检验研究的主流方法,然而这些方法检验统计量的统计分布通常假设样本长度趋于无穷大,而现实中所采集到的时间序列往往很难满足这样的要求。仍要对客观检验方法的性能进行统计分析,实证表明其准确率仍不够理想。


二.实验

方法:ADF 检验、PP 检验、KPSS 检验、LMC检验

样本:本文特生成6 组非平稳时间序列数据和6 组平稳时间序列数据进行实验分析

et为服从标准正态分布的伪随机函数。模拟实验数据的时间长度分别取50、100、150、200、250、500 六种长度,每次模拟分别产生1000 个时间序列数据样本。因此,对每一种长度,都产生12000个时间序列数据样本,对六种长度,一共产生72000个时间序列数据样本


三.实验结果分析

采用Matlab 软件进行分析

1) 对6 组非平稳时间序列数据样本而言,两种检验方法的效果表现很好,检验准确率都达到了90%以上,并且效果较为稳定,受时间长度与模型参数影响不大; ( 2) 对6 组平稳时间序列数据样本而言,两种检验方法的实际准确率有较大的波动,受具体模型的影响明显( 3) 计算12 组模型的检验准确率的均值可知,ADF检验效果受时间序列样本长度的影响显著,样本长度越大,则检验准确率越高。

从表4 中可以看出: ( 1) 对6 组非平稳时间序列数据样本而言,KPSS 检验的结果比较理想,无论样本长度取值大小,其检验准确率都超过了95%;( 2) 但对6 组平稳时间序列数据而言,KPSS 检验准确率有很大的波动; 对S1、S2 和S5 三组模拟数据的检验准确率极差,无论样本长度取值大小,其检验准确率都低于10%; 对S3、S4 和S6 三组模拟数据的检验准确率不太理想,其检验准确率位于[58. 4%,76. 3%]的区间,且受样本长度的影响较小; ( 3) 计算12 组模型的检验准确率的均值可知,KPSS 检验效果受时间序列样本长度的影响不太明显,随着样本长度的增大,其检验准确率没有明显的提高。

1) 对6 组非平稳时间序 列数据而言,LMC 检验准确率有很大的波动; 检测 准确率受模型参数影响很大,NS1、NS2 和NS3 模型 的准确率相对较高,而NS4、NS5 和NS6 模型的准确 率相对较低,且随时间长度的增加,6 个模型的检验 准确率有明显的波动; ( 2) 对6 组平稳时间序列数 据而言,LMC 检验准确率也有很大的波动; 检测准 确率受模型参数影响很大,NS1 和NS5 模型的准确 率相对较低,而NS2、NS3、NS4 和NS6 模型的准确 率相对较高; 且随时间长度的增加,检验准确率有明 显的波动;3) 计算12 组模型的检验准确率的均值 可知,LMC 检验效果受时间序列样本长度的影响不 太明显,随着样本长度的增大,其检验准确率没有明 显的提高

仿真实验的检验错误分析

从表3-表5 可知,无论是平稳模拟数据还是非平稳模拟数据,四种方法都存在一定概率的检验错误。如果将单位根误判为平稳过程定义为第一类错误,将平稳过程误判为单位根过程定义为第二类错误。针对各种样本长度,首先计算出四种检验方法的第一类错误的均值,绘制曲线图,如图1( a) 所示然后,计算出四种检验方法的第二类错误的均值,绘制曲线图,如图1( b) 所示; 其中,ADF 检验和PP 检验两种方法的错误率曲线是重合的。

由图1 可知: ( 1) LMC 检验方法的第一类错误率较高,这表明该检验方法有很大概率将非平稳时间序列判定为平稳时间序列,而ADF 检验、PP 检验和KPSS 检验三种方法的第一类错误率较低; (2)KPSS 检验和LMC 检验方法的第二类错误率较高,这表明该检验方法有很大概率将平稳时间序列判定为非平稳时间序列,而ADF 检验和PP 检验两种方法的第一类错误率较低; ( 3) 在针对多个仿真模型的实证结果表明,ADF 检验和PP 检验的检验性能比较理想。


四.结论

平稳性检验是时间序列分析中的一个重要研究内容。主观类平稳性检验方法的实际检验结果会受

到个人因素影响而呈现不一致的情况,因此往往用于对平稳性的粗略判定。客观类平稳性检验方法虽然可以给出统计意义上的唯一判定结果,然而这种基于统计分布的近似检验方式,其实际准确率值得深究。本文实证发现: 一方面,时间序列样本长度会对客观类检验方法造成影响,这一点与刘田的研究结论是一致的[2]; 另一方面,从两类错误分析来看,ADF 检验和PP 检验是相对较好的判定方法,在仿真实验中呈现较好的性能。然而,对某些模拟数据( 模型S1、S2 和S5) 的检验效果仍很不精确,而且当样本长度较小时,其检验准确率明显较低。综上分析,不可否认,时间序列平稳性检验研究仍然任重道远,采用现有的检验方法进行实践时,采集足够长时间的数据( 增加样本长度) 是提高检验结果可靠性的必要前提。实际采集到的样本长度是有限的,渐进分布检验方式的改进空间有限,新的检验方式值得探究。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,015评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,262评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,727评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,986评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,363评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,610评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,871评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,582评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,297评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,551评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,053评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,385评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,035评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,079评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,841评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,648评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,550评论 2 270

推荐阅读更多精彩内容

  • 以我能懒出花儿的性格,在为数不多的选择里,以就学校最近的原则,拿下了它。在庭园别墅区中,这个二层小楼有些格格不...
    孙牛牛阅读 387评论 0 0
  • 12月10号,全国有113.4万大学生参加国考,参加考试人数与计划录取比例为40:1,可以说千军万马抢过独...
    回归常识阅读 845评论 0 0
  • 也许 也许失去后才知道珍惜 也许 也许年龄大了才会感觉 也许 也许年轻气盛,还没有走出玩的时代 也许 也许没有伤痛...
    华清_45b5阅读 312评论 0 1
  • 获取服务端cookie 获取客户端cookie 客户端设置cookie 删除cookie cookie策略
    光明程辉阅读 1,116评论 0 1