之前看到一篇文章,变点理论CUSUM在量化交易中;列了一堆数据和公式,说结果不错。链接如下:
或者这个,就是整理版,有很详细的公式推导,不过代码写的不清不楚的,应该没写完。
花了些时间研究下:
原理描述:CUSUM控制图的设计思想是对信息加以累积,将过程的小偏移累加起来,达到放大的结果,从而提高检验小偏移的灵敏度。CUSUM作为一个统计量,其由来具有严格的数学推理,总的来说,是一个变点假设检验通过极大似然法推导得到的统计量。
具体推导不研究了,直接看具体引用
其实就是我之前文章说到那个那个对数收益率,形成一个对数收益率的近似正太分布。如上图,这里有一个上下允偏量k,这里设为k = 0.02, 先说上阈值, 那么时序队列里面,下一个时段的对数收益率大于0.02,yi则差值为正;如果差值累计yi的和Ci大于h,比如h为0.5。则触发向上趋势。
其实就是如果多次超过 允偏量收益率发生,或者一次非常大的收益率情况发生,使得c值大于h 就会触发向上趋势判断。如果只是偶尔一次大于 允偏量,那么下一次小于k (0.02)时候,差值为负值,和值Ci就变小了,这里Max的作用就是保证C为正,不会因为多次低于k值为负值。向下趋势判断也是同理。
代码如下,这里调用ta-lib库来计算均值和标准差,速度比起用numpy还快一些。用标准差做为 允偏量k;5倍标准差为h 阈值。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
|
# encoding: UTF-8 import numpy as np import pandas as pd import matplotlib.pyplot as plt import talib def detect_via_cusum_lg(ts, istart = 30 , threshold_times = 5 ): """ detect a time series using cusum algorithm :param ts: the time series to be detected :param istart: the data from index 0 to index istart will be used as cold startup data to train :param threshold_times: the times for setting threshold :return: """ S_h = 0 S_l = 0 S_list = np.zeros(istart) meanArray = talib.SMA(ts,timeperiod = istart) stdArray = talib.STDDEV(np.log(ts / meanArray),timeperiod = istart) for i in range (istart + 1 , len (ts) - 1 ): tslog = np.log(ts[i] / meanArray[i - 1 ]) S_h_ = max ( 0 , S_h + tslog - stdArray[i - 1 ]) S_l_ = min ( 0 , S_l + tslog + stdArray[i - 1 ]) if S_h_> threshold_times * stdArray[i - 1 ]: S_list = np.append(S_list, 1 ) S_h_ = 0 elif abs (S_l_)> threshold_times * stdArray[i - 1 ]: S_list = np.append(S_list, - 1 ) S_l_ = 0 else : S_list = np.append(S_list, 0 ) S_h = S_h_ S_l = S_l_ return S_list #数据导入 df5min = pd.read_csv( "bar5rb8888.csv" ) dt0 = np.array(df5min[ "close" ]) listup,listdown = [],[] s_list = detect_via_cusum_lg(dt0,istart = 30 , threshold_times = 5 ) for i in range ( 0 , len (s_list)): if s_list[i] = = 1 : listup.append(i) elif s_list[i] = = - 1 : listdown.append(i) plt.subplot( 2 , 1 , 1 ) plt.plot(dt0, color = ‘y‘ , lw = 2. ) plt.plot(dt0, ‘^‘ , markersize = 5 , color = ‘r‘ , label = ‘UP signal‘ , markevery = listup) plt.plot(dt0, ‘v‘ , markersize = 5 , color = ‘g‘ , label = ‘DOWN signal‘ , markevery = listdown) plt.legend() plt.subplot( 2 , 1 , 2 ) plt.title( ‘s_list‘ ) plt.plot(s_list, ‘r-‘ ) plt.show() |
用5分钟螺纹钢数据跑出来,部分如下,好像有搞头。代码在我Github里面可以找到
原文:https://www.cnblogs.com/chenguopa/p/15240064.html