量化投资:历史高频数据源
历史高频数据即指日内的数据,主要针对以小时、分钟或秒为釆集频率的数据。一般而言,金融市场上的信息会连续性影响证券价格的变化过程,离散模型必然会造成信息的丢失,数据频率越低,则信息丢失就越多。从以交易者角度研究金融市场的微观结构和运作规律的高频数据分析,必将对金融市场的计量建模、实证金融产生巨大的挑战和冲击,从而加速各个研究领域的融合。
金融高频数据模型是在金融高频数据的基础上建立起来的,用于反映金融高频数据某些特征的数学模型,根据其所研究的具体对象主要分为以下三个方面:①对市场微观结构分析的模型。②计量模型。③金融高频数据统计特征模型。其数据需求总的来说可分为分时、分笔数据,目前用于高频交易的品种主要有股票、商品期货和股指期货,本节将介绍相应的常用数据。
一、股票品种
(一)分笔高频数据
分笔高频数据表中包括分笔期间成交量、成交金额、价格升跌1、价格升跌2、卖价1~卖价5、卖量1~卖量5、买价1~买价5、买量1~买量5、最新成交价、最新成交金额等。
(二)分时高频数据
分时高频数据表主要包括分时内的开盘价、最高价、最低价、收盘价、成交量以及成交金额等内容。详细内容及其解释见附表69至附表70。
二、期货品种
同股票高频数据一样,期货的高频交易数据主要包括分笔高频数据、分时高频数据。
(一)商品期货
分笔高频数据包括申卖价1~申卖价5、申买价1~申买价5、申卖量1~申卖量5、申买量1~申买量5、最新价、最高价、最低价、瞬时成交量、持仓量、成交额、品种等部分。
(二)股指期货
分笔高频数据包括申卖价1~申卖价5、申买价1~申买价5、申卖量1~申卖量5、申买量1~申买量5、最新价、最高价、最低价、瞬时成交量、持仓量、连续合约代码、连续合约名称等部分。
分时高频数据包括期间开盘价、期间最高价、分时涨跌、分时涨跌幅、成交量、成交金额、连续合约代码、连续合约名称等。
具体的商品期货条目参见附表71至附表74。