高频数据规模巨大,一些低频数据所不适用的统计方法在高频数据分析中也能得到很好的发挥,如分析尾部数据。在高频数据分析中,分析师可以轻易地从海最的高频数据中分析出低频小概率事件。相对于基于基本面投资研究方法,高频投资分析更偏重对市场数据信息本体的分析,以数量模型为基础,将客观的模型信号作为投资分析对象。基于高频数据的模型能充分利用市场发布的信息,为投资者描述出全息的市场状况。
高频交易的分析方法和传统低频交易有很大的区别,高频交易更关注市场微观结构的研究,探索市场价格形成的原因和达到市场价格的交易撮合过程,挖掘稀薄的利润空间。在国际市场中,参与高频交易的交易者一般包括做市商、统计套利交易者、新闻事件冲击交易者等投资人。因为高频数据的分析方法和低频数据的分析方法有很多的不同点,所以高频交易的成交速度和冲击成本都是需要格外关注的。高频交易投资者需要找到手续费低廉、流动性活跃、交易对手合适的交易品种,降低下单时的市场冲击,扩大自身的利润。在高频交易中,如果需要大资金量的投资,都需要把大单拆成小单分批入市。最初始的高频交易算法是基于时间权重(TWAP )和交易最或持仓量权重(VWAP)开发。基于时间权重开发的程序通常下单之前定义好已经拆分的小单,按照等间距时间的顺序投入市场。基于成交量开发的交易策略通常根据历史成交量形成的规律来测算交易目标在短期内的价格变动。
随着高频交易的发展,以及计算机运算速度的加快,研发重点放在了当前获取的市场价格和下单到达交易系统时价格的变化计算。交易策略把冲击影响放到了更为重要的考虑地位。为了对抗冲击,算法预定义的执行计划基于历史数据分析,并且把整个的交易单切分得对市场冲击越小越好。和上面TWAP、VWAP两种交易相比,这种方法的交易单更散,并且整个下单的时间更长。当对高频交易的研究越来越精细化的时候,基于历史数据的预设下单方案渐渐被跟随市场条件自动重算下单量和下单时间计划的方法所取代。
更进一步的高频交易开始捕捉市场以外的数据。新闻量化交易开始进入高频市场,在刚刚发布最新新闻的时刻,立刻下单入市,获取新闻或其他消息对市场影响导致波动的利润。新闻量化交易非常复杂,新闻发布时往往除了有数据信息外,还有文字信息,需要快速侦听新闻或搜索新闻,计算机快速地进行自然语言理解和数据分析,根据事先建立的数据库,比对并分析出新发新闻对市场的影响方向和影响幅度,然后形成下单指令。
高频交易的方法不拘一格,甚至各种设计思路完全背离的方法都可以在高频市场上有所斩获。因为高频交易仅仅是一个时间尺度上对交易策略的分类度量,而不是交易策略本身的定义。研发新的高频交易应该从研发策略的角度入手,当新的策略交易需要在高频的条件下达到更好的赢利点的时候,就自然成为高频交易策略,所以高频交易是策略被成功研发的结果,既不是策略研发的起点也不是策略研发的终极目标,而是一个成功策略水到渠成的外在表现形式,但是高频交易策略有一些自身的特性,投资者可以围绕这些特性开发,有一些投资者利用基于Alpha的微观价格作为自己策略的买入卖出的价格参照,这些Alpha可以从趋势跟踪、均值回复、配对交易或其他预测策略里面推导出来,作为自己进入市场交易的参照。
交易速度是高频交易争夺的重要领域。进入高频交易领域的投资者需要格外地小心,犹如一条鱼进入已经充满鲨鱼的池子,新进的投资者想在这池子里猎食,但也许正成为已经在池子里的鲨鱼的猎物,速度优势可以逃脱追杀者,速度优势可以帮助捕捉猎物。一个有效的高频交易策略具有活力的生命周期和高频交易的持仓一样短暂。失去活力的策略会变成衰老的鲨鱼,被其他年轻的对手绞杀。高频交易的策略竞争如此激烈,虽然有ORC、RTS、Actant之类可以帮助实现交易,但是更多的进入这个领域的投资者都是自己开发的系统。在高频交易系统的开发中,计算机算法的速度、网络速度、本机或托管服务器和交易所之间的实地距离都是考虑的范围之列。
当前中国的3个商品期货交易所和1个金融期货交易所都提供市场行情数据直接获取。以上海期货交易所为例,某期货公司上海本地提供的专线到达交易所机房前置的时间约为25~35ms。上海期货交易所的交易机房设置在期货交易所大厦和张江机房,如果租用期货公司在张江机房的托管服务器,网络延时可以进一步缩短。提供交易所接入的前置最主要的服务商包括上期技术、恒生和金仕达。从交易所报单前置到交易所撮合交易系统时间极短,并且不为投资者所控制,在活跃合约报单到达报单前置,经过交易所撮合成交,返回成交信息到报单前置一般延时在60~90ms。交易所每500ms发布一次市场价格信息。
高性能的数据库在量化交易中起到中心作用。从市场数据获取到下单完成,高性能的数据库提供了数据仓库、数据挖掘的应用、事件驱动分析等工作的保障。存储时间序列的数据库和常规的关系数据库并不完全一致,更期望使用列存储的内存数据库。无论是历史数据还是实时数据,在速度上都有很大的提升。