跟踪中证1000 指数的指数型基金的规模有望大幅增长。历史上,中证1000 指数成分股的总成交额与中证500 指数成分股的总成交额十分接近,然而,从跟踪两个指数的基金的总规模而言,跟踪前者的远远低于跟踪后者的。我们预计跟踪中证1000 指数的基金的总规模有望大幅度增长。
本文测试了数百个因子在中证1000 指数成分股中的选股效果。通过测试,我们找到了一些比较有效的量价和财务类的单因子。
通过因子测试,我们总结了一些在统计上对股票收益率有益的特征。数值越高越好的特征包括:利润率、一致预期利润、市盈率、股息率、每股收益、营销额、市盈率、小户流出单数比例、现金余额增速。数值越低越好的特征包括:过去一段时间内的收益率标准差、机构主动卖出额比例、过去一段时间内的涨跌幅、总市值、近期的换手率、过去一段时间内最高价与最低价之比。
行业、市值中性化处理在一定程度上改善单因子的效果。我们测试了原始因子和市值、行业中性化的因子的效果。结果表明,市值、行业中性化的处理可以提高部分因子的表现。
通过对单因子进行非线性映射,可以改善单因子的效果。我们使用机器学习模型和历史数据拟合单因子与个股残差收益率之间的关系,再使用模型将单因子进行非线性映射,该映射同样可以改善单因子的效果。
用线性方法合成因子时,宜使用较长时间的历史数据。我们使用过去不同长度的时间段的历史数据进行线性回归,从而构造不同的线性模型。通常而言,使用更长时间的历史数据进行回归,更有利于构造效果更好的选股因子。
对于线性方法,本文比较了使用收益率和残差收益率作为数据标签的效果。我们使用股票收益率或者残差收益率作为数据标签,当使用较短的历史数据训练模型时,以收益率作为标签效果更好,当使用较长的历史数据训练模型时,以残差收益率作为标签效果更好。
风险提示:市场风格变化风险,模型失效风险,数据可用性风险
(文章来源:德邦证券)