在获取量化alpha超额的路上,蒙玺投资选择了“另”辟蹊径。
在蒙玺投资看来,市场热捧的AI、非线性模型本质是Smart Beta,Pure Alpha应来自于逻辑性强、可解释性强的单因子。所以公司从全球200+数据源挖掘不同数据中的Alpha,在其多因子模型中,另类因子占比达到60%。在其看来,布局另类数据,是公司适应市场变化而采取的一种商业战略定力。
作为国内低延迟领域的先行者,在蒙玺投资看来,技术发展是非线性的,追求极致的同时,也在推进边界外扩,把不可能变为可能。对蒙玺投资而言,保持在这一细分赛道的差异化优势,是情怀也是图腾。
以下内容为华泰证券研究所金工量化投资首席研究员何康,对话上海蒙玺投资管理有限公司创始人&总经理李骧问答实录。
问:请您回顾2023年投资感受。
李骧:2023年是量化大年,行业在超额获取方面表现良好。我们公司风格暴露偏低,加上公司使用的另类数据表现较为稳健,同时覆盖各类创新性产品,加上稳定的超额获取,所以整体表现不错。
问:您认为AI模型更多是一种Smart Beta,是否2023年行情一定程度上印证了这一观点?
李骧:有些优秀模型或机构能自适应市值偏离度较大的情况,在2023年表现较为亮眼。
问:所以非线性模型本身并非Smart Beta,而是这个模型本质是否具备学习能力?
李骧:非线性模型本身并非Smart Beta,但通常具备Smart Beta的特点,即预测性强,能够天然挖掘出风格收益。有些风格可以被描述,例如市值,还有些风格无法描述,但本质是一种风格。有些模型预测周期偏长、适应性较慢,未来可能会有一定风险。
问:当前国内量化公司如何运用大模型?在量化行业未来应用前景如何?
李骧:目前主要在公司流程和效率提升维度,投研方面增益有限。我们尝试在数据和信息处理方面运用,但模型精度无法满足专业需求。未来在数据设计端也会有更多运用。我们时刻关注大模型发展。
问:这项技术确实是非线性的。
李骧:对技术永远要保持敬畏。
问:蒙玺投资在另类数据方面研究非常深入,其对超额收益贡献也较高,请您简要介绍另类数据。
李骧:我认为,另类数据更多是理念问题,而非能力或商业机密。
另类数据定义非常明确,就是除量价和基本面之外的数据。量价数据是指所有通过交易所推送的数据。基本面数据则是按照监管要求上市公司定期披露的财务数据,研究门槛和获取价格相对量价较高。
量价因子最先被获取、应用最为广泛,也最早失效。目前量价因子已出现一些衰竭迹象,AI或非线性模型的广泛运用延缓了这个趋势。
另类数据覆盖度有限,不同数据覆盖度存在差异性,获取比较困难。单个另类数据获取超额较低,但其逻辑非常朴素。
问:数据的获取成本、门槛与其稳定性、衰减速率是否成反比?单个另类因子收益不高,所以研究另类数据需要不断积累,从量变到质变?
李骧:我个人比较认同这个观点,人工智能与另类数据这两类方法论,给大家的感受度不完全相同。
我相信很多机构都具备研究另类数据的能力。但由于数据获取门槛和研究门槛较高,相关投入也是持续增量。这需要坚持不懈地投资,它不像非线性模型立竿见影,不论是回测还是实盘都能快速反馈。我们在业绩归因和分析时,明显发现另类数据的投入和产出性价比较低。
所以不能简单地从投入产出比评价另类数据价值,如果丧失耐心,就无法坚持这个方法论。而我们已经做好准备。
问:另类数据出现是由于社会数字化程度提高,采集数据能力提高,某种程度上,为这个行业注入了新活力。
李骧:新的信息技术正在持续提升行业生产力。无论是AI还是其他前沿科技在行业中都运用得非常充分。研究AI的同事需要不定期翻阅前沿学术期刊和文献,才能保证竞争力。
另类数据也是如此,随着科技进步,数据获取更加便捷。另类数据在急速扩张,甚至可以定义为一种新型生产资料。我们只是前瞻性地较早投入到数据维度上而已。
问:大家认为国外另类数据发展相对更早,因此研究能力也会更强。从您观察来看,这一观点是否符合实际?
李骧:海外另类数据发展比较快,因为海外市场相对成熟,量价衰减以后就研究基本面,但基本面也逐渐衰减,因此选择使用另类数据。所以海外行业整体发展速度领先于国内。
近年来,许多国内数据供应商崭露头角,但由于非线性模型仍然能有效获取量价超额,行业推进另类数据发展急迫性不高,所以供应商发展不如海外迅猛。
问:数据行业发展需要数据采集者和使用者,让他们都有正向收益,行业才能长远发展。
李骧:我非常认同这个观点。
问:请您详细介绍另类数据对策略稳定性的意义。
李骧:首先,单个因子超额不够丰厚意味着大家不愿意投入过多获得它。竞争不激烈时,一定是稳定且持续的。
其次,另类数据维度非常广,这意味着单因子间相关性低,组合在一起能够提升稳定性。
最后,由于另类数据超额可以通过线性组合方式获取,无需担心非线性过强的预测能力,导致潜在的风格暴露或非线性过拟合。
综上,另类数据能够提供相对比较稳定的超额。
问:另类数据存在一定局限性:一是覆盖面相对较窄,二是可追溯历史相对较短。请问您如何看待?
李骧:覆盖面窄无法改变,因为有些行业天然不具备另类数据。
覆盖历史时间,其实比我们预期长,有数据供应商较早开始收集相关信息。我们直接购买对应的文本,针对性地处理后得到更长久的历史数据。
问:自己挖掘另类数据还是从数据商处购买?
李骧:让专业的人做专业的事情。
我们乐意与全球数据供应商合作,目前公司90%以上数据都是由第三方提供。我们也尝试写一些接口抓取或者收集数据,但占比非常低。未来我们也希望在收集端参与。
问:如何看待另类数据未来应用前景?
李骧:量化经过过去的快速发展,大家方法论已经趋同,策略有效性下滑。虽然不至于对AI方法论过度悲观,但如果看更长期,借鉴海外成熟市场发展经验,另类数据关注度一定会越来越高。
蒙玺另类数据运用在量化投资案例
问:业内认为,国内交易策略执行与欧美存在差距,这是否符合实际?
李骧:低延迟是非常窄细的领域,具备这个能力的机构较少。很多人都是通过一些不够专业的观点或者臆想出来的状态来了解,容易形成妖魔化或者不客观的评价。
问:差距原因是海外起步更早,还是有更丰厚的市场土壤?
李骧:两方面都有原因,主要是积累:
一方面,国内经济的起飞给了行业发展机会,从业者抓住了这些机会;另一方面,国内量化机构创始人相对年轻,大家都更考虑长期发展和未来。
以低延迟策略为例,除了预测短期价格走势策略外,还有做市商为市场提供流动性策略,这种策略在一定程度上与金融安全挂钩,可以增强市场有效性。目前中国具备低延迟能力的量化机构普遍都能做市。
国内大多数量化机构的从业者都很年轻,有一腔热血,想做出成绩,造福社会、报效国家。
虽然海外头部机构目前暂时领先,但是差距正肉眼可见地在缩小。只要中国还有土壤和发展空间,未来,我们就能从追赶逐渐变成并驾齐驱,甚至超越的状态。
问:如何看待市场对低延迟交易的看法,哪些是真实,哪些是误解?
李骧:整个低延迟领域,行业观点普遍存在偏颇。因为领域太窄细,大众很难接触到这个领域。
首先,低延迟并非仅投入就能提升,还需要策略端细节、技术设施层面等的积累,需要长时间、多维度的积累。
其次,随着越来越多的算法交易平台出现,大众也能享受到算法交易便利,更具有普惠性。
最后,正因为低延迟算法的存在,操纵市场需要付出很高的成本,不合规机构不敢轻易扰动市场。
问:量化本质上是工业化生产体系,即使在某个小环节存在限制,在其他环节,量化作为方法论仍然具有优势。
李骧:是的,我们主要依靠前端研究取胜,研究本质上是工程化过程。
问:超低延迟领域是否存在最优边界?
李骧:低延迟并非最优边界,而是相对优势。
科技发展是非线性的,这种循环上升也推动各类科技的迭代和提升。我们追求在技术上总是能快人一步,追求极致是我们的理念,这个过程中,必然会用到一些非常前沿的技术。最优不是取决于竞争到哪个层面。
问:因为技术是非线性,无法预知最优边界。我们能确定的是大家都在不断努力。
李骧:站在公司负责人角度看,追求热点,会永远落后别人半步。大家追求各类极致,在追求极致过程中,推进边界外扩。人类进步的状态是新技术不断迭代和产生,把不可能变为可能。
问:蒙玺在技术和人才方面投入情况如何?
李骧:我们在低延迟技术方面投入无止境,无论是人才还是技术维度,只要有价值的投入,我们都会评估,只要有优秀的人才,我们就愿意招揽。在低延迟维度,不断积累,做技术储备,是我们永远的追求,因为它不仅与收益、策略表现挂钩,更是从业者心中图腾般的存在。
(文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)
文/安安