文章核心总结与翻译
一、主要内容
文章聚焦量化因子与LLM生成的新闻流表征融合,用于股票收益预测和选股。首先提出表征级融合学习框架,对比三种融合方法;针对融合学习的局限性,设计混合模型并提出解耦训练法解决训练不稳定性;通过北美、新兴市场、欧洲三大投资组合的实证,验证模型效果并分析LLM微调的影响。
二、创新点
- 提出多模态融合学习框架,系统对比表征组合、表征求和、注意力表征三种不同复杂度的融合方法。
- 设计自适应混合模型,在表征层和预测层双重整合信息,同时提出解耦训练法,通过独立训练和分布匹配缓解梯度方差纠缠导致的训练不稳定。
- 基于三大真实投资组合的实证,揭示融合方法效果的市场依赖性、混合模型的稳健性,以及LLM微调对不同效率市场的差异化影响。
三、核心部分翻译(Markdown格式)
Abstract
在量化投资中,收益预测支持股票选择、投资组合优化和风险管理等多项任务。量化因子(如估值、质量和增长)捕捉了股票的各种特征。受大型语言模型(LLMs)近期进展的推动,新闻和 transcripts 等非结构化数据受到了越来越多的关注。本文探讨了利用多模态因子和新闻流进行收益预测和股票选择的有效方法。首先,我们引入融合学习框架,从量化因子和LLM生成的新闻流表征中学习统一表征。在该框架内,我们对比了三种不同架构复杂度的方法:表征组合、表征求和和注意力表征。其次,基于融合学习实证对比中发
订阅专栏 解锁全文
1644

被折叠的 条评论
为什么被折叠?



