Leveraging Natural Language Processing on Chinese Broker Research Reports for Stock Selection

计算机科学 情绪分析 自然语言处理 股票市场 人工智能 数据科学 特征选择 选择(遗传算法) 库存(枪支) 背景(考古学) 机器学习 情报检索 机械工程 生物 工程类 古生物学
作者
Andrew Chin,Yuyu Fan,Chang Ge,Haobo Zhang
出处
期刊:The journal of financial data science [Pageant Media US]
卷期号:6 (1): 116-137
标识
DOI:10.3905/jfds.2023.1.142
摘要

With the explosive growth of text documents and the huge interest in text-mining techniques, investors are increasingly looking for natural language processing (NLP)-based features to provide an edge in stock selection. Although there has been an abundance of research on English documents, other languages have not seen the same attention. The authors apply these techniques to Chinese documents to generate features for stock selection strategies in the China A-shares market. They first introduce a novel dataset of Chinese broker research reports. The authors then provide an overview of the challenges in processing Chinese text data and detail the text-mining techniques they use to extract meaningful insights to separate outperformers from underperformers. They find that NLP models show significant promise in the Chinese market, with various types of features carrying impactful information. Indeed, this article suggests that sentiment and complexity features are predictive of future stock performance. The authors also find that context-aware approaches using BERT-based models are superior to bag-of-words approaches. Finally, they show that combinations of complexity and sentiment features can yield even stronger results.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
充电宝应助云村村民采纳,获得10
1秒前
1秒前
艺阳完成签到,获得积分10
2秒前
丁莞发布了新的文献求助10
2秒前
梅花笑发布了新的文献求助10
3秒前
852应助一只奇魔猪采纳,获得10
3秒前
4秒前
余地完成签到 ,获得积分10
4秒前
net80yhm发布了新的文献求助10
5秒前
852应助skyler采纳,获得10
6秒前
山高鹭沅发布了新的文献求助10
7秒前
西瓜完成签到 ,获得积分10
7秒前
刻苦羽毛完成签到,获得积分10
7秒前
7秒前
hxd完成签到,获得积分10
9秒前
9秒前
9秒前
Vera完成签到,获得积分10
10秒前
11秒前
小芒果完成签到,获得积分10
11秒前
Beclin1发布了新的文献求助10
11秒前
12秒前
eyou完成签到,获得积分10
13秒前
fkdbdy完成签到,获得积分20
14秒前
asdfqwer发布了新的文献求助10
14秒前
SHIKI发布了新的文献求助10
15秒前
FashionBoy应助学术混子采纳,获得10
16秒前
知秋完成签到 ,获得积分10
16秒前
16秒前
hxd发布了新的文献求助10
16秒前
高高的高丽完成签到 ,获得积分10
17秒前
云村村民发布了新的文献求助10
18秒前
李健应助wangqing采纳,获得10
18秒前
慕青应助紧张的蝴蝶采纳,获得10
18秒前
19秒前
明天更好发布了新的文献求助10
19秒前
共享精神应助畅彤采纳,获得30
19秒前
21秒前
Jandy发布了新的文献求助10
22秒前
高分求助中
Licensing Deals in Pharmaceuticals 2019-2024 3000
Cognitive Paradigms in Knowledge Organisation 2000
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger Heßler, Claudia, Rud 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 1000
Natural History of Mantodea 螳螂的自然史 1000
A Photographic Guide to Mantis of China 常见螳螂野外识别手册 800
How Maoism Was Made: Reconstructing China, 1949-1965 800
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 量子力学 冶金 电极
热门帖子
关注 科研通微信公众号,转发送积分 3315909
求助须知:如何正确求助?哪些是违规求助? 2947608
关于积分的说明 8537809
捐赠科研通 2623744
什么是DOI,文献DOI怎么找? 1435448
科研通“疑难数据库(出版商)”最低求助积分说明 665595
邀请新用户注册赠送积分活动 651426