• 清华大学
  • 经管邮箱
  • 用户登录
  • EN

图书馆资源使用培训:WinGo文构财经文本数据平台

2024-03-18
阅读:

【主讲】陈芷怡

【主题】基于大语言模型开展经管领域研究

【时间】2024年3月22日(周五)14:00~16:00

【讲座方式】腾讯会议:193-126-732

      会议链接:https://meeting.tencent.com/dm/IX9S0S8tQKf6


【讲座内容】

1、文本分析的基本概念与研究框架

2、自然语言处理技术的演变(传统词袋法—深度学习—大语言模型)

3、以BERT/GPT为例,介绍如何基于大语言模型构建文本指标

4、简介文构数据库基于大语言模型的最新文本指标


【数据库介绍】

WinGo财经文本数据平台(中文名为“文构财经文本数据平台”)是中国首家基于中美上市公司披露文本的人工智能财经数据平台。平台立足于学术研究和业界量化投资,聚焦于中美海量财经文本数据。针对两国截然不同的文本披露规则和财经文本特点,平台应用自然语言处理、深度学习和人工智能技术对财经文本进行深度加工,为用户提供财经文本的词频、句频、相似词、预计算文本特征等全新深度处理的数据,从而为学术研究、量化投资、监管决策等提供多方位支持。

WinGo数据平台包括中国上市公司、美国上市公司、中国政府文本、专利文本以及大语言模型五大数据库,由业内专家和高校知名学者主持设计,打破了财经文本分析的技术壁垒,大幅降低研究成本,为广大研究和分析人员开辟出全新的研究模式。

清华大学目前订购了WinGo基础版数据产品中的中国上市公司文本数据库、中国政府文本数据库、专利数据库中的大部分数据,和美国上市公司文本数据库中的季报数据。


【数据库说明页】

https://ecollection.lib.tsinghua.edu.cn/databasenav/entrance/detail?mmsid=991021558927003966


【主讲人简介】

陈芷怡,西安交通大学会计财务系博士,主要研究方向为财经领域的大数据和人工智能应用。