作为这一变革的前沿,金融行业垂直领域的大模型应用已经开始在金融服务的多个方面展现出其巨大的潜力和价值。本文将深入探讨金融行业垂类大模型的应用现状,分析其市场前景、分类、主要参与主体以及典型案例,并讨论在实际落地过程中面临的挑战。
当前,国内互联网企业、传统金融机构及金融科技企业争相竞逐,“百模大战”如火如荼,AI与金融的结合也日益深化。从通用大模型向金融产业大模型的转变,逐步改变着传统金融行业的运作模式和业务流程。国内外金融大模型如轩辕、貔貅、支付宝的AntFinGML、腾讯云金融大模型等等逐步在推进使用中。
随着AI技术的不断升级的,AIGC技术的实践效用迎来了行业级大爆发。在内部模型自身迭代和多技术协同的作用下,出现了集图像识别、语义理解、视觉感知于一体的多模态体系。然而,由于行业深度信息的缺失,通用大模型在特定领域很难提供高价值、专业化的服务。
金融行业属于数据、信息密集型产业,对于多渠道信息汇总与数据处理能力有较高要求;同时,行业要求从业人员专业知识储备与经验,来完成对金融业务的判断、咨询服务、报告产出等工作。
而相对应的,大模型恰好有很强复杂信息处理能力,以及基于原始数据和经验给出相应解决方案方面的能力。
据智研瞻统计显示,2019年中国金融大模型行业市场规模250.49亿元,2024年Q1中国金融大模型行业市场规模90.82亿元,同比增长7.10%。2019-2024Q1年中国金融大模型行业市场规模如下:
根据毕马威中国发布的《2024中国金融科技企业首席洞察报告》的揭露,70%的受访企业认为新质生产力能提升金融科技企业自主创新能力,并带来新机遇。同时,91%的受访企业看好大模型金融应用前景。
从服务细分领域、应用场景、开源状态,对金融大模型进行分类:
在金融大模型的应用方面,传统金融机构、金融科技公司和互联网金融公司各有优势,故提供的服务也有所差异。
传统金融机构
其主要优势是:丰富的行业经验与专业知识,有助于将生成式AI应用于复杂的金融决策和客户服务中;成熟的合规框架,能够确保AI应用符合行业法规和标准。丰富的客户数据,为生成式AI提供了训练和优化的基础,支持个性化推荐和服务。强大的资金支持,可以投资于AI技术的研发和基础设施建设;强大的品牌信誉,使客户对传统金融机构的信任度较高,增强了新服务的接受度。
金融科技公司
金融科技(FinTech)公司领域主要服务于企业客户(B端),主要提供如在线支付处理、借贷平台、财务管理软件、企业保险解决方案、区块链技术应用和数据分析服务等,其核心职能是为金融机构提供广泛的技术支持和解决方案。
其主要优势是:
互联网金融公司
互联网金融公司指针对面向零售投资者(C端)市场提供的金融服务,如智能投资顾问、市场情况预测、个性化财务规划、个人投资组合风险评估、金融知识教育培训等。
其主要优势是:
垂直类大模型是基于通用大模型进行二次的开发。先检索相关的知识,然后基于召回的知识进行回答,也就是基于检索增强的生成。一般要经过三个步骤:
(1)ContinuePreTraining:给模型注入领域知识,即用金融领域内的语料进行继续的预训练。一般为了保持模型的通用能力,还需要注入混杂的通用数据。(2)SFT:通过SFT可以激发大模型理解领域内各种问题并进行回答的能力(3)RLHF:通过RLHF可以让大模型的回答对齐人们的偏好,比如行文的风格。
国外金融市场更开放、发达,业务量和用户数较多,且金融服务要求更高。在NLP出现初期,很多公司就前仆后继地开发大模型或者开发AIagent。
BloombergGPT——闭源模型
BloombergGPT是彭博社于2023年推出的金融垂直领域大语言模型,是一个有500亿参数、基于BLOOM模型的LLM,该团队采取通用模型和特定领域模型混合分析的方式,直接从0训练一个的金融领域大模型。其主要优势有以下几点:
① 数据来源可靠。由于彭博社在几十年的金融业务中积累了大量的金融数据和文件,拥有先天的数据优势,数据来源可靠。
② 金融数据集来源丰富,token数量大。其在金融领域数据集共包含了3630亿个token,占总数据集token量的54.2%,具体由以下几个部分构成:
③ 模型应用表现好。团队分享了模型的三个定性示例:1)生成Bloomberg查询语言,BloombergGPT可以被用来通过将自然语言查询转换为有效的BQL,使BQL更易于访问。2)生成新闻标题。由于它在许多新闻文章上进行了训练,可以帮助生成新闻标题。3)金融问答。由于金融领域训练数据,智能问答覆盖面广
FinGPT——开源模型
FinGPT是AI4Finance基金会发起的一个专注于金融领域的大型语言模型,它致力于通过构建开放源码的金融大语言模型来推动金融科技(Fintech)的发展和创新。
① 基座模型:开源LLaMA或者ChatGLM,
② 数据集:新闻网站、社交媒体、公司公告、趋势(google或者baidu等搜索引擎)、其他公开数据集
③ 训练方法:LoRA和RLSP(根据股票价格的强化学习)
④ 模型框架
数据源层:通过整合新闻网站、社交媒体平台、财务报表、市场趋势等数据,确保全面的市场覆盖。
数据工程层:专注于NLP数据的实时处理,以应对金融数据固有的高时间敏感性和低信噪比的挑战。
LLMs层:整合各种微调方法,优先考虑轻量级自适应,以保持模型的更新和相关性。
应用层:提供金融任务的实践教程和演示应用程序,包括机器人咨询服务、量化交易和低代码开发。
⑤ 优势
国外首个金融行业垂直类开源大语言模型。主要给金融研究人员和从业者提供可访问和透明的资源,来开发自己的的FinLLM或潜在的应用程序。解决金融数据获取难、处理难的问题,旨在开源领域实现互联网规模的金融数据民主化。
基于GPT的各种金融模型和AIagent
(1)BondGPT:2023年6月全球金融科技领导者Broadridge的子公司LTX,通过GPT-4打造了BondGPT,该模型主要用于债券市场,帮助客户回答各种与债券相关的问题。帮助金融机构、对冲基金等简化债券投资流程并提供投资组合建议。比如输入问题:我有100万美元资金,想投资5年,有哪些高收益的债券选择?BondGPT会回答符合需求的公司名字、利率、价格、发布日期、到期日期、债券评级等信息。
(2)PortfolioPilot:由SEC注册投资顾问机构——GlobalPredictions于2022年11月推出,为投资者提供全球投资组合管理、投资顾问、AI助理等服务,是美国的智能投顾平台。目前PortfolioPilot已积累逾3万名用户,为约200亿美元资产提供AI大模型+智能投顾服务。
其核心模块:追踪模块能借助大模型技术,为用户呈现投资组合管理的可视化工具,包括大类资产配置结构、资产相关性矩阵等;提升模块能基于AI大模型所生成的全球经济洞察观点,对用户投资组合进行评分分析,找出用户投资组合薄弱之处并提供个性化的改善建议;探索模块主要包括新闻、研究、预测三大功能,汇总关键新闻帮助投资者及时了解行业信息。
国内金融市场发展较晚,且开放性不足,另外NLP发展速度也稍落后于国外。但由于国内市场需求大,金融机构数量多,2023年间金融垂类大模型蓬勃发展。
轩辕-开源
轩辕是度小满的大模型团队,在2023年基于BLOOM-176B架构,针对中文通用领域和金融领域进行针对性预训练和微调的千亿级对话大模型。目前,已实现开源的全参数模型矩阵达17个。在此基础上,今年9月份度小满在始智AIwisemodel社区重磅开源发布第三代大模型「轩辕3.0」,包括对话模型和预训练模型。「轩辕3.0」在金融场景中的任务评测中表现突出,并且在金融事件解读、金融业务分析、投研应用能力和风险管理等测量维度上超越GPT4o。
其数据集采用度小满实际业务场景积累的金融数据,对金融相关问题的理解比通用大模型更有优势。因此在模型评估方面,在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT3.5,61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。2023年在中文任务评测C-Eval和CMMLU榜单中名列开源首位。
HithinkGPTvs妙想金融
作为国内toC金融公司的佼佼者,同花顺和东方财富公司在金融大模型方面的竞争也不相上下,在2024年1月,相继推出HithinkGPT和妙想金融大模型。目前同花顺问财已经开始启用,妙想app还处于内测阶段。下面从技术方面和用户体验方面进行简单对比:
1-技术方面:从技术架构、token数、落地方式等角度,比较两个模型。
2-用户体验方面:由于妙想内测审核暂未通过,故只初步体验了HithinkGPT问财,后续看机会再更新两者的对比。
优势:
不足:
总体来说,目前问财已经进入商业化收费阶段,虽然在投顾方面有了一定的帮助,但是吸引用户去购买更深层次服务的吸引力不够,还需更加努力。特别是在竞争对手也逐步进入商业化阶段的背景下,要积极重视提高模型准确率、内容丰富度和用户体验等方面。
相关资源来源
作者:seven777,公众号:商业知行侠
本文由 @seven777 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
非常抱歉!本站不支持旧版本IE浏览器~~建议使用IE10/IE11/Chrome/Firefox/Safari等高级浏览器浏览。