摘 要:人工智能是新一轮科技革命和产业变革的核心驱动力,人工智能高质量发展和高水平应用是推动金融高质量发展的新动能。深化大数据、人工智能等研发应用,开展“人工智能+”行动,建设金融大模型已经成为金融行业发展的重要趋势。人工智能大模型大规模落地金融行业,加快形成新质生产力,与其他金融科技融合,正在引发金融科技发展范式创新、行业运行方式变革、服务生态体系重塑,在风险评估和预测、文本分析和舆情监测、客户服务和咨询、智能投资顾问和投资组合优化等领域得到应用。大模型在金融领域的应用还在摸索阶段,还需要金融机构与科技企业共同探索,以期在风险与机遇之间找到最佳的平衡点。
关键词:人工智能 大语言模型 金融大模型 新质生产力
【中图分类号】F49 【文献标识码】A
近年来,大数据、机器学习、自然语言处理、计算机视觉、语音识别和智能推荐等一系列人工智能及其相关技术得到长足发展,不仅极大提高了复杂问题的数据分析、处理、建模能力,也使得人和机器间的交互得以更加智能化。人机混合智能技术在金融领域的应用越来越多,ChatGPT、MOSS、ChatGLM等最新大模型技术(Large Language Model)已成为数字科技与金融领域结合的热点,为以整体思维和系统认知破解金融科技发展难题提供了有效解决方案。金融领域大模型开发和应用取得可喜突破。金融行业具有场景、数据、知识“三多”的特点,为人工智能大模型发挥价值创造了便利条件。海外机构纷纷下场布局金融大模型,如彭博首度针对金融业推出大型语言模型BloombergGPT,哥伦比亚大学联合上海纽约大学开发了FinGPT。与此同时,国内企业也迎头抢滩金融大模型赛道,如马上消费金融服务有限公司发布“天镜”大模型,蚂蚁集团推出了蚂蚁基础大模型,此外一些证券机构也开始应用大模型为客户提供金融服务。
金融高质量发展与人工智能大模型的特性高度耦合
2022年下半年以来,以美国OpenAI公司发布的ChatGPT产品为代表的人工智能大模型热潮席卷全球,标志着人工智能技术正式进入大模型时代,原先的许多人工智能技术将快速被大模型技术整合、取代、颠覆。就目前的发展态势,大模型可分为以OpenAI开发的GPT-4为代表的通用大模型、有以谷歌开发的专注医疗健康的Med-PaLM 2为代表的行业大模型、有以粤港澳大湾区数字经济研究院开发的图像分割基础模型Grounded-SAM为代表的垂直大模型。在通用大模型的基础上,运用行业数据训练行业大模型或在通用/行业大模型基础上,运用具体任务数据训练垂直或专属于企业、机构的大模型,逐渐成为人工智能技术发展的新模式。
大模型的发展大致经历了三个阶段。第一阶段是萌芽期,以卷积神经网络(CNN)为代表的传统神经网络模型阶段,为自然语言生成、机器视觉等领域的深入研究奠定了基础;第二阶段是探索期,以多层变换器(Transformer)为代表的全新神经网络模型阶段,奠定了大模型预训练算法架构的基础,使大模型技术的性能得到显著提升;第三阶段是爆发期,以GPT为代表的预训练大模型阶段,大幅提升了大模型的预训练和生成能力以及多模态多场景应用能力。
人工智能正在从语音、文字、视觉等单模态智能,向着多种模态融合发展。从GPT-1到ChatGPT再到GPT-4 Turbo的发布历程清晰地呈现了大模型从单模态生成到多模态融合发展的趋势。ChatGPT是基于GPT-3.5 架构,综合机器学习、神经网络等技术的大规模预训练语言模型,能够实现代码生成、文本问答、内容撰写等数字内容,属于生成式人工智能(AIGC)。从产品形式看,ChatGPT是一款实现聊天功能的软件应用。从技术层面看,“GPT”可以这样理解:G是Generative,指生成内容,不同于搜索引擎,它根据现有字段预测下一个字,再将自己生成的下一个字和之前的字段组合,并不断循环直至完成,而非仅匹配数据库现有内容;P是Pre-Trained,指预训练,代表模型已经完成某些相关材料的训练;T是Transformer,指底层的深度学习模型。随着以ChatGPT为代表的生成式人工智能产品的火爆“出圈”,全球掀起了人工智能大模型开发浪潮。
以大模型为代表的人工智能发展呈现出技术创新快、应用渗透强、国际竞争激烈等特点,展现出强大的赋能效应。大模型是“大数据+大算力+强算法”的结合,通过在海量数据集上做预训练来学习复杂的模式和特征,它能够挖掘并生成新的数据资产价值,具备压缩海量数据和更强大的泛化能力,可以对未见过的数据做出准确的预测,展现出强大的语言理解和生成能力。大模型包含了“大规模”和“预训练”两层含义,即模型在大规模的语料库上完成了预训练后仅需要少量数据的微调,就能直接支撑各类任务。大模型的快速崛起推动通用人工智能(AGI)的普及,使各领域的智能系统具备像人类一样学习和推理甚至决策的能力。同时,推动机器算力向机器智力的跃升,拓展了人类认知疆域和知识范畴,促使数字社会加速向智能社会演进。
大模型在商业应用中的价值和重要性越来越引起人们的关注,尤其在金融、医疗、能源等领域,大模型逐渐成为企业提升效率、降低成本、提高竞争力的有效工具。与此同时,通用大模型无法具备解决行业、领域等专业问题的能力,大模型的商业应用逻辑逐渐呈现出多样化、定制化的特点,大模型演化成“通用—行业—领域”的垂直化发展模式。金融领域首当其冲。中国银保传媒股份有限公司和腾讯研究院联合发布的《2023金融业大模型应用报告》显示,大模型技术目前在金融领域的结合呈现多层次、多维度的发展特点,已全面渗透到金融行业的前中台通用应用、监管科技、个性应用、后台应用,包含渠道运营、营销管理、产品设计、资产管理、风险管理、开发与运维、监管科技、办公管理和通识工具等核心应用模块。
随着大模型技术的不断发展和优化,其在金融行业的应用场景将越来越丰富,从智能营销、金融信息查询,到财富管理、风险控制等多个领域,大模型都将赋予金融行业新的生命力和创新可能性,推动金融行业的数字化和智能化进程。比如,马上消费基于深厚的科研积累和长期的数字化实践,在大模型的智能化架构、构建先进人工智能驱动的模型决策系统方面不断进行尝试。经过约一年的研发和内测,2023年8月,马上消费发布了全国首个零售金融大模型——“天镜”大模型。“天镜”大模型引入生成式模型强大的迁移学习和泛化能力,嵌入优化金融业流程。从技术创新上,实现了模型训练过程中的高效模型精调,实现了客服对话场景的模型生产技术细分,实现了提示工程技术下的模型输出可控,同时,实现了幻觉检测技术下生成内容可信。天镜大模型通过在线交互的强化学习技术实时优化大模型预测精度,提升智能客服机器人服务质量,意图理解准确率达91%,相较传统人工智能大模型的68%有较大提升,用户满意度达98.6%。马上消费每天能基于用户的1000万个行为做出个性化的营销和风险判断,每天进行上亿次模型计算,每秒可以处理150万次特征计算请求。
与此同时,金融机构将在拥抱大模型方面迎来更大的发展空间,主要体现在产品和服务个性化、价值链效率、决策科学性等方面。当然,金融大模型执行金融任务,需满足三个条件:一是在线持续学习,让大模型实现实时推理预测,基于用户行为做出快速的、最佳的个性化判断;二是要构建组合式人工智能平台,让大模型和传统的数千个普通模型有效组合、达成合作;三是满足安全合规这个根本要求,用对抗学习来解决模型的鲁棒性问题,以保证其安全、合规。
人工智能大模型提升金融服务效率的逻辑和场景
人工智能大模型在金融高质量发展中起到至关重要的作用。一方面,横向拓展金融服务场景。过去,数字技术与金融的融合解决的是相对简单的问题,如征信、客服等,大模型的加持有助于原有场景中解决方案的提质增效,同时有能力解决相对复杂的问题,如风险防控、预测决策等。另一方面,纵向加深产业要素整合。在实体经济数字化过程中,通过“技术+金融+行业”的数字化平台策略,推动金融与国家重大战略、现代化产业体系融合发展,也推动金融资源向中小微企业、向基层群众提供精准服务,带动产业链不同组成部分的整合和一体化。
人工智能大模型加快形成金融新质生产力
新质生产力在金融行业中的表现和作用具象化,主要体现在以下几个方面:第一,优化。通过快速学习、交互和反馈,大模型能够识别流程瓶颈,减少人为错误,提高运营效率,可以广泛应用在金融审批、用户分层、客服投顾、合规质检等服务场景中。此外,大模型对金融行业的商业模式也会进行优化,形成新产业和新生态。第二,连接。依托大模型能力和数字化优势,金融服务可以下沉拓展至县城和农村地区,实现普惠的获客营销、客户运营及客户服务,构建城市与农村、供给和需求之间的连接。第三,预判。基于因果推断和泛化能力,大模型可以进行数据分析、信用评估,从而发现可能的欺诈行为,预判未来的信用风险,与此同时,大模型可以理解隐含信息,处理非结构化数据,最终转化为具有预测性的,能够被人类理解的文本。这有助于防范风险、进行金融监管和保护数据安全等。
大模型技术通过推动金融新技术、新生产工具的发展,形成新质生产力。大模型技术的应用,使得金融机构可以根据每个客户的行为和偏好,为其提供个性化的服务和产品推荐。同时,大模型可以实现金融服务的自动化,如自动回答客户的问题,自动处理客户的请求等。大模型通过深度学习和自然语言处理等技术,对海量金融数据进行分析和处理,从而提供更精准的决策支持。例如,它可以通过分析历史数据,预测市场趋势,从而为投资决策提供支持。大模型通过分析个人或企业的信用历史,预测其未来的信用状况,从而为信用评级提供依据,也可以从大量的历史数据中,学习和模拟风险模式,从而提供更准确的风险评估,提升金融机构的风险管理能力。大模型作为新质生产力,正在推动金融行业生产工具的发展,提升金融行业的决策效率和服务水平,同时也在推动金融行业的创新发展。
大模型正在渗透到金融行业的各个领域,通过赋能业务形成新质生产力。以ChatGPT为代表的生成式人工智能在两个方面实现了重要突破:一是通用性大大扩展,这种通用性建立在预训练大模型的基础上,并推动数据、算法、算力在业务层面深度融合;二是实现了与自然语言的融合,极大地降低了交互成本,使人工智能可以快速融入金融领域各个业务中。随着技术迭代创新,大模型将在更深层次上广泛赋能金融行业现有业务升级、新业务出现,不断形成新质生产力。
人工智能大模型与其他金融科技相结合推动创新
大模型涌现出的语境理解、情绪感知、归纳、推理等通用能力为金融科技的发展开启了新篇章,即金融智能化阶段。以大模型为典型的人工智能应用为金融科技和整个金融行业带来了无限的创新思路和想象空间,不仅为金融科技带来了新的变革机遇,也提出了一系列新的技术和业务需求,包括模型的可维护性、高性能和实时性,人工智能服务规模的可拓展性,人工智能服务的可靠性和容错性,以及模型的可解释性和审计能力等。
模型的可维护性是指模型在生产环境中的稳定性和持续性。为了保证人工智能模型的持续有效和准确,行业需要建立一套完善的模型管理和更新机制,包括制品管理平台、版本控制、监控和优化等。这样可以确保模型及时应对新的业务需求和数据变化,从而提高模型的实用性和价值。高性能计算(High Performance Computing,HPC)是指通过利用大规模的计算资源和并行处理技术来解决复杂问题的计算方法。在实时“大模型+金融”应用中,高性能计算可以提供强大的计算能力,以处理大规模的数据和复杂的算法,从而实现更快速和高效的人工智能计算。为了支持人工智能服务规模的扩展,利用云计算和分布式技术是必要的。例如,使用云服务、分布式计算和分布式存储,可以具备弹性的计算能力和大规模的数据处理能力。而采用微服务架构则可以提供灵活的服务组合和部署能力。这样可以应对金融业务规模不断扩大和业务需求不断变化的情况。为了保证人工智能服务的稳定运行,行业需要建立一套服务管理和监控机制。例如,使用故障检测和恢复技术、数据备份和恢复技术等方法,提高人工智能服务的可靠性和容错性。这样可以确保人工智能服务在面临各种故障和问题时,能够快速恢复和继续提供服务。为了满足监管要求和提高用户信任度,人工智能模型需要具有良好的可解释性和审计能力。这意味着模型的决策过程必须是透明的,而且能够追踪和记录模型的行为。这样可以确保人工智能模型的决策是公正、公平和合规的,同时也可以提高用户对人工智能模型的信任度。
人工智能大模型拓展了金融发展空间
从行业实践看,大模型在多模态信息理解、内容生成、知识问答、代码编程和合规检测等方面拥有巨大的效率提升价值,目前已经逐渐在金融领域加速渗透。主要应用可以分为两个大类,一类是替代人工的标准化、重复性任务,实现降本增效,例如研报生成、电话营销、智能投顾等;另一类是人机协作提高决策效率,全面提升金融生产力,如客服坐席辅助系统等。可以预期,随着技术的不断进步和成熟,大模型将继续在金融行业的各个领域中扮演更加重要的角色,进一步提高金融服务质量并降低高水平金融服务成本,推进普惠金融的发展。
随着人工智能技术的不断发展,大模型在金融知识库的应用将得到进一步拓展,助力提升金融机构的服务水平和业务发展水平。大模型在金融知识管理应用中的实践已涉及多个领域,目前主要包括风险评估和预测、文本分析和舆情监测、客户服务和咨询、智能投资顾问和投资组合优化等领域。
大模型不仅可以提高金融风险评估的效率和准确性,还可以为金融机构提供智能化、定制化和实时性的风险管理解决方案。在金融风险评估方面,通过分析金融市场的风险特征和规律,大模型可以提供有针对性的风险防范建议。例如:在信用风险评估中,大模型可以为企业客户提供信用评级和风险预警,帮助客户优化信用风险管理策略;在市场风险评估中,大模型可以分析市场趋势,为投资者提供投资建议、降低投资风险。在信用风险预测方面,大模型可以分析借款人的个人信息、财务报表、历史信用记录等数据,对信用风险进行预测。大模型可以挖掘数据中的潜在规律,以评估借款人的信用状况,为金融机构提供可靠的信用风险预测结果。此外,大模型还可以识别借款人的信用评级,为金融机构提供信用风险管理的参考。在信用风险预测场景中,大模型有助于金融机构降低不良贷款率。大模型可以分析客户数据,为客户提供符合其需求的金融产品推荐,提高客户满意度。同时,大模型还可以为金融机构提供客户细分和精准营销方案,助力金融机构拓展市场份额。在个性化金融推荐场景中,大模型有助于金融机构提升客户服务水平。随着人工智能技术的不断进步,大模型在金融风险评估和预测领域的应用将更加广泛,助力金融行业实现高质量发展。
大模型可以对海量金融资讯进行深度分析,挖掘有价值的投资线索。一方面,大模型可以用于金融知识图谱的构建,将金融机构、金融产品、金融事件等实体及其关系进行建模,既为金融行业提供智能化的决策支持,又可以帮助金融机构挖掘金融知识图谱中的潜在商机,推动金融业务的创新发展。另一方面,通过对金融文本的深入分析,大模型可以发现新的金融业务场景,为金融行业的发展提供创新思路。同时,大模型还可以为金融科技企业提供技术支持,助力金融科技的创新和发展。然而,大模型在金融文本分析和舆情监测中的应用也面临一些挑战,如数据质量差、模型泛化等。为了应对这些挑战,金融机构和研究人员需要不断探索新的技术和方法,提高大模型在金融领域的应用效果。
在客户服务和咨询领域,大模型可以协助金融机构提升服务质量、提高客户满意度和深化客户关系,主要应用包括智能服务、金融知识库、金融咨询、客户关系管理等。在客户画像与个性化服务方面,通过对客户对话文本进行深度分析,大模型可以构建客户画像,包括客户兴趣、偏好和需求等。结合客户画像和产品信息,大模型的智能客户服务可以提供更为精准的个性化服务,提高客户满意度。同时,准确的客户画像还有助于智能客户服务在后续对话中更好地满足客户需求,提升客户忠诚度。在智能搜索与推荐方面,结合客户需求和金融知识库,大模型能够实现智能搜索和推荐功能。客户在咨询过程中,大模型的智能客户服务可以根据客户提出的问题,快速在知识库中检索相关内容,为客户提供精准的解答。此外, 大模型还可以根据客户画像和需求,为客户推荐合适的金融产品和服务。
大模型在智能投顾和投资组合优化方面的应用已渐趋成熟,主要应用在个性化投资建议、跨资产类别投资、实时动态调整、投资组合优化、税收优化等几个方面。比如,大模型在投资组合优化中的具体应用有:利用现代投资组合理论,为客户提供最优投资组合构造方案;根据客户的需求和风险承受能力,为客户提供最佳的资产配置方案,以实现风险收益的平衡;为客户提供多种投资策略,如价值投资、成长投资、指数投资等,以满足客户的不同投资需求;为客户提供风险管理策略,如止损、止盈、期权等,以降低投资组合的风险。
人工智能大模型促进金融高质量发展的基本路径
大模型在金融领域的应用还在摸索阶段,还需要金融机构与科技企业共同探索,以期在风险与机遇之间找到最佳的平衡点。大模型应用总体上还处于早期探索阶段,仍面临不少挑战。一方面,金融数据的私密性和多模态特性,限制了共享和构建大规模数据集的能力,增加了模型建立和处理的复杂性,导致大模型在金融垂直领域仍未出现涌现效应;另一方面,数据安全也是发展金融大模型绕不开的重要课题,亟须加快构筑形成组织、管理、技术、运营四位一体的金融数据安全治理体系框架,提升协同共治水平。但无论如何,大模型对于金融行业的发展趋势影响是深远的,它的应用态势必将成为金融行业发展的重要动力。从大模型技术走向应用落地,需要金融行业的金融大模型与数据、场景相结合。
加强基础设施层建设
基础设施层是大模型和金融应用落地的基石,具体体现为高性能计算集群、高性能计算网络、大数据存储、向量数据库等。高性能计算集群是由多台计算机组成的系统,这些计算机通过高速网络相互连接,共同完成计算任务;高性能计算网络则是连接这些计算机的网络,它需要具有高带宽和低延迟的特性,以保证数据的高效传输;大数据存储提供高性能的存储和访问能力,弹性扩展的存储资源,以及安全可靠的数据保护措施;向量数据库则是存储和处理向量数据的数据库,它可以有效地处理大规模的向量数据,为大模型提供必要的数据支持。这一层的设施为上层的模型训练和应用提供了必要的硬件和数据支持。
发展数据、算法模型和算力
大模型浪潮下,数据、算法模型和算力构成了业务驱动的“三驾马车”。数据是基础元素。数据包括历史数据和实时数据,可以从各类金融市场(如股票市场、债券市场、商品市场等)中获取。数据的质量、准确性和完整性直接影响模型的有效性和准确性。算法模型是用于处理和分析数据的计算规则或程序。在行业中,算法的选择和设计取决于其应用的目标和上下文。例如,如果目标是预测股票价格,可能会使用自回归移动平均模型或长短期记忆网络等机器学习算法。算力指的是计算机系统进行数据处理和计算的能力。随着数据量的增加,大模型对算力的需求也在不断增加。高效的算力可以确保模型在合理的时间内得出结果,从而为用户提供及时的决策支持。如果说算力决定了模型能力的“下限”,那么在实际应用场景中,数据质量则决定了模型能力的“上限”。发展金融大模型,不仅需要高质量的海量数据供给,而且需要数据多样且及时更新。金融大模型对数据的高要求促进了数据治理的发展,完备的数据治理新范式推动金融大模型合规发展。
统筹监管与发展,促进“大模型+金融”应用合规落地
金融行业是一个强监管的行业,政策环境、法规环境等对大模型在金融领域的应用产生直接且重要影响。例如,数据保护的相关法规可能会限制金融机构使用人工智能处理用户数据,而政策扶持则可能会促进人工智能在金融领域的应用。从已发布的政策来看,宏观政策呈现“中央规范为主,地方鼓励为主”的特点。中央政策关注事前规范,并从科研、产业等方面鼓励其发展。对于大模型的应用,政策需要在发展与监管之间找到平衡。首先,政策需要明确大模型在金融行业应用的规范和要求。这包括但不限于数据安全、数据隐私、模型可解释性、风险控制等方面。这些规范和要求既能保障金融行业的安全,也能保护消费者的权益。其次,政策需要鼓励和支持金融机构进行技术改造,提升数据资产管理水平。这可能包括提供财政支持、技术指导和人才培养等。最后,政策需要鼓励金融机构和科技企业之间的合作,以共同推动大模型在金融行业的应用。
促进科技企业和金融机构跨行业合作
科技企业在人工智能技术、算法优化、计算资源等方面具有天然优势,它们可以提供高效、稳定的大模型训练和运行环境。金融机构则能提供丰富、真实的金融数据,以及对金融市场和业务流程的深入理解,从而推进金融行业大模型的应用落地。通过跨行业合作,科技企业和金融机构共同推动大模型在金融行业的规模化部署,为金融行业的发展注入新的活力和潜力。随着大模型覆盖的场景越来越多,对灵活的模型服务能力需求必然越来越大,包括模型的版本管理、在线更新,以及多场景多任务的服务调度等,未来工程化和流水线能力将逐渐凸显其重要性。
提升多语言和跨语言的能力,促进多模态融合
通过引入多语言,金融大模型能够支持不同语言和文化背景的用户和场景。这不仅使金融机构能够更好地满足不同语言背景客户的需求,提供个性化的金融建议和服务;还有助于全球性金融机构更全面地理解国际市场的动态,提高决策的全球视野。金融市场不仅涉及数字数据,还包括文本、图像和声音等多种形式的信息。未来的模型可能会更多地融合这些多模态数据,以更全面地理解市场情绪、新闻事件对股市的影响等。例如,结合新闻情感分析和图像识别,更全面地评估市场情况。多模态融合模型的发展将促使不同类型数据之间的信息交互,增强金融大模型的表征能力,提高任务的精准度。
发展可持续的负责任的金融大模型
金融机构在使用 人工智能技术时需要考虑其对社会和环境的影响。例如,过度依赖自动化可能导致失业率上升,加剧社会不平等现象。因此,金融机构需要在推动创新的同时,关注可持续发展和社会责任。模型的设计和应用应该更加注重可持续金融和社会责任。例如,设计模型时要考虑环保因素,或者利用模型来识别社会责任投资的机会。再例如,确保模型的使用不会引发歧视性问题,保护客户隐私,避免操纵市场等。未来的金融大模型需要具备可解释性,能够清晰地解释模型的决策依据,为用户提供可信赖的结果。例如,采用可解释的模型结构,或者设计专门的解释性模块,以便更好地理解模型的决策过程。这种可解释性将有助于用户更好地理解模型的运作方式,增强用户信任度,推动大模型在金融决策中的广泛应用。
【本文作者为中央财经大学中国互联网经济研究院教授;本文系国家自然科学基金项目“数据要素价值化对企业数字化转型的影响:机制、模式与对策”(项目编号:72373056)的阶段性成果】
参考文献略
责编:程静静/美编:石 玉