近期,DeepSeek大模型在金融业掀起一股热潮,多家金融机构纷纷宣布接入或部署该模型。据不完全统计,目前已有16家券商、10余家公募基金公司以及多家银行和保险机构宣布接入或部署DeepSeek大模型,金融行业对AI技术的热情正在全面升温。
金融机构竞相拥抱DeepSeek
在券商行业,国金证券、兴业证券、广发证券等16家券商已积极推进DeepSeek-R1或V3等版本的部署。国金证券表示,将DeepSeek应用于信息检索、文档处理、行业研究及市场分析等多个场景,未来还计划进一步拓展至智能服务、风险管理、投资分析等核心业务领域。
公募基金行业同样热情高涨。包括汇添富、富国基金、诺安基金在内的10余家公募基金公司宣布已部署DeepSeek大模型,主要应用于投研分析、知识查询、产品销售、客户服务等核心业务场景。
银行业方面,邮储银行、江苏银行、南京银行、北京银行、海安农商银行、重庆农村商业银行等多家银行机构也在积极探索DeepSeek的应用场景。江苏银行通过应用DeepSeek-R1推理模型,实现了邮件分类、产品匹配、交易录入、估值表解析对账全链路自动化处理,识别成功率达90%以上,每天可减少9.68小时工作量。北京银行更宣布,2024年底,该行联合华为率先引入部署DeepSeek系列大模型,探索DeepSeek大模型在金融领域的应用,目前已在AIB平台京行研究、京行智库、客服助手、京客图谱等多个关键业务场景中试点应用,大幅提升了知识驱动的模型服务质量和效率,为银行智能化发展注入强劲动力。
邮储银行将DeepSeek大模型应用于企业级多模态智能问答助手 “小邮助手”,新增逻辑推理功能,增强精准服务效能;通过包括深度分析在内的功能,精准识别用户需求,提供个性化和场景化的服务方案;借助高效推理性能,加快响应速度和任务处理效率。
保险行业同样紧随其后。新华保险、中国平安等险资企业已宣布在探索相关应用场景,如新华保险员工可利用DeepSeek接口进行日程管理、群发收集等工作,也可初步提供保险销售方案。
此外,中信消金基于自主研发的“信智”一站式大模型服务平台接入DeepSeek大模型,并率先应用于智能质检与知识库检索两大业务场景,成为首批接入前沿领先AI大模型的消费金融公司。
DeepSeek带来的技术创新与挑战
DeepSeek之所以能在短时间内引发金融业如此热烈的反响,主要得益于其在技术创新和成本优化方面的突出表现。据中银研究院分析,DeepSeek模型采用了MoE(混合专家)和MLA(多头潜在注意力)架构,通过纯强化学习(RL)训练等方法,大幅提升了模型性能和训练效率。
在性能表现方面,DeepSeek-V3在多项评测中超越了Meta旗下Llama-3.1-405B等其他开源模型,甚至在某些任务上与OpenAI的GPT-4o、Anthropic的Claude-3.5-Sonnet等顶尖闭源模型相当。而在成本方面,DeepSeek-V3的总训练成本约为557.6万美元,仅为Llama-3.1训练成本的1/10,GPT-4o训练成本的1/18。
然而,DeepSeek的应用也面临一些挑战。一位业内人士指出,金融业对数据安全的要求较高,尤其是直接面向客户的业务更应谨慎。当前,大模型输出仍存在不可控性,对其产生的内容应当进行复核。
香颂资本执行董事沈萌表示,为避免AI生成的虚假信息干扰,机构需要对提示词进行更加专业、细致和全面的训练,才能获得更准确、真实的结果。
推动金融科技发展迈向新阶段
DeepSeek的出现不仅为金融机构带来了新的技术工具,更推动了整个金融科技行业的发展。中银研究院认为,DeepSeek为我国生成式AI行业发展带来多项利好,助推行业发展迈向新阶段。
首先,DeepSeek的开源策略有助于推动技术进步,为我国AI开发者提供更强助力,促进各厂商在相关领域进行更多探索。其次,DeepSeek的成功给我国芯片、数据等AI基础设施相关行业带来发展机遇,有望带动国产芯片和高质量数据产业的发展。最后,DeepSeek模型能够提供更高性价比的API服务,可能带来AI推理模型新一轮降价,从而降低AI应用开发门槛,加快AI应用落地和商业化进程。
面对这一新趋势,金融机构应积极融入并支持生成式AI行业发展。中银研究院建议,金融机构可以结合DeepSeek等大模型实现的最新技术功能,研究在经营管理中的更多应用场景;做好相关基础设施的布局完善;积极参与生成式AI行业生态创建;加大对生成式AI行业发展的金融支持。