全球数字财富领导者

香港科技大学荣休教授杨强:预计2028年可用于大模型训练的公域数据将耗尽

2024-12-23 13:47:18
金融界
金融界
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:日前,在中国财富管理50人论坛2024年会“AI浪潮下的金融业应变”主题论坛上,香港科技大学荣休教授、加拿大皇家学院院士、加拿大工程院院士杨强发表主旨演讲,深入探讨人工智能发展及其在金融领域的应用前景与挑战。杨强指出,AI发展日新月异,在多领域发挥关键作

日前,在中国财富管理50人论坛2024年会“AI浪潮下的金融业应变”主题论坛上,香港科技大学荣休教授、加拿大皇家学院院士、加拿大工程院院士杨强发表主旨演讲,深入探讨人工智能发展及其在金融领域的应用前景与挑战。

杨强指出,AI发展日新月异,在多领域发挥关键作用并推动科学范式转变,如化学图像二维到三维的转换。AI通用技术特性使其在金融领域潜力巨大。回顾AI发展,从图灵之问到如今的ChatGPT等,经历诸多阶段,早期符号主义对推理的研究如今再度受到重视,专家系统也曾掀起工业落地浪潮,而深度学习与强化学习结合成就了ChatGPT。

在发展进程中,数据成为人机智能沟通的关键,且受物理学统一理论启发,人们探索用模型解释所有智能现象,智能分为感知与认知,0.1秒内感知可由神经网络实现,0.1秒外认知的推理是当前AI重点。2014年是分水岭,硬件发展促使生成式AI兴起,大模型架构简单且可扩展,如Attention模型和Transformer模型,通过抓取高层概念预训练展现智能,还能自学习处理图像与视频生成。

然而,大模型面临公域数据即将耗尽的挑战,杨强指出,当前可用于预训练大模型的公开数据几近耗尽,人类生成数据速度远不及机器消化速度。杨强预测2028年将是关键节点,届时数据库存与消耗曲线将相交,公域数据将用尽。此外,私域数据虽占比达90%却尚未用于大模型训练,且存在隐私安全问题,尤其在金融领域,大模型使用企业内部数据时隐私保护成为关键。同时,一线金融应用资源有限,大模型难以直接适配。

科学界对大模型发展路径已有探讨,杨强总结包括:一是大模型创造的智能体,需建立大量垂域专家,具备学习、沟通与推理能力,如金融领域的客服、营销、风控、内部运营管理等专家型智能体;二是智能体要能依据所学知识推理未来;三是智能体要有理解能力与同理心,理解人类并接受治理,知晓自身边界;四是智能体应产生自我意识。智能体的重要能力包括推理组合与资源使用,以及人造数据的产生,即通过模拟器训练模型后适配现实场景产生数据,这对训练模型极为有用。

针对金融界数据需求与隐私安全顾虑,杨强指出,当前致力于让大模型落地私域机构,在本地建立小模型,借助联邦学习和迁移学习等技术,实现大模型通用能力与小模型专业能力的相互赋能,训练具身智能机器人,这需要强化大模型的迁移学习能力和联邦学习能力。

杨强总结,人工智能历经60多年探索,深度学习有望以一种模型解释所有智能现象,新一代人工智能基于生成式和预训练,虽大数据、大算力和算法成就新里程碑,但未来面临公域数据耗尽、私域数据隐私安全、规模定律到头、预训练终结等挑战,新方向仍在探索之中。

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go