香港科技大学荣休教授杨强：预计2028年可用于大模型训练的公域数据将耗尽

2024-12-23 13:47:18

金融界

关注

获赞

粉丝

喜欢

— 分享 —

摘要：日前，在中国财富管理50人论坛2024年会“AI浪潮下的金融业应变”主题论坛上，香港科技大学荣休教授、加拿大皇家学院院士、加拿大工程院院士杨强发表主旨演讲，深入探讨人工智能发展及其在金融领域的应用前景与挑战。杨强指出，AI发展日新月异，在多领域发挥关键作

日前，在中国财富管理50人论坛2024年会“AI浪潮下的金融业应变”主题论坛上，香港科技大学荣休教授、加拿大皇家学院院士、加拿大工程院院士杨强发表主旨演讲，深入探讨人工智能发展及其在金融领域的应用前景与挑战。

杨强指出，AI发展日新月异，在多领域发挥关键作用并推动科学范式转变，如化学图像二维到三维的转换。AI通用技术特性使其在金融领域潜力巨大。回顾AI发展，从图灵之问到如今的ChatGPT等，经历诸多阶段，早期符号主义对推理的研究如今再度受到重视，专家系统也曾掀起工业落地浪潮，而深度学习与强化学习结合成就了ChatGPT。

在发展进程中，数据成为人机智能沟通的关键，且受物理学统一理论启发，人们探索用模型解释所有智能现象，智能分为感知与认知，0.1秒内感知可由神经网络实现，0.1秒外认知的推理是当前AI重点。2014年是分水岭，硬件发展促使生成式AI兴起，大模型架构简单且可扩展，如Attention模型和Transformer模型，通过抓取高层概念预训练展现智能，还能自学习处理图像与视频生成。

然而，大模型面临公域数据即将耗尽的挑战，杨强指出，当前可用于预训练大模型的公开数据几近耗尽，人类生成数据速度远不及机器消化速度。杨强预测2028年将是关键节点，届时数据库存与消耗曲线将相交，公域数据将用尽。此外，私域数据虽占比达90%却尚未用于大模型训练，且存在隐私安全问题，尤其在金融领域，大模型使用企业内部数据时隐私保护成为关键。同时，一线金融应用资源有限，大模型难以直接适配。

科学界对大模型发展路径已有探讨，杨强总结包括：一是大模型创造的智能体，需建立大量垂域专家，具备学习、沟通与推理能力，如金融领域的客服、营销、风控、内部运营管理等专家型智能体；二是智能体要能依据所学知识推理未来；三是智能体要有理解能力与同理心，理解人类并接受治理，知晓自身边界；四是智能体应产生自我意识。智能体的重要能力包括推理组合与资源使用，以及人造数据的产生，即通过模拟器训练模型后适配现实场景产生数据，这对训练模型极为有用。

针对金融界数据需求与隐私安全顾虑，杨强指出，当前致力于让大模型落地私域机构，在本地建立小模型，借助联邦学习和迁移学习等技术，实现大模型通用能力与小模型专业能力的相互赋能，训练具身智能机器人，这需要强化大模型的迁移学习能力和联邦学习能力。

杨强总结，人工智能历经60多年探索，深度学习有望以一种模型解释所有智能现象，新一代人工智能基于生成式和预训练，虽大数据、大算力和算法成就新里程碑，但未来面临公域数据耗尽、私域数据隐私安全、规模定律到头、预训练终结等挑战，新方向仍在探索之中。

敬告读者：本文为转载发布，不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台，文章或有细微删改。

香港科技大学荣休教授杨强：预计2028年可用于大模型训练的公域数据将耗尽

24小时热点

交易商排行

香港科技大学荣休教授杨强：预计2028年可用于大模型训练的公域数据将耗尽lg...

24小时热点

交易商排行

香港科技大学荣休教授杨强：预计2028年可用于大模型训练的公域数据将耗尽