中信证券：建议未来两个季度内年重点配置高质量训练数据构建、多模态大模型研发、MoE等新型架构创新、算力基础设施升级等领域的优质标的

2024-04-23 08:36:59

金融界

关注

获赞

粉丝

喜欢

— 分享 —

中信证券研报表示，Meta于北京时间2024年4月18日开源了最新的大语言模型LLaMA-3，提供了8B、70B和400B+三个版本的Dense模型。其中70B版本的性能已达GPT-3.5+水平，逼近GPT-4，而400B+版本有望进一步缩小与GPT-4的差距。LLaMA-3打破了业界对Chinchilla定律的认知，证实了通过持续喂入海量优质数据，即使是8B和70B的小模型也能获得超出预期的能力提升。这为通过小模型+大数据的模式在性能和效率间取得更好平衡提供了新思路。LLaMA-3创新性地使用LLaMA-2模型对训练数据进行质量把控，但代价在于更加高昂的成本。在明确增加训练数据量是提升性能的最好方法的前提下，合成数据或将成为高质量数据获取的主要途径，其发展情况将直接影响开源与闭源模型的差距。商业化方面，Meta已将LLaMA-3应用于全新AI助手，并将通过Facebook、Instagram等平台和AR眼镜推出服务。国内厂商可通过中文化微调迅速获得接近GPT-4水准的基础模型。综上，我们看好LLaMA-3引领的从应用层到算力层的认知智能变革，建议未来两个季度内年重点配置高质量训练数据构建、多模态大模型研发、MoE等新型架构创新、算力基础设施升级等领域的优质标的。

敬告读者：本文为转载发布，不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台，文章或有细微删改。

中信证券：建议未来两个季度内年重点配置高质量训练数据构建、多模态大模型研发、MoE等新型架构创新、算力基础设施升级等领域的优质标的

24小时热点

交易商排行

中信证券：建议未来两个季度内年重点配置高质量训练数据构建、多模态大模型研发、MoE等新型架构创新、算力基础设施升级等领域的优质标的lg...

24小时热点

交易商排行

中信证券：建议未来两个季度内年重点配置高质量训练数据构建、多模态大模型研发、MoE等新型架构创新、算力基础设施升级等领域的优质标的