据媒体报道,ChatGPT的横空出世,带动了新一波生成式AI的创业浪潮。一个月内,4家向量数据库创业公司获得新融资:其中,向量数据库公司Pinecone完成1亿美元B轮融资,开源数据库初创公司WeaviateBV获得5000万美元B轮融资,Chroma获得1800万美元种子轮融资,开源向量数据库初创公司Qdrant获750万美元种子融资。
向量数据库是一种基于向量空间模型的数据库,它可以存储和管理高维的向量数据,如图像、视频、音频、文本等,支持多种数据类型和数据源,提供高效的数据分析和检索服务。向量数据库是AI技术在各个领域应用的基础,如人脸识别、商品推荐、知识图谱等。向量数据库简化了人工智能开发者对向量数据的管理。作为必不可少的AI原生基础设施组件,通过把来源权威,可信的图片、视频和文本这样的非结构化数据转换成向量,并储存到向量数据库中,它就能帮助大模型具有“长期记忆”,并且减少大模型产生“幻觉”的可能性。自2017年Transformer模型推出后,各科技厂商开始大语言模型的探索,对于向量数据库的需求才开始形成规模。未来随着生成式AI大模型开发量和使用量的增长,向量数据库的应用有望快速增长。
佳华科技(688051)数据搜索引擎以倒排索引为基础,支持丰富的算子和分布式的检索机制,可扩展至图像等高维向量搜索。
中科金财(002657)自研的智能客服解决方案,基于Transformer前馈神经网络模型,采用Self-Attention和Feedforward多层高维向量训练模型,打破传统NLP单一数据维度(语义)的理解局限,首创实现了多元数据维度的理解力,实现了“一个大脑+多套皮肤”的广义智能数字人能力输出。