向量数据库王冠易主！李开复的零一万物支棱起来了

3 月 11 日，龙抬头之日，零一万物宣布成功研发其基于全导航图技术打造的新型向量数据库“笛卡尔（Descartes）”，并包揽权威榜单 ANN-Benchmarks 的 6 项数据集评测第一名。

这标志着向量数据库排行榜的头号交椅再次易主。

笛卡尔包揽 6 项第一

向量数据库，又被称为 AI 时代的信息检索技术，是检索增强生成（Retrieval-Augmented Generation, RAG）内核技术之一。

ANN-Benchmarks 是当下业界最权威的向量数据库性能测试工具，它可以展示不同算法在不同真实数据集下的表现。

在 ANN-Benchmarks 离线测试中，零一万物笛卡尔（Descartes）向量数据库登顶 6 份数据集评测第一名，比之前榜单上同业第一名有显著性能提升，部分数据集上的性能提升甚至超过 2 倍以上。

由图可见，零一万物向量数据库在 6 份评测数据集中都位于最高，曲线位置越偏右上角意味着算法性能越好，笛卡尔包揽 6 项第一。

此前，榜单里六个数据集的榜首分属于两家厂商，而笛卡尔的包揽结束了这种“分庭抗礼”的局面，成为了大一统的“新王”。

关于零一万物

零一万物，是 2023 年初由李开复创办的 AI 公司。零一万物已经获得数轮融资，估值已超 10 亿美元，跻身 AI 2.0 独角兽行列。

大家对李开复也并不陌生。计算机科学家出身，他的职业生涯起步于硅谷，先后任职于微软、谷歌等，后来创立了创新工场，以投资 AI 为人熟知。

零一万物聚集的技术团队实力彪悍。团队成员涉及大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。联创团队成员包含前阿里巴巴副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco/副总裁，算法和产品团队背景均来自国内外大厂。

2023 年 11 月，零一万物曾发布首款开源中英双语大模型“Yi”。

背后的技术揭秘

回归本次主题。RAG 向量检索主要解决两大问题：一，分别是通过建立某种索引结构，减少检索考察的候选集。二、降低单个向量计算的复杂度。

对于第一个问题，零一万物团队给出量大策略：

全导航图技术。零一万物研发的全局多层缩略图导航技术，图上坐标系导航，既能保证精度，又能裁剪大量无关向量。

自适应邻居选择策略，填补业界空白。零一万物自研的自适应邻居选择新策略，使每个节点可以根据自身及邻居的分布特征动态地选取最佳邻居边，更快收敛接近目标向量，从而让 RAG 向量检索性能提高 15%-30%。

对于“降低单个向量计算的复杂度”的问题，零一万物采用了两级量化方案增强 RAG。

通过用两级量化降低计算复杂度，同时列式存储充分利用 SIMD 的并发能力，进一步发挥硬件能力，相比传统 PQ 查表，性能得到大幅提升到 2-3 倍。

还有索引结构优化、连通性保障等全栈向量技术方案提高笛卡尔向量数据库的性能。

解决大模型当下缺陷

对大模型应用开发者来说，向量数据库是非常重要的基础设施，在一定程度上影响着大模型的性能表现。

比如，向量数据库能精准解决大模型当前阶段下的重要问题：

实时信息：大模型无法反应最新的信息。向量数据库采用轻量化更新机制，可以快速补充最新信息。

隐私保护：用户的安全隐私数据有泄密风险。向量数据通过在推理阶段扮演信息传递的中间载体，破解了隐私保护的难关。

幻觉矫正：大模型常推理失真或产生幻觉。向量数据库提供的丰富知识参照，有效矫正和减轻此类问题。

推理高效：大模型推理成本高，向量数据库能够作为一种缓存机制，避免每一次查询请求都需要重新执行复杂的推理计算，节省计算资源。

伴随 AI 热风，向量数据库创业公司也异军突起。比如，2023 年，OpenAI 的向量数据库合作方 Pinecone 完成了 B 轮 1.38 亿美元融资，国内初创企业 Fabarta ArcNeural 也完成了上亿元 Pre-A 轮融资。

笛卡尔将在近期亮相AI产品中

关于数据的重要性，有个十分形象的比喻：信息时代的数据，就是工业时代的石油。未来，向量数据库，将成为决定大模型天花板的关键要素。

零一万物笛卡尔向量数据库目前聚焦于高性能向量数据库，在实际应用场景中具备超高精度、超高性能核心优势。

超高精度：基于多层缩略图和坐标系实现层间导航和图上方位导航，以及图连通性保障，实现精度大于 99%，相同性能下，精度大幅领先业内水平。

超高性能：高效的边选择和裁剪技术，千万数据库 ms 响应。

具体来说，高性能向量数据库可以帮助企业客户构建私域知识库、智能客服系统；在自动驾驶领域，使用高性能向量数据库可来加速自动驾驶模型训练等。

零一万物表示，笛卡尔向量数据库将用在近期即将正式亮相的 AI 产品中，未来也将结合工具提供给开发者。

向量数据库王冠易主！李开复的零一万物支棱起来了

作者: 主编Tom

联系我们

微信扫一扫关注我们

作者: 主编Tom

为您推荐

百度智驾大拿李震宇创业，又一个具身智能明星团队

第二届智能车载光峰会举行：光智交融，助力智能汽车产业繁荣发展

2025年，自动驾驶即将开“卷”的端到端大模型 2.0 – VLA (Vision Language Action)

IBM研发共封装光学技术，加速AI模型训练

Agent智能体，打响中国大模型落地产业第一枪

为阻止AI行骗，Anthropic决定给它聘用“首席福利官”

联系我们

微信扫一扫关注我们