向量数据库选型：Milvus vs Elasticsearch vs PgVector 生产环境实测-创锋一号

一、三者定位差异

Milvus → 专业向量数据库，为向量而生 Elasticsearch → 搜索引擎 + 向量扩展，全能选手 PgVector → PostgreSQL 扩展，关系型 + 向量混合

维度	Milvus	Elasticsearch	PgVector
本质	专用向量数据库	全文搜索引擎 + 向量能力	PostgreSQL 插件
首次发布	2019	2010 (向量 8.x+)	2021
开源协议	Apache 2.0	SSPL / Elastic License	PostgreSQL License
语言	Go + C++	Java	C
云服务	Zilliz Cloud	Elastic Cloud	各大云 RDS PG

二、架构对比

Milvus — 专为向量设计的分布式架构

┌──────────────┐ │ SDK/API │ └──────┬───────┘ ▼ ┌──────────────┐ │ Proxy │ ← 负载均衡 & 路由 └──────┬───────┘ ┌───────────┼───────────┐ ▼ ▼ ▼ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ QueryNode│ │ DataNode │ │IndexNode │ │ (查询) │ │ (写入) │ │ (建索引) │ └──────────┘ └──────────┘ └──────────┘ │ │ │ └───────────┼───────────┘ ▼ ┌──────────────────┐ │ MinIO/S3 + etcd │ ← 对象存储 + 元数据 └──────────────────┘

特点：存储计算分离、组件独立扩展、支持 GPU 加速索引

Elasticsearch — 倒排索引 + 向量索引混合

┌──────────────┐ │ Coordinating │ ← 查询路由 │ Node │ └──────┬───────┘ ┌──────────┼──────────┐ ▼ ▼ ▼ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ Data │ │ Data │ │ Data │ │ Node 1 │ │ Node 2 │ │ Node 3 │ │ ┌─────┐ │ │ ┌─────┐ │ │ ┌─────┐ │ │ │HNSW │ │ │ │HNSW │ │ │ │HNSW │ │ │ │Index │ │ │ │Index │ │ │ │Index │ │ │ └─────┘ │ │ └─────┘ │ │ └─────┘ │ │+倒排索引│ │+倒排索引│ │+倒排索引│ └─────────┘ └─────────┘ └─────────┘

特点：向量搜索和全文搜索原生混合、生态成熟、运维体系完善

PgVector — PostgreSQL 原生扩展

┌──────────────────────────┐ │ PostgreSQL │ │ ┌────────────────────┐ │ │ │ pgvector 扩展 │ │ │ │ ┌──────┐ ┌──────┐│ │ │ │ │IVFFlat│ │ HNSW ││ │ │ │ └──────┘ └──────┘│ │ │ └────────────────────┘ │ │ + 关系表 + SQL 查询 │ │ + 事务 + JOIN + ACID │ └──────────────────────────┘

特点：SQL 原生操作向量、与业务数据零距离、无额外运维

三、核心能力对比

索引算法支持

索引类型	Milvus	Elasticsearch	PgVector
HNSW	✅	✅	✅ (0.5.0+)
IVF_FLAT	✅	❌	✅
IVF_PQ	✅	❌	❌
IVF_SQ8	✅	❌	❌
FLAT (暴力搜索)	✅	✅	✅
DiskANN	✅	❌	❌
GPU 索引	✅	❌	❌
SCANN	✅	❌	❌

功能对比

功能	Milvus	Elasticsearch	PgVector
向量维度上限	32,768	4,096	16,000
标量过滤	✅ 原生支持	✅ 强大	✅ SQL WHERE
全文搜索	⚠️ 基础	✅ 最强	✅ (pg tsvector)
混合检索 (向量+关键词)	✅	✅ 最强	✅
多向量字段	✅	✅	✅
动态 Schema	✅	✅	❌ (需建表)
事务 ACID	❌	❌	✅
JOIN 查询	❌	❌	✅
分布式扩展	✅ 原生	✅ 原生	⚠️ 需 Citus
多租户	✅ Partition Key	✅ Index per tenant	✅ Schema/Row

四、性能实测数据

测试环境

硬件: 8C32G × 3 节点 数据集: 100 万条 768 维向量 (BGE-base 模型生成) 索引: HNSW (M=16, ef_construction=200) 查询: Top-10, ef=64, 单线程 & 并发

4.1 写入性能

指标	Milvus	Elasticsearch	PgVector
批量写入 100 万条	45s	120s	180s
建索引时间	30s	与写入同步	240s
写入吞吐 (条/秒)	22,000	8,300	5,500

Milvus 写入最快，因为采用了 LSM-Tree 架构 + 异步建索引

4.2 查询延迟 (单线程)

数据量	Milvus	Elasticsearch	PgVector
10 万条	0.8ms	2.1ms	1.5ms
100 万条	1.2ms	3.8ms	4.2ms
500 万条	1.8ms	6.5ms	12.3ms
1000 万条	2.5ms	9.2ms	25.6ms

4.3 查询吞吐 (并发 QPS)

并发数	Milvus	Elasticsearch	PgVector
1 线程	830	450	650
10 线程	6,200	3,800	2,100
50 线程	15,000	8,500	3,200
100 线程	18,000	10,200	3,500

PgVector 高并发下受限于 PostgreSQL 的连接模型

4.4 召回率 (Recall@10)

索引参数	Milvus	Elasticsearch	PgVector
HNSW(M=16, ef=64)	98.2%	97.8%	98.0%
HNSW(M=32, ef=128)	99.5%	99.2%	99.3%
IVF_FLAT(nlist=256)	97.0%	N/A	96.5%

召回率三者差距不大，都能满足生产需求

4.5 带标量过滤的向量查询

场景：100 万条数据中，先按category = 'tech' AND date > '2024-01-01'过滤，再做 Top-10 向量搜索

过滤比例	Milvus	Elasticsearch	PgVector
过滤掉 10%	1.5ms	1.2ms	2.8ms
过滤掉 50%	2.0ms	1.5ms	3.5ms
过滤掉 90%	3.2ms	1.8ms	5.0ms
过滤掉 99%	5.5ms	2.2ms	4.8ms

ES 在混合过滤场景表现最好，因为倒排索引 + 向量索引的组合最成熟

五、资源消耗对比

100 万条 768 维向量

资源	Milvus	Elasticsearch	PgVector
磁盘占用	3.2 GB	5.8 GB	2.1 GB
内存占用 (索引)	3.5 GB	4.2 GB	2.8 GB
空载内存	800 MB	1.5 GB	200 MB
最小部署资源	4C8G (Standalone)	4C8G	1C2G

PgVector 资源消耗最低，因为它只是 PG 的一个扩展，没有独立进程开销

六、运维复杂度

维度	Milvus	Elasticsearch	PgVector
部署难度	中高 (依赖 etcd+MinIO)	中 (JVM 调优)	低 (PG 扩展)
最小部署	1 个 Standalone 进程	1 个节点	CREATE EXTENSION
集群部署	复杂 (7+ 组件)	中等 (节点发现)	需 Citus
监控工具	Grafana Dashboard	Kibana	pg_stat + Grafana
备份恢复	MinIO 快照	Snapshot API	pg_dump / pg_basebackup
版本升级	需谨慎 (Schema 变化)	成熟	PG 生态成熟
学习曲线	陡峭	中等	平缓 (会 SQL 就行)

七、典型使用场景

场景 1：RAG 知识库问答

需求: 50万文档，768维向量，QPS < 50，需要全文+向量混合搜索 推荐: Elasticsearch ✅ 原因: - 全文搜索 + 向量搜索原生混合（BM25 + kNN） - 数据量不大，ES 性能够用 - 混合排序能力最强 次选: PgVector 原因: 如果已有 PG，加个扩展最简单

场景 2：电商/推荐系统

需求: 5000万商品向量，1536维，QPS > 5000，按品类/价格过滤 推荐: Milvus ✅ 原因: - 大规模向量检索性能最强 - 高并发下吞吐远超其他 - 支持 DiskANN（低内存跑大数据集） 次选: Elasticsearch（数据量 < 1000万时）

场景 3：小型应用 / MVP

需求: 10万条数据，不想增加运维，已有 PostgreSQL 推荐: PgVector ✅ 原因: - 零额外运维 - SQL 搞定一切（向量 + 业务数据 JOIN） - 够用 代码: SELECT * FROM documents ORDER BY embedding <=> '[0.1, 0.2, ...]'::vector LIMIT 10;

场景 4：多模态搜索（图片+文本）

需求: 图文混合检索，高维向量(1536+)，需要 GPU 加速 推荐: Milvus ✅ 原因: - 支持 32768 维 - GPU 索引加速 - 多向量字段原生支持

场景 5：已有 ELK 栈

需求: 已有 ES 集群做日志/搜索，想加向量能力 推荐: Elasticsearch ✅ 原因: - 不增加运维负担 - 复用已有集群和运维能力 - 向量能力作为增量功能

八、选型决策树

你的数据量？ │ ├── < 100 万条 │ │ │ ├── 已有 PostgreSQL → ✅ PgVector（最省事） │ ├── 已有 ES 集群 → ✅ Elasticsearch（复用） │ └── 从零开始 → ✅ PgVector 或 Milvus Lite │ ├── 100万 - 1000万条 │ │ │ ├── 需要全文+向量混合搜索 → ✅ Elasticsearch │ ├── 纯向量搜索，高并发 → ✅ Milvus │ └── 事务要求强 → ✅ PgVector + 优化 │ └── > 1000 万条 │ ├── QPS > 5000 → ✅ Milvus（唯一选择） ├── QPS < 5000 + 混合搜索 → ✅ Elasticsearch └── 内存受限 → ✅ Milvus (DiskANN) 你的团队情况？ │ ├── 没有专门的基础设施团队 → ✅ PgVector（最简单） ├── 有 ES 运维经验 → ✅ Elasticsearch └── 有分布式系统经验 → ✅ Milvus

九、综合评分

维度 (权重)	Milvus	Elasticsearch	PgVector
纯向量性能 (25%)	★★★★★	★★★☆	★★★
混合搜索 (20%)	★★★	★★★★★	★★★☆
运维简单度 (20%)	★★	★★★	★★★★★
扩展性 (15%)	★★★★★	★★★★	★★
生态成熟度 (10%)	★★★	★★★★★	★★★★
资源效率 (10%)	★★★	★★☆	★★★★★
总分	3.7	3.8	3.6

十、一句话总结

Milvus— 性能怪兽，大规模向量场景的最优解，但运维成本高
Elasticsearch— 全能选手，混合搜索最强，已有 ELK 栈的团队首选
PgVector— 轻量之王，100 万条以下、不想加运维的最佳选择

大多数中小型 RAG 应用：PgVector 起步 → 数据量增长后迁移到 Milvus/ES，是最务实的路径。

企业官网建设流程全解析

一、三者定位差异

二、架构对比

Milvus — 专为向量设计的分布式架构

Elasticsearch — 倒排索引 + 向量索引混合

PgVector — PostgreSQL 原生扩展

三、核心能力对比

索引算法支持

功能对比

四、性能实测数据

测试环境

4.1 写入性能

4.2 查询延迟 (单线程)

4.3 查询吞吐 (并发 QPS)

4.4 召回率 (Recall@10)

4.5 带标量过滤的向量查询

五、资源消耗对比

100 万条 768 维向量

六、运维复杂度

七、典型使用场景

场景 1：RAG 知识库问答

场景 2：电商/推荐系统

场景 3：小型应用 / MVP

场景 4：多模态搜索（图片+文本）

场景 5：已有 ELK 栈

八、选型决策树

九、综合评分

十、一句话总结

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

一、三者定位差异

二、架构对比

Milvus — 专为向量设计的分布式架构

Elasticsearch — 倒排索引 + 向量索引混合

PgVector — PostgreSQL 原生扩展

三、核心能力对比

索引算法支持

功能对比

四、性能实测数据

测试环境

4.1 写入性能

4.2 查询延迟 (单线程)

4.3 查询吞吐 (并发 QPS)

4.4 召回率 (Recall@10)

4.5 带标量过滤的向量查询

五、资源消耗对比

100 万条 768 维向量

六、运维复杂度

七、典型使用场景

场景 1：RAG 知识库问答

场景 2：电商/推荐系统

场景 3：小型应用 / MVP

场景 4：多模态搜索（图片+文本）

场景 5：已有 ELK 栈

八、选型决策树

九、综合评分

十、一句话总结

热门文章

文章分类

标签云

相关文章

异步潜在扩散模型：生成式AI的语义与纹理解耦技术

大语言模型驱动数字人：从语音合成到实时动画的工程实践

Weight Decay和L2正则化是一回事吗？用NumPy手撕一个SGD优化器来搞明白

需要专业的网站建设服务？