MongoDB数据模型设计最佳实践：如何避免常见陷阱并提升查询性能

引言

MongoDB作为一款流行的NoSQL文档型数据库，其灵活的数据模型设计为开发者提供了巨大的自由度。然而，这种灵活性也带来了设计上的挑战。不当的数据模型设计可能导致查询性能下降、存储空间浪费以及维护困难。本文将深入探讨MongoDB数据模型设计的最佳实践，帮助您避免常见陷阱并提升查询性能。

理解MongoDB数据模型的核心概念

文档模型的优势与挑战

MongoDB使用BSON（Binary JSON）格式存储数据，每个文档都是一个自包含的数据单元。这种模型的优势在于：

灵活性：无需预定义表结构，可以动态添加字段
嵌套能力：支持复杂的数据结构，减少表连接操作
接近应用对象：数据结构可以与应用程序中的对象保持一致

然而，这些优势也带来了挑战：

数据冗余：嵌套文档可能导致数据重复存储
更新复杂性：更新嵌套文档可能需要重写整个文档
查询优化：需要精心设计索引和查询模式

MongoDB数据类型概述

MongoDB支持多种数据类型，包括：

基本类型：字符串、整数、布尔值、日期等
复合类型：数组、嵌套文档
特殊类型：ObjectId、Binary Data、Timestamp等

正确选择数据类型对性能有重要影响。例如，使用日期类型而非字符串存储日期，可以更高效地进行范围查询。

数据模型设计原则

1. 优先考虑查询模式

设计数据模型时，应首先分析应用程序的查询需求。考虑以下问题：

最常见的查询是什么？
哪些字段经常被过滤、排序或分组？
查询是否需要跨多个集合？

示例：假设有一个博客系统，主要查询包括：

按作者查找文章
按类别查找文章
查找最近发布的文章

基于这些查询，可以设计如下文档结构：

// 文章文档 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b4567"), "title": "MongoDB数据模型设计最佳实践", "content": "详细内容...", "author": { "id": ObjectId("5f9d1b9a8c6e7a3e8c8b4568"), "name": "张三", "email": "zhangsan@example.com" }, "categories": ["数据库", "NoSQL", "MongoDB"], "publishDate": ISODate("2023-10-25T08:00:00Z"), "tags": ["性能优化", "数据模型", "最佳实践"], "stats": { "views": 1500, "likes": 230, "comments": 45 } }

2. 平衡嵌入与引用

MongoDB提供两种主要方式来关联数据：

嵌入（Embedding）

将相关数据存储在同一个文档中。

优点：

单次查询即可获取所有相关数据
原子更新（更新操作是文档级别的）
数据局部性提高读取性能

缺点：

文档可能变得过大（最大16MB）
数据重复（如果被多个父文档引用）
更新需要重写整个文档

引用（Referencing）

使用引用（通常是ObjectId）关联不同文档。

优点：

避免数据冗余
适合大数据集或频繁更新的数据
可以独立管理关联数据

缺点：

需要多次查询或使用聚合管道（$lookup）
可能导致复杂的一致性管理

选择指南：

1:1关系：通常嵌入，除非文档可能超过16MB或子文档独立访问
1:Many关系：如果“多”方数据较小且总是与“一”方一起查询，嵌入；否则引用
Many:Many关系：通常使用引用，可能需要中间集合

示例：订单系统设计

// 嵌入方式（适合订单项不经常单独访问） { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b4569"), "orderId": "ORD-2023-001", "customer": { "id": ObjectId("5f9d1b9a8c6e7a3e8c8b456a"), "name": "李四", "address": "北京市朝阳区..." }, "orderDate": ISODate("2023-10-25T10:30:00Z"), "items": [ { "productId": "P001", "name": "MongoDB权威指南", "quantity": 2, "price": 89.00 }, { "productId": "P002", "name": "Node.js实战", "quantity": 1, "price": 79.00 } ], "totalAmount": 257.00, "status": "已发货" } // 引用方式（适合需要独立访问订单项的场景） // 订单集合 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b4569"), "orderId": "ORD-2023-001", "customerId": ObjectId("5f9d1b9a8c6e7a3e8c8b456a"), "orderDate": ISODate("2023-10-25T10:30:00Z"), "items": [ ObjectId("5f9d1b9a8c6e7a3e8c8b456b"), ObjectId("5f9d1b9a8c6e7a3e8c8b456c") ], "totalAmount": 257.00, "status": "已发货" } // 订单项集合 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b456b"), "orderId": ObjectId("5f9d1b9a8c6e7a3e8c8b4569"), "productId": "P001", "name": "MongoDB权威指南", "quantity": 2, "price": 89.00 }

3. 优化文档大小

MongoDB文档大小限制为16MB。过大的文档会导致：

插入/更新性能下降
内存使用增加
网络传输开销增大

优化策略：

分离大数据集到子集合
使用GridFS存储大文件（如图片、视频）
避免过度嵌套
只存储必要字段

示例：用户文档优化

// 不推荐：包含大量历史记录的用户文档 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b456d"), "username": "user123", "email": "user123@example.com", "profile": { /* ... */ }, "loginHistory": [ /* 可能包含数千条记录 */ ], "orderHistory": [ /* 可能包含数千条记录 */ ] } // 推荐：分离历史记录到独立集合 // 用户集合 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b456d"), "username": "user123", "email": "user123@example.com", "profile": { /* ... */ }, "stats": { "loginCount": 150, "lastLogin": ISODate("2023-10-25T09:00:00Z"), "orderCount": 45 } } // 登录历史集合（按用户分片） { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b456e"), "userId": ObjectId("5f9d1b9a8c6e7a3e8c8b456d"), "loginTime": ISODate("2023-10-25T09:00:00Z"), "ipAddress": "192.168.1.100", "userAgent": "Mozilla/5.0..." } // 订单历史集合 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b456f"), "userId": ObjectId("5f9d1b9a8c6e7a3e8c8b456d"), "orderId": ObjectId("5f9d1b9a8c6e7a3e8c8b4569"), "orderDate": ISODate("2023-10-25T10:30:00Z"), "totalAmount": 257.00, "status": "已发货" }

4. 设计高效的索引策略

索引是提升查询性能的关键。MongoDB支持多种索引类型：

单字段索引：最简单的索引类型
复合索引：多个字段组合的索引
多键索引：针对数组字段的索引
文本索引：全文搜索
地理空间索引：地理坐标查询
TTL索引：自动过期数据

索引设计原则：

分析查询模式：使用explain()分析查询执行计划
覆盖查询：创建包含所有查询字段的索引，避免回表
顺序重要性：复合索引中字段顺序影响性能
基数原则：选择性高的字段放在前面
避免过多索引：每个索引都会增加写操作开销

示例：复合索引设计

// 查询：按类别和发布日期查找文章 db.articles.find({ "categories": "MongoDB", "publishDate": { "$gte": ISODate("2023-01-01T00:00:00Z") } }).sort({ "publishDate": -1 }) // 推荐索引：类别在前，因为它的选择性更高 db.articles.createIndex({ "categories": 1, "publishDate": -1 }) // 不推荐的索引顺序 db.articles.createIndex({ "publishDate": -1, "categories": 1 })

5. 处理时间序列数据

时间序列数据（如监控指标、日志）在MongoDB中很常见。设计这类数据时需要考虑：

时间分桶（Bucketing）：将多个时间点数据存储在一个文档中
索引优化：为时间字段创建索引
分片策略：按时间范围分片

示例：传感器数据存储

// 不推荐：每个读数一个文档（可能产生数十亿文档） { "sensorId": "S001", "timestamp": ISODate("2023-10-25T10:00:00Z"), "temperature": 23.5, "humidity": 45.2 } // 推荐：时间分桶（每小时一个文档） { "sensorId": "S001", "bucket": "2023-10-25T10:00:00Z", // 桶开始时间 "measurements": [ { "t": ISODate("2023-10-25T10:00:00Z"), "temp": 23.5, "hum": 45.2 }, { "t": ISODate("2023-10-25T10:05:00Z"), "temp": 23.7, "hum": 45.0 }, { "t": ISODate("2023-10-25T10:10:00Z"), "temp": 23.9, "hum": 44.8 } // ... 更多读数 ], "count": 12, // 桶内读数数量 "avgTemp": 23.7, // 预聚合数据 "minTemp": 23.5, "maxTemp": 24.1 } // 索引设计 db.sensorData.createIndex({ "sensorId": 1, "bucket": 1 })

常见陷阱与解决方案

陷阱1：过度嵌套

问题：文档嵌套层级过深，导致查询和更新复杂。

解决方案：

限制嵌套层级（通常不超过3-4层）
对于深层嵌套，考虑使用引用

示例：

// 问题：过度嵌套 { "company": "TechCorp", "departments": [ { "name": "研发部", "teams": [ { "name": "后端组", "members": [ { "name": "张三", "skills": ["MongoDB", "Node.js", "Python"], "projects": [ { "name": "API网关", "status": "进行中", "tasks": [ /* 可能又有多层嵌套 */ ] } ] } ] } ] } ] } // 改进：适当扁平化 // 公司集合 { "_id": ObjectId("..."), "name": "TechCorp" } // 部门集合 { "_id": ObjectId("..."), "companyId": ObjectId("..."), "name": "研发部" } // 团队集合 { "_id": ObjectId("..."), "departmentId": ObjectId("..."), "name": "后端组" } // 员工集合 { "_id": ObjectId("..."), "teamId": ObjectId("..."), "name": "张三", "skills": ["MongoDB", "Node.js"] } // 项目集合 { "_id": ObjectId("..."), "ownerId": ObjectId("..."), "name": "API网关", "status": "进行中" }

陷阱2：不合理的数组大小

问题：数组字段无限增长，导致文档过大。

解决方案：

限制数组大小（如最近100条记录）
分离历史数据到独立集合
使用分页技术

示例：

// 问题：无限增长的数组 { "userId": ObjectId("..."), "username": "user123", "notifications": [ // 可能积累数千条通知 ] } // 改进1：限制数组大小（仅保留最近100条） { "userId": ObjectId("..."), "username": "user123", "notifications": [ // 仅最近100条 ], "notificationCount": 1500 // 总数记录 } // 改进2：分离到独立集合 // 用户集合 { "userId": ObjectId("..."), "username": "user123", "unreadCount": 5 } // 通知集合 { "userId": ObjectId("..."), "message": "新消息", "timestamp": ISODate("..."), "read": false } // 索引 db.notifications.createIndex({ "userId": 1, "timestamp": -1 })

陷阱3：不合理的分片键选择

问题：分片键选择不当导致热点问题或查询效率低下。

解决方案：

选择高基数（cardinality）字段
避免单调递增字段（如时间戳、ObjectId）
考虑查询模式

示例：

// 问题：使用单调递增的ObjectId作为分片键 sh.shardCollection("db.logs", { "_id": 1 }) // 所有新数据都写入最后一个分片 // 改进1：使用复合分片键 sh.shardCollection("db.logs", { "region": 1, "timestamp": 1 }) // 地理区域+时间戳 // 改进2：使用哈希分片 sh.shardCollection("db.logs", { "_id": "hashed" }) // 均匀分布

陷阱4：忽略文档大小增长

问题：文档初始大小合理，但随着更新逐渐增大，最终超过16MB限制。

解决方案：

预估文档增长
避免在文档中存储大字段（如图片、文件）
使用GridFS存储大文件

示例：

// 问题：用户文档可能无限增长 { "userId": ObjectId("..."), "username": "user123", "profile": { "avatar": "base64编码的图片", // 可能很大 "bio": "个人简介", "history": [ /* 可能无限增长 */ ] } } // 改进：分离大字段和历史数据 // 用户集合 { "userId": ObjectId("..."), "username": "user123", "profile": { "avatarId": ObjectId("..."), // 引用GridFS文件 "bio": "个人简介" } } // 使用GridFS存储头像 // 使用独立集合存储历史记录

陷阱5：不合理的数据类型选择

问题：使用错误的数据类型影响查询性能和存储效率。

解决方案：

使用正确的数据类型（日期、数字、布尔值等）
避免在数字字段使用字符串
使用枚举值代替长字符串

示例：

// 问题：数据类型不当 { "orderId": "ORD-2023-001", // 字符串 "orderDate": "2023-10-25T10:30:00Z", // 字符串 "totalAmount": "257.00", // 字符串 "status": "已发货", // 字符串 "priority": "高" // 字符串 } // 改进：使用正确的数据类型 { "orderId": "ORD-2023-001", // 订单号可以是字符串 "orderDate": ISODate("2023-10-25T10:30:00Z"), // 日期类型 "totalAmount": 257.00, // 数字类型 "status": "shipped", // 枚举值（英文） "priority": 3 // 数字优先级（1-5） } // 索引优势：日期类型可以高效范围查询 db.orders.find({ "orderDate": { "$gte": ISODate("2023-01-01T00:00:00Z") } })

高级设计模式

1. 大数据集优化模式

分块模式（Chunking）

将大数据集分成多个文档存储。

// 用户文档分块 // 用户基本信息 { "_id": ObjectId("..."), "username": "user123", "email": "user123@example.com", "chunkIndex": 0 // 当前活跃块 } // 数据块1 { "userId": ObjectId("..."), "chunkId": 0, "data": { /* 大量数据 */ } } // 数据块2 { "userId": ObjectId("..."), "chunkId": 1, "data": { /* 更多数据 */ } }

桶模式（Bucket Pattern）

用于时间序列数据，如前所述。

2. 反范式化模式

在MongoDB中，适度的反范式化（数据冗余）可以提升性能。

// 范式化设计（需要连接） // 订单集合 { "_id": ObjectId("..."), "customerId": ObjectId("..."), "items": [ { "productId": ObjectId("..."), "quantity": 2 } ] } // 客户集合 { "_id": ObjectId("..."), "name": "张三", "address": "北京市朝阳区..." } // 反范式化设计（减少连接） // 订单集合 { "_id": ObjectId("..."), "customerId": ObjectId("..."), "customerName": "张三", // 冗余存储 "customerAddress": "北京市朝阳区...", // 冗余存储 "items": [ { "productId": ObjectId("..."), "productName": "MongoDB权威指南", // 冗余存储 "quantity": 2, "price": 89.00 } ] }

3. 预聚合模式

预先计算和存储聚合结果，减少实时计算开销。

// 原始数据：用户行为日志 { "userId": ObjectId("..."), "action": "click", "page": "首页", "timestamp": ISODate("...") } // 预聚合文档 { "userId": ObjectId("..."), "date": ISODate("2023-10-25T00:00:00Z"), "stats": { "pageViews": 150, "clicks": 45, "purchases": 3 }, "topPages": ["首页", "产品页", "购物车"] }

性能优化技巧

1. 查询优化

使用投影减少数据传输

// 只返回需要的字段 db.articles.find( { "categories": "MongoDB" }, { "title": 1, "publishDate": 1, "_id": 0 } )

使用索引提示

// 强制使用特定索引 db.articles.find({ "categories": "MongoDB" }).hint({ "categories": 1, "publishDate": -1 })

避免全表扫描

// 确保查询使用索引 db.articles.find({ "publishDate": { "$gte": ISODate("2023-01-01T00:00:00Z") } }) // 应该有索引：{ "publishDate": 1 }

2. 写入优化

批量操作

// 批量插入比单条插入更高效 const bulkOps = []; for (let i = 0; i < 1000; i++) { bulkOps.push({ insertOne: { document: { "index": i, "value": Math.random(), "timestamp": new Date() } } }); } db.collection.bulkWrite(bulkOps);

有序 vs 无序插入

// 有序插入（遇到错误停止） db.collection.insertMany([/* 文档数组 */], { ordered: true }) // 无序插入（继续执行，更快） db.collection.insertMany([/* 文档数组 */], { ordered: false })

3. 内存优化

使用TTL索引自动清理旧数据

// 自动30天后删除日志 db.logs.createIndex( { "createdAt": 1 }, { expireAfterSeconds: 2592000 } )

压缩数据

// 使用更小的数据类型 { "value": NumberInt(100), // 32位整数 "value2": NumberLong(1000000), // 64位整数 "value3": NumberDecimal("123.45") // 高精度小数 }

监控与调优

1. 使用explain()分析查询

// 查看查询执行计划 db.articles.find({ "categories": "MongoDB" }).explain("executionStats") // 关注： // - executionStats.executionTimeMillis：执行时间 // - executionStats.totalDocsExamined：扫描文档数 // - executionStats.totalKeysExamined：索引扫描数 // - stage：COLLSCAN（全表扫描）vs IXSCAN（索引扫描）

2. 慢查询日志

// 在mongod配置中启用慢查询日志 // mongod.conf setParameter: slowOpThresholdMs: 100 slowOpSampleRate: 0.1

3. 数据库分析器

// 启用分析器（级别1：仅慢查询） db.setProfilingLevel(1, { slowms: 100 }) // 查看分析数据 db.system.profile.find().sort({ ts: -1 }).limit(10)

实际案例：电商系统设计

让我们通过一个完整的电商系统案例来应用上述原则。

需求分析

用户管理
商品浏览和搜索
购物车
订单处理
评论系统
推荐系统

数据模型设计

1. 用户集合（users）

{ "_id": ObjectId("..."), "username": "john_doe", "email": "john@example.com", "passwordHash": "...", "profile": { "firstName": "John", "lastName": "Doe", "avatarId": ObjectId("..."), // GridFS引用 "phone": "+8613800138000", "addresses": [ { "type": "home", "street": "朝阳路123号", "city": "北京", "postalCode": "100025", "default": true } ] }, "preferences": { "categories": ["electronics", "books"], "priceRange": { "min": 100, "max": 5000 } }, "stats": { "orderCount": 15, "totalSpent": 12500.00, "lastLogin": ISODate("2023-10-25T09:30:00Z"), "createdAt": ISODate("2022-01-15T10:00:00Z") }, "status": "active" // active, suspended, deleted } // 索引 db.users.createIndex({ "username": 1 }, { unique: true }) db.users.createIndex({ "email": 1 }, { unique: true }) db.users.createIndex({ "stats.lastLogin": -1 })

2. 商品集合（products）

{ "_id": ObjectId("..."), "sku": "SKU-2023-001", "name": "智能手机 Pro Max", "description": "最新旗舰手机...", "brand": "TechBrand", "category": "electronics/smartphones", "price": 5999.00, "inventory": { "stock": 150, "reserved": 5, "location": "北京仓库" }, "attributes": { "color": ["黑色", "白色", "蓝色"], "storage": ["128GB", "256GB", "512GB"], "specs": { "screen": "6.7英寸 OLED", "battery": "5000mAh", "camera": "108MP" } }, "media": { "images": [ { "id": ObjectId("..."), "url": "...", "primary": true }, { "id": ObjectId("..."), "url": "...", "primary": false } ], "videos": [ { "id": ObjectId("..."), "url": "...", "duration": 120 } ] }, "ratings": { "average": 4.5, "count": 230, "distribution": { "5": 150, "4": 60, "3": 15, "2": 3, "1": 2 } }, "seo": { "metaTitle": "智能手机 Pro Max - 最佳选择", "metaDescription": "购买智能手机 Pro Max...", "tags": ["旗舰", "5G", "拍照"] }, "status": "active", // active, out_of_stock, discontinued "createdAt": ISODate("2023-01-10T08:00:00Z"), "updatedAt": ISODate("2023-10-20T14:30:00Z") } // 索引 db.products.createIndex({ "sku": 1 }, { unique: true }) db.products.createIndex({ "category": 1, "price": 1 }) db.products.createIndex({ "brand": 1, "ratings.average": -1 }) db.products.createIndex({ "seo.tags": 1 }) db.products.createIndex({ "status": 1, "inventory.stock": 1 }) // 全文搜索索引 db.products.createIndex({ "name": "text", "description": "text", "seo.tags": "text" })

3. 购物车集合（carts）

{ "_id": ObjectId("..."), "userId": ObjectId("..."), "items": [ { "productId": ObjectId("..."), "sku": "SKU-2023-001", "name": "智能手机 Pro Max", "price": 5999.00, "quantity": 1, "selectedAttributes": { "color": "黑色", "storage": "256GB" }, "addedAt": ISODate("2023-10-25T09:00:00Z") } ], "summary": { "itemCount": 1, "subtotal": 5999.00, "discount": 0.00, "total": 5999.00 }, "updatedAt": ISODate("2023-10-25T09:00:00Z") } // 索引 db.carts.createIndex({ "userId": 1 }, { unique: true }) db.carts.createIndex({ "updatedAt": 1 }, { expireAfterSeconds: 2592000 }) // 30天自动清理

4. 订单集合（orders）

{ "_id": ObjectId("..."), "orderNumber": "ORD-2023-1025-001", "userId": ObjectId("..."), "customer": { "name": "John Doe", "email": "john@example.com", "phone": "+8613800138000" }, "shippingAddress": { "street": "朝阳路123号", "city": "北京", "postalCode": "100025", "country": "中国" }, "items": [ { "productId": ObjectId("..."), "sku": "SKU-2023-001", "name": "智能手机 Pro Max", "quantity": 1, "unitPrice": 5999.00, "subtotal": 5999.00, "attributes": { "color": "黑色", "storage": "256GB" } } ], "pricing": { "subtotal": 5999.00, "shipping": 0.00, "discount": 0.00, "tax": 599.90, "total": 6598.90 }, "payment": { "method": "credit_card", "status": "paid", "transactionId": "TXN-2023-1025-001", "paidAt": ISODate("2023-10-25T10:30:00Z") }, "shipping": { "carrier": "SF Express", "trackingNumber": "SF123456789CN", "status": "shipped", "shippedAt": ISODate("2023-10-25T14:00:00Z") }, "status": "shipped", // pending, paid, shipped, delivered, cancelled "createdAt": ISODate("2023-10-25T10:25:00Z"), "updatedAt": ISODate("2023-10-25T14:00:00Z") } // 索引 db.orders.createIndex({ "orderNumber": 1 }, { unique: true }) db.orders.createIndex({ "userId": 1, "createdAt": -1 }) db.orders.createIndex({ "status": 1 }) db.orders.createIndex({ "payment.paidAt": 1 }) db.orders.createIndex({ "shipping.trackingNumber": 1 })

5. 评论集合（reviews）

{ "_id": ObjectId("..."), "productId": ObjectId("..."), "userId": ObjectId("..."), "userName": "John Doe", // 冗余存储，避免连接 "rating": 5, "title": "非常满意", "content": "手机性能出色，拍照效果很棒...", "verifiedPurchase": true, "helpful": { "yes": 45, "no": 2 }, "images": [ { "id": ObjectId("..."), "url": "..." } ], "status": "approved", // pending, approved, rejected "createdAt": ISODate("2023-10-22T15:00:00Z") } // 索引 db.reviews.createIndex({ "productId": 1, "createdAt": -1 }) db.reviews.createIndex({ "userId": 1 }) db.reviews.createIndex({ "rating": 1 }) db.reviews.createIndex({ "status": 1 })

6. 推荐集合（recommendations）

{ "_id": ObjectId("..."), "userId": ObjectId("..."), "type": "also_bought", // also_viewed, similar, trending "products": [ ObjectId("..."), ObjectId("..."), ObjectId("...") ], "generatedAt": ISODate("2023-10-25T08:00:00Z"), "expiresAt": ISODate("2023-10-26T08:00:00Z") } // 索引 db.recommendations.createIndex({ "userId": 1, "type": 1 }, { unique: true }) db.recommendations.createIndex({ "expiresAt": 1 }, { expireAfterSeconds: 0 })

关键查询示例

1. 商品搜索（使用全文索引）

// 搜索智能手机 db.products.find({ $text: { $search: "智能手机 5G" } }, { score: { $meta: "textScore" } }).sort({ score: { $meta: "textScore" } }).limit(20)

2. 用户订单历史

// 获取用户最近10个订单 db.orders.find({ "userId": ObjectId("...") }) .sort({ "createdAt": -1 }) .limit(10) .project({ "orderNumber": 1, "createdAt": 1, "pricing.total": 1, "status": 1 })

3. 热门商品（基于评分和销量）

// 聚合查询：计算综合评分 db.products.aggregate([ { $match: { "status": "active" } }, { $addFields: { "compositeScore": { $add: [ { $multiply: ["$ratings.average", 10] }, { $divide: ["$ratings.count", 10] } ] } }}, { $sort: { "compositeScore": -1 } }, { $limit: 10 }, { $project: { "name": 1, "price": 1, "ratings": 1, "compositeScore": 1 } } ])

4. 购物车结算

// 使用聚合管道获取购物车详情 db.carts.aggregate([ { $match: { "userId": ObjectId("...") } }, { $unwind: "$items" }, { $lookup: { from: "products", localField: "items.productId", foreignField: "_id", as: "productDetails" }}, { $unwind: "$productDetails" }, { $project: { "item": "$items", "available": { $gte: ["$productDetails.inventory.stock", "$items.quantity"] }, "currentPrice": "$productDetails.price" }}, { $group: { _id: null, items: { $push: "$$ROOT" }, subtotal: { $sum: { $multiply: ["$item.quantity", "$currentPrice"] } } }} ])

总结

MongoDB数据模型设计是一个需要平衡灵活性、性能和可维护性的过程。关键要点包括：

以查询为中心：根据应用程序的查询模式设计数据模型
合理选择嵌入与引用：根据数据访问模式和关系类型做出选择
控制文档大小：避免文档过大，使用分块或分离策略
精心设计索引：创建合适的索引以支持查询，避免过度索引
考虑数据生命周期：使用TTL索引和归档策略管理旧数据
监控与调优：持续监控性能，使用explain()分析查询

通过遵循这些最佳实践，您可以构建高效、可扩展的MongoDB应用程序，避免常见陷阱，并确保系统长期稳定运行。# MongoDB数据模型设计最佳实践：如何避免常见陷阱并提升查询性能

引言

理解MongoDB数据模型的核心概念

文档模型的优势与挑战

MongoDB使用BSON（Binary JSON）格式存储数据，每个文档都是一个自包含的数据单元。这种模型的优势在于：

灵活性：无需预定义表结构，可以动态添加字段
嵌套能力：支持复杂的数据结构，减少表连接操作
接近应用对象：数据结构可以与应用程序中的对象保持一致

然而，这些优势也带来了挑战：

数据冗余：嵌套文档可能导致数据重复存储
更新复杂性：更新嵌套文档可能需要重写整个文档
查询优化：需要精心设计索引和查询模式

MongoDB数据类型概述

MongoDB支持多种数据类型，包括：

基本类型：字符串、整数、布尔值、日期等
复合类型：数组、嵌套文档
特殊类型：ObjectId、Binary Data、Timestamp等

正确选择数据类型对性能有重要影响。例如，使用日期类型而非字符串存储日期，可以更高效地进行范围查询。

数据模型设计原则

1. 优先考虑查询模式

设计数据模型时，应首先分析应用程序的查询需求。考虑以下问题：

最常见的查询是什么？
哪些字段经常被过滤、排序或分组？
查询是否需要跨多个集合？

示例：假设有一个博客系统，主要查询包括：

按作者查找文章
按类别查找文章
查找最近发布的文章

基于这些查询，可以设计如下文档结构：

// 文章文档 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b4567"), "title": "MongoDB数据模型设计最佳实践", "content": "详细内容...", "author": { "id": ObjectId("5f9d1b9a8c6e7a3e8c8b4568"), "name": "张三", "email": "zhangsan@example.com" }, "categories": ["数据库", "NoSQL", "MongoDB"], "publishDate": ISODate("2023-10-25T08:00:00Z"), "tags": ["性能优化", "数据模型", "最佳实践"], "stats": { "views": 1500, "likes": 230, "comments": 45 } }

2. 平衡嵌入与引用

MongoDB提供两种主要方式来关联数据：

嵌入（Embedding）

将相关数据存储在同一个文档中。

优点：

单次查询即可获取所有相关数据
原子更新（更新操作是文档级别的）
数据局部性提高读取性能

缺点：

文档可能变得过大（最大16MB）
数据重复（如果被多个父文档引用）
更新需要重写整个文档

引用（Referencing）

使用引用（通常是ObjectId）关联不同文档。

优点：

避免数据冗余
适合大数据集或频繁更新的数据
可以独立管理关联数据

缺点：

需要多次查询或使用聚合管道（$lookup）
可能导致复杂的一致性管理

选择指南：

1:1关系：通常嵌入，除非文档可能超过16MB或子文档独立访问
1:Many关系：如果“多”方数据较小且总是与“一”方一起查询，嵌入；否则引用
Many:Many关系：通常使用引用，可能需要中间集合

示例：订单系统设计

// 嵌入方式（适合订单项不经常单独访问） { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b4569"), "orderId": "ORD-2023-001", "customer": { "id": ObjectId("5f9d1b9a8c6e7a3e8c8b456a"), "name": "李四", "address": "北京市朝阳区..." }, "orderDate": ISODate("2023-10-25T10:30:00Z"), "items": [ { "productId": "P001", "name": "MongoDB权威指南", "quantity": 2, "price": 89.00 }, { "productId": "P002", "name": "Node.js实战", "quantity": 1, "price": 79.00 } ], "totalAmount": 257.00, "status": "已发货" } // 引用方式（适合需要独立访问订单项的场景） // 订单集合 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b4569"), "orderId": "ORD-2023-001", "customerId": ObjectId("5f9d1b9a8c6e7a3e8c8b456a"), "orderDate": ISODate("2023-10-25T10:30:00Z"), "items": [ ObjectId("5f9d1b9a8c6e7a3e8c8b456b"), ObjectId("5f9d1b9a8c6e7a3e8c8b456c") ], "totalAmount": 257.00, "status": "已发货" } // 订单项集合 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b456b"), "orderId": ObjectId("5f9d1b9a8c6e7a3e8c8b4569"), "productId": "P001", "name": "MongoDB权威指南", "quantity": 2, "price": 89.00 }

3. 优化文档大小

MongoDB文档大小限制为16MB。过大的文档会导致：

插入/更新性能下降
内存使用增加
网络传输开销增大

优化策略：

分离大数据集到子集合
使用GridFS存储大文件（如图片、视频）
避免过度嵌套
只存储必要字段

示例：用户文档优化

// 不推荐：包含大量历史记录的用户文档 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b456d"), "username": "user123", "email": "user123@example.com", "profile": { /* ... */ }, "loginHistory": [ /* 可能包含数千条记录 */ ], "orderHistory": [ /* 可能包含数千条记录 */ ] } // 推荐：分离历史记录到独立集合 // 用户集合 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b456d"), "username": "user123", "email": "user123@example.com", "profile": { /* ... */ }, "stats": { "loginCount": 150, "lastLogin": ISODate("2023-10-25T09:00:00Z"), "orderCount": 45 } } // 登录历史集合（按用户分片） { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b456e"), "userId": ObjectId("5f9d1b9a8c6e7a3e8c8b456d"), "loginTime": ISODate("2023-10-25T09:00:00Z"), "ipAddress": "192.168.1.100", "userAgent": "Mozilla/5.0..." } // 订单历史集合 { "_id": ObjectId("5f9d1b9a8c6e7a3e8c8b456f"), "userId": ObjectId("5f9d1b9a8c6e7a3e8c8b456d"), "orderId": ObjectId("5f9d1b9a8c6e7a3e8c8b4569"), "orderDate": ISODate("2023-10-25T10:30:00Z"), "totalAmount": 257.00, "status": "已发货" }

4. 设计高效的索引策略

索引是提升查询性能的关键。MongoDB支持多种索引类型：

单字段索引：最简单的索引类型
复合索引：多个字段组合的索引
多键索引：针对数组字段的索引
文本索引：全文搜索
地理空间索引：地理坐标查询
TTL索引：自动过期数据

索引设计原则：

分析查询模式：使用explain()分析查询执行计划
覆盖查询：创建包含所有查询字段的索引，避免回表
顺序重要性：复合索引中字段顺序影响性能
基数原则：选择性高的字段放在前面
避免过多索引：每个索引都会增加写操作开销

示例：复合索引设计

// 查询：按类别和发布日期查找文章 db.articles.find({ "categories": "MongoDB", "publishDate": { "$gte": ISODate("2023-01-01T00:00:00Z") } }).sort({ "publishDate": -1 }) // 推荐索引：类别在前，因为它的选择性更高 db.articles.createIndex({ "categories": 1, "publishDate": -1 }) // 不推荐的索引顺序 db.articles.createIndex({ "publishDate": -1, "categories": 1 })

5. 处理时间序列数据

时间序列数据（如监控指标、日志）在MongoDB中很常见。设计这类数据时需要考虑：

时间分桶（Bucketing）：将多个时间点数据存储在一个文档中
索引优化：为时间字段创建索引
分片策略：按时间范围分片

示例：传感器数据存储

// 不推荐：每个读数一个文档（可能产生数十亿文档） { "sensorId": "S001", "timestamp": ISODate("2023-10-25T10:00:00Z"), "temperature": 23.5, "humidity": 45.2 } // 推荐：时间分桶（每小时一个文档） { "sensorId": "S001", "bucket": "2023-10-25T10:00:00Z", // 桶开始时间 "measurements": [ { "t": ISODate("2023-10-25T10:00:00Z"), "temp": 23.5, "hum": 45.2 }, { "t": ISODate("2023-10-25T10:05:00Z"), "temp": 23.7, "hum": 45.0 }, { "t": ISODate("2023-10-25T10:10:00Z"), "temp": 23.9, "hum": 44.8 } // ... 更多读数 ], "count": 12, // 桶内读数数量 "avgTemp": 23.7, // 预聚合数据 "minTemp": 23.5, "maxTemp": 24.1 } // 索引设计 db.sensorData.createIndex({ "sensorId": 1, "bucket": 1 })

常见陷阱与解决方案

陷阱1：过度嵌套

问题：文档嵌套层级过深，导致查询和更新复杂。

解决方案：

限制嵌套层级（通常不超过3-4层）
对于深层嵌套，考虑使用引用

示例：

// 问题：过度嵌套 { "company": "TechCorp", "departments": [ { "name": "研发部", "teams": [ { "name": "后端组", "members": [ { "name": "张三", "skills": ["MongoDB", "Node.js", "Python"], "projects": [ { "name": "API网关", "status": "进行中", "tasks": [ /* 可能又有多层嵌套 */ ] } ] } ] } ] } ] } // 改进：适当扁平化 // 公司集合 { "_id": ObjectId("..."), "name": "TechCorp" } // 部门集合 { "_id": ObjectId("..."), "companyId": ObjectId("..."), "name": "研发部" } // 团队集合 { "_id": ObjectId("..."), "departmentId": ObjectId("..."), "name": "后端组" } // 员工集合 { "_id": ObjectId("..."), "teamId": ObjectId("..."), "name": "张三", "skills": ["MongoDB", "Node.js"] } // 项目集合 { "_id": ObjectId("..."), "ownerId": ObjectId("..."), "name": "API网关", "status": "进行中" }

陷阱2：不合理的数组大小

问题：数组字段无限增长，导致文档过大。

解决方案：

限制数组大小（如最近100条记录）
分离历史数据到独立集合
使用分页技术

示例：

// 问题：无限增长的数组 { "userId": ObjectId("..."), "username": "user123", "notifications": [ // 可能积累数千条通知 ] } // 改进1：限制数组大小（仅保留最近100条） { "userId": ObjectId("..."), "username": "user123", "notifications": [ // 仅最近100条 ], "notificationCount": 1500 // 总数记录 } // 改进2：分离到独立集合 // 用户集合 { "userId": ObjectId("..."), "username": "user123", "unreadCount": 5 } // 通知集合 { "userId": ObjectId("..."), "message": "新消息", "timestamp": ISODate("..."), "read": false } // 索引 db.notifications.createIndex({ "userId": 1, "timestamp": -1 })

陷阱3：不合理的分片键选择

问题：分片键选择不当导致热点问题或查询效率低下。

解决方案：

选择高基数（cardinality）字段
避免单调递增字段（如时间戳、ObjectId）
考虑查询模式

示例：

// 问题：使用单调递增的ObjectId作为分片键 sh.shardCollection("db.logs", { "_id": 1 }) // 所有新数据都写入最后一个分片 // 改进1：使用复合分片键 sh.shardCollection("db.logs", { "region": 1, "timestamp": 1 }) // 地理区域+时间戳 // 改进2：使用哈希分片 sh.shardCollection("db.logs", { "_id": "hashed" }) // 均匀分布

陷阱4：忽略文档大小增长

问题：文档初始大小合理，但随着更新逐渐增大，最终超过16MB限制。

解决方案：

预估文档增长
避免在文档中存储大字段（如图片、文件）
使用GridFS存储大文件

示例：

// 问题：用户文档可能无限增长 { "userId": ObjectId("..."), "username": "user123", "profile": { "avatar": "base64编码的图片", // 可能很大 "bio": "个人简介", "history": [ /* 可能无限增长 */ ] } } // 改进：分离大字段和历史数据 // 用户集合 { "userId": ObjectId("..."), "username": "user123", "profile": { "avatarId": ObjectId("..."), // 引用GridFS文件 "bio": "个人简介" } } // 使用GridFS存储头像 // 使用独立集合存储历史记录

陷阱5：不合理的数据类型选择

问题：使用错误的数据类型影响查询性能和存储效率。

解决方案：

使用正确的数据类型（日期、数字、布尔值等）
避免在数字字段使用字符串
使用枚举值代替长字符串

示例：

// 问题：数据类型不当 { "orderId": "ORD-2023-001", // 字符串 "orderDate": "2023-10-25T10:30:00Z", // 字符串 "totalAmount": "257.00", // 字符串 "status": "已发货", // 字符串 "priority": "高" // 字符串 } // 改进：使用正确的数据类型 { "orderId": "ORD-2023-001", // 订单号可以是字符串 "orderDate": ISODate("2023-10-25T10:30:00Z"), // 日期类型 "totalAmount": 257.00, // 数字类型 "status": "shipped", // 枚举值（英文） "priority": 3 // 数字优先级（1-5） } // 索引优势：日期类型可以高效范围查询 db.orders.find({ "orderDate": { "$gte": ISODate("2023-01-01T00:00:00Z") } })

高级设计模式

1. 大数据集优化模式

分块模式（Chunking）

将大数据集分成多个文档存储。

// 用户文档分块 // 用户基本信息 { "_id": ObjectId("..."), "username": "user123", "email": "user123@example.com", "chunkIndex": 0 // 当前活跃块 } // 数据块1 { "userId": ObjectId("..."), "chunkId": 0, "data": { /* 大量数据 */ } } // 数据块2 { "userId": ObjectId("..."), "chunkId": 1, "data": { /* 更多数据 */ } }

桶模式（Bucket Pattern）

用于时间序列数据，如前所述。

2. 反范式化模式

在MongoDB中，适度的反范式化（数据冗余）可以提升性能。

// 范式化设计（需要连接） // 订单集合 { "_id": ObjectId("..."), "customerId": ObjectId("..."), "items": [ { "productId": ObjectId("..."), "quantity": 2 } ] } // 客户集合 { "_id": ObjectId("..."), "name": "张三", "address": "北京市朝阳区..." } // 反范式化设计（减少连接） // 订单集合 { "_id": ObjectId("..."), "customerId": ObjectId("..."), "customerName": "张三", // 冗余存储 "customerAddress": "北京市朝阳区...", // 冗余存储 "items": [ { "productId": ObjectId("..."), "productName": "MongoDB权威指南", // 冗余存储 "quantity": 2, "price": 89.00 } ] }

3. 预聚合模式

预先计算和存储聚合结果，减少实时计算开销。

// 原始数据：用户行为日志 { "userId": ObjectId("..."), "action": "click", "page": "首页", "timestamp": ISODate("...") } // 预聚合文档 { "userId": ObjectId("..."), "date": ISODate("2023-10-25T00:00:00Z"), "stats": { "pageViews": 150, "clicks": 45, "purchases": 3 }, "topPages": ["首页", "产品页", "购物车"] }

性能优化技巧

1. 查询优化

使用投影减少数据传输

// 只返回需要的字段 db.articles.find( { "categories": "MongoDB" }, { "title": 1, "publishDate": 1, "_id": 0 } )

使用索引提示

// 强制使用特定索引 db.articles.find({ "categories": "MongoDB" }).hint({ "categories": 1, "publishDate": -1 })

避免全表扫描

// 确保查询使用索引 db.articles.find({ "publishDate": { "$gte": ISODate("2023-01-01T00:00:00Z") } }) // 应该有索引：{ "publishDate": 1 }

2. 写入优化

批量操作

// 批量插入比单条插入更高效 const bulkOps = []; for (let i = 0; i < 1000; i++) { bulkOps.push({ insertOne: { document: { "index": i, "value": Math.random(), "timestamp": new Date() } } }); } db.collection.bulkWrite(bulkOps);

有序 vs 无序插入

// 有序插入（遇到错误停止） db.collection.insertMany([/* 文档数组 */], { ordered: true }) // 无序插入（继续执行，更快） db.collection.insertMany([/* 文档数组 */], { ordered: false })

3. 内存优化

使用TTL索引自动清理旧数据

// 自动30天后删除日志 db.logs.createIndex( { "createdAt": 1 }, { expireAfterSeconds: 2592000 } )

压缩数据

// 使用更小的数据类型 { "value": NumberInt(100), // 32位整数 "value2": NumberLong(1000000), // 64位整数 "value3": NumberDecimal("123.45") // 高精度小数 }

监控与调优

1. 使用explain()分析查询

// 查看查询执行计划 db.articles.find({ "categories": "MongoDB" }).explain("executionStats") // 关注： // - executionStats.executionTimeMillis：执行时间 // - executionStats.totalDocsExamined：扫描文档数 // - executionStats.totalKeysExamined：索引扫描数 // - stage：COLLSCAN（全表扫描）vs IXSCAN（索引扫描）

2. 慢查询日志

// 在mongod配置中启用慢查询日志 // mongod.conf setParameter: slowOpThresholdMs: 100 slowOpSampleRate: 0.1

3. 数据库分析器

// 启用分析器（级别1：仅慢查询） db.setProfilingLevel(1, { slowms: 100 }) // 查看分析数据 db.system.profile.find().sort({ ts: -1 }).limit(10)

实际案例：电商系统设计

让我们通过一个完整的电商系统案例来应用上述原则。

需求分析

用户管理
商品浏览和搜索
购物车
订单处理
评论系统
推荐系统

数据模型设计

1. 用户集合（users）

{ "_id": ObjectId("..."), "username": "john_doe", "email": "john@example.com", "passwordHash": "...", "profile": { "firstName": "John", "lastName": "Doe", "avatarId": ObjectId("..."), // GridFS引用 "phone": "+8613800138000", "addresses": [ { "type": "home", "street": "朝阳路123号", "city": "北京", "postalCode": "100025", "default": true } ] }, "preferences": { "categories": ["electronics", "books"], "priceRange": { "min": 100, "max": 5000 } }, "stats": { "orderCount": 15, "totalSpent": 12500.00, "lastLogin": ISODate("2023-10-25T09:30:00Z"), "createdAt": ISODate("2022-01-15T10:00:00Z") }, "status": "active" // active, suspended, deleted } // 索引 db.users.createIndex({ "username": 1 }, { unique: true }) db.users.createIndex({ "email": 1 }, { unique: true }) db.users.createIndex({ "stats.lastLogin": -1 })

2. 商品集合（products）

{ "_id": ObjectId("..."), "sku": "SKU-2023-001", "name": "智能手机 Pro Max", "description": "最新旗舰手机...", "brand": "TechBrand", "category": "electronics/smartphones", "price": 5999.00, "inventory": { "stock": 150, "reserved": 5, "location": "北京仓库" }, "attributes": { "color": ["黑色", "白色", "蓝色"], "storage": ["128GB", "256GB", "512GB"], "specs": { "screen": "6.7英寸 OLED", "battery": "5000mAh", "camera": "108MP" } }, "media": { "images": [ { "id": ObjectId("..."), "url": "...", "primary": true }, { "id": ObjectId("..."), "url": "...", "primary": false } ], "videos": [ { "id": ObjectId("..."), "url": "...", "duration": 120 } ] }, "ratings": { "average": 4.5, "count": 230, "distribution": { "5": 150, "4": 60, "3": 15, "2": 3, "1": 2 } }, "seo": { "metaTitle": "智能手机 Pro Max - 最佳选择", "metaDescription": "购买智能手机 Pro Max...", "tags": ["旗舰", "5G", "拍照"] }, "status": "active", // active, out_of_stock, discontinued "createdAt": ISODate("2023-01-10T08:00:00Z"), "updatedAt": ISODate("2023-10-20T14:30:00Z") } // 索引 db.products.createIndex({ "sku": 1 }, { unique: true }) db.products.createIndex({ "category": 1, "price": 1 }) db.products.createIndex({ "brand": 1, "ratings.average": -1 }) db.products.createIndex({ "seo.tags": 1 }) db.products.createIndex({ "status": 1, "inventory.stock": 1 }) // 全文搜索索引 db.products.createIndex({ "name": "text", "description": "text", "seo.tags": "text" })

3. 购物车集合（carts）

{ "_id": ObjectId("..."), "userId": ObjectId("..."), "items": [ { "productId": ObjectId("..."), "sku": "SKU-2023-001", "name": "智能手机 Pro Max", "price": 5999.00, "quantity": 1, "selectedAttributes": { "color": "黑色", "storage": "256GB" }, "addedAt": ISODate("2023-10-25T09:00:00Z") } ], "summary": { "itemCount": 1, "subtotal": 5999.00, "discount": 0.00, "total": 5999.00 }, "updatedAt": ISODate("2023-10-25T09:00:00Z") } // 索引 db.carts.createIndex({ "userId": 1 }, { unique: true }) db.carts.createIndex({ "updatedAt": 1 }, { expireAfterSeconds: 2592000 }) // 30天自动清理

4. 订单集合（orders）

{ "_id": ObjectId("..."), "orderNumber": "ORD-2023-1025-001", "userId": ObjectId("..."), "customer": { "name": "John Doe", "email": "john@example.com", "phone": "+8613800138000" }, "shippingAddress": { "street": "朝阳路123号", "city": "北京", "postalCode": "100025", "country": "中国" }, "items": [ { "productId": ObjectId("..."), "sku": "SKU-2023-001", "name": "智能手机 Pro Max", "quantity": 1, "unitPrice": 5999.00, "subtotal": 5999.00, "attributes": { "color": "黑色", "storage": "256GB" } } ], "pricing": { "subtotal": 5999.00, "shipping": 0.00, "discount": 0.00, "tax": 599.90, "total": 6598.90 }, "payment": { "method": "credit_card", "status": "paid", "transactionId": "TXN-2023-1025-001", "paidAt": ISODate("2023-10-25T10:30:00Z") }, "shipping": { "carrier": "SF Express", "trackingNumber": "SF123456789CN", "status": "shipped", "shippedAt": ISODate("2023-10-25T14:00:00Z") }, "status": "shipped", // pending, paid, shipped, delivered, cancelled "createdAt": ISODate("2023-10-25T10:25:00Z"), "updatedAt": ISODate("2023-10-25T14:00:00Z") } // 索引 db.orders.createIndex({ "orderNumber": 1 }, { unique: true }) db.orders.createIndex({ "userId": 1, "createdAt": -1 }) db.orders.createIndex({ "status": 1 }) db.orders.createIndex({ "payment.paidAt": 1 }) db.orders.createIndex({ "shipping.trackingNumber": 1 })

5. 评论集合（reviews）

{ "_id": ObjectId("..."), "productId": ObjectId("..."), "userId": ObjectId("..."), "userName": "John Doe", // 冗余存储，避免连接 "rating": 5, "title": "非常满意", "content": "手机性能出色，拍照效果很棒...", "verifiedPurchase": true, "helpful": { "yes": 45, "no": 2 }, "images": [ { "id": ObjectId("..."), "url": "..." } ], "status": "approved", // pending, approved, rejected "createdAt": ISODate("2023-10-22T15:00:00Z") } // 索引 db.reviews.createIndex({ "productId": 1, "createdAt": -1 }) db.reviews.createIndex({ "userId": 1 }) db.reviews.createIndex({ "rating": 1 }) db.reviews.createIndex({ "status": 1 })

6. 推荐集合（recommendations）

{ "_id": ObjectId("..."), "userId": ObjectId("..."), "type": "also_bought", // also_viewed, similar, trending "products": [ ObjectId("..."), ObjectId("..."), ObjectId("...") ], "generatedAt": ISODate("2023-10-25T08:00:00Z"), "expiresAt": ISODate("2023-10-26T08:00:00Z") } // 索引 db.recommendations.createIndex({ "userId": 1, "type": 1 }, { unique: true }) db.recommendations.createIndex({ "expiresAt": 1 }, { expireAfterSeconds: 0 })

关键查询示例

1. 商品搜索（使用全文索引）

// 搜索智能手机 db.products.find({ $text: { $search: "智能手机 5G" } }, { score: { $meta: "textScore" } }).sort({ score: { $meta: "textScore" } }).limit(20)

2. 用户订单历史

// 获取用户最近10个订单 db.orders.find({ "userId": ObjectId("...") }) .sort({ "createdAt": -1 }) .limit(10) .project({ "orderNumber": 1, "createdAt": 1, "pricing.total": 1, "status": 1 })

3. 热门商品（基于评分和销量）

// 聚合查询：计算综合评分 db.products.aggregate([ { $match: { "status": "active" } }, { $addFields: { "compositeScore": { $add: [ { $multiply: ["$ratings.average", 10] }, { $divide: ["$ratings.count", 10] } ] } }}, { $sort: { "compositeScore": -1 } }, { $limit: 10 }, { $project: { "name": 1, "price": 1, "ratings": 1, "compositeScore": 1 } } ])

4. 购物车结算

// 使用聚合管道获取购物车详情 db.carts.aggregate([ { $match: { "userId": ObjectId("...") } }, { $unwind: "$items" }, { $lookup: { from: "products", localField: "items.productId", foreignField: "_id", as: "productDetails" }}, { $unwind: "$productDetails" }, { $project: { "item": "$items", "available": { $gte: ["$productDetails.inventory.stock", "$items.quantity"] }, "currentPrice": "$productDetails.price" }}, { $group: { _id: null, items: { $push: "$$ROOT" }, subtotal: { $sum: { $multiply: ["$item.quantity", "$currentPrice"] } } }} ])