备案控制台

开发者社区

开发者社区> 问答> 正文

大数据下MongoDB的性能问题

因为MongoDB有数组内嵌文档的数据结构非常适合我们,准备上MongoDB，现在在测试中。发现MongoDB在大数据下性能急剧下降的问题。如我的数据结构：

上面清楚的看到我测试的数据是500W+，我关心的数据类型如里面的Friends的数组，正式上线了会改成如下类型：
"friends": [ {"friendId" : id, "optDate": date, "enable":true},
...
{"friendId" : id, "optDate": date, "enable":true} ]
我现在随机的写了一些数据，friend也建立了索引，对单个的查询{“friends” ： {“$in”:["1234567"]}}都很快[100ms+]，但是用两个以上的数值{“friends” ： {“$in”:["1234567"， “9876543”]}}会非常的慢[8分钟]，而且结合其它条件查询的话都非常的慢。我在单台计算机上测试的，正式的数据大约1000W以上。
像这个的数据量需要多少台机器？我需要注意哪些问题？求助各位讲解一下

展开

收起

落地花开啦 2016-02-07 09:42:43 4017 0

1 条回答

写回答

取消提交回答

落地花开啦

喜欢技术，喜欢努力的人

先查询语句 db.coll.find().explain()
看看是否使用索引。另外充足的内存也是必须的。
而且你现在只是测试，应该不存在其写入锁的问题。当然如果你的应用写入比重比较大的话，
可以考虑shared
另外建议你在查询过程中使用 mongostat 观察状态
在查询是要写入数据比重比较大的话，你真的要考虑shard了。
写入会锁住整个db（希望mongodb尽快把锁粒度降低一些），索引数据是必须要保存在
内存中的，如果虚拟内存这部分数据都装不下，频繁的页面交换会大大影响性能的。
不过按照你的描述不是这个方面的问题。
单个数据查询很快，组合查询就慢，这个就有点难以理解了。
你试试仅仅查询，没有插入操作的时候速度如何？
`db.coll.find({'friends':'1234567'})
db.coll.find({'friends':{'$in':['', '']}}) `

2019-07-17 18:38:51

赞同 1 展开评论打赏

问答分类：

NoSQL 大数据 MongoDB 索引云数据库 MongoDB 版云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute性能云数据库 MongoDB 版性能云原生大数据计算服务 MaxCompute mongodb 云数据库 MongoDB 版大数据

问答地址：

开发者社区 > 数据库 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

为啥datax读大数据计算MaxCompute和HDFS性能差10倍啊？

77

4

0

通过DataWorks将JSON数据从MongoDB迁移至MaxCompute？

43

5

0

DataWorks从MongoDB迁移至MaxCompute在MongoDB上准备测试数据？

41

5

0

DataWorks中JSON数组拆分多条从MongoDB迁移至MaxCompute？

87

4

0

云数据仓库ADB性能怎么样，支不支持大数据量下的join联表查询？

16

0

0

大数据计算MaxCompute tunnel 批量上传一次多大的数据性能最好64M？

38

2

0

大数据计算MaxCompute单表数据量大概 2 亿以上，分页对查询性能有影响吗?

49

1

0

大数据计算MaxCompute odps-jdbc 单表查询性能怎么样呢？有相关的官方文档吗?

34

1

0

DataWorks中odps-jdbc 的查询性能如何呢？

155

1

0

想问一下 DataWorks中mongodb 到 maxcompute 如果我有一个数组比如？

48

3

0

问答排行榜

最热

最新

1 通过阿里云代备案系统进行个人快速备案 2699561

2 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818170

3 据说在家办公的程序员是这样写代码的？ 1792111

4 阿里云开放端口权限 689793

5 《阿里云服务器从入门到精通》—论坛精华帖汇总（2013.8.21更新） 599359

6 如何升级配置 536024

7 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522311

8 【精品问答】python技术1000问(1) 513944

9 Flink Forward Asia 2021 有奖问答 512766

10 Linux Bash严重漏洞修复紧急通知（已全部给出最终修复方案） 456891

11 工信部官网：www.miitbeian.gov.cn打不开解决办法 399459

12 OceanBase 使用动画（持续更新） 359226

13 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329684

14 OSS存储服务-客户端工具 321238

15 为体验实验室取一个新名字。 307158

16 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 303660

17 Win Server 2003-2016 加密勒索事件必打补丁合集 295096

18 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 283449

19 安全组详解，新手必看教程 277225

20 写code还是做管理，开发者如何进行职业规划？ 268251

1 乘风问答官5月排位赛开启！ 187

2 你见过哪些独特的代码注释？ 475

3 你遇到过哪些触发NPE的代码场景？ 384

4 如何让系统具备良好的扩展性？ 1634

5 在JS编程中有哪些常见的编程“套路”或习惯？ 1349

6 表单新加了个字段A，历史数据要添加字段A的值问题 231

7 在做程序员的道路上，你掌握了什么关键的概念或技术让你感到自身技能有了显著飞跃？ 1837

8 作为一个经典架构模式，事件驱动在云时代为什么会再次流行呢？ 1489

9 宜搭：提交表单前，如何校验另一张表单的数据？ 330

10 Windows 11系统电脑自动重启后，vscode启动通义灵码插件报错：此应用无法在你的电脑上运行 130

11 如何看待首个 AI 程序员入职科技公司？ 2153

12 未启用对服务器的访问 557

13 在图像处理应用场景下，Serverless架构的优势体现在哪些方面？ 1875

14 如何处理线程死循环？ 2538

15 宜搭自定义页面，这个是怎么配置的 240

16 Idea 2024.1RC 报错提示 337

17 宜搭自己写js代码调用html或者jsx打印，宜搭写js代码导出某个容器内容为图片，钉钉端异常。 113

18 如何写出更优雅的并行程序？ 1740

19 你认为一个优秀的技术PM应该具备什么样的能力？ 2184

20 宜搭页面复制问题 410

相关课程

更多

MongoDB精讲课程（上）

288

24

去学习

MongoDB完全自学手册

2574

45

去学习

云数据库MongoDB版使用教程

6195

7

去学习

快速掌握 MongoDB 数据库

7881

22

去学习

MongoDB快速入门

1532

7

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

Data as a Service - 数据即服务 -- MongoDB⾼级应⽤模式 立即下载

开源数据库 MongoDB 专场 MongoDB疑难杂症分析及优化 立即下载

饿了么高级架构师陈东明：MongoDB是如何逐步提高可靠性的 立即下载

相关实验场景

更多