李岩的博客

Mongodb复制集中一个mongod挂掉后机器起不来，处理方法

2017-11-17T13:07:47+08:00

199宕机。数据无法恢复。
1.将同是shard2的201上的数copy过来。copy之前先停止更新数据。
2.找到剩下的两台机器那个是PRIMARY。在PRIMARY上执行如下操作。
[liyan@cnews197 ~]$ cd /data/support/mongodb-2.0.2/bin
[liyan@cnews197 bin]$ ./mongo -port 15552
MongoDB shell version: 2.0.2
connecting to: 127.0.0.1:15552/test
PRIMARY> rs.status()
{
        "set" : "shard2",
        "date" : ISODate("2017-11-15T08:51:32Z"),
        "myState" : 1,
        "members" : [
                {
                        "_id" : 0,
                        "name" : "10.70.56.199:15552",
                        "health" : 0,
                        "state" : 8,
                        "stateStr" : "(not reachable/healthy)",
                        "uptime" : 0,
                        "optime" : {
                                "t" : 1510342250000,
                                "i" : 1
                        },
                        "optimeDate" : ISODate("2017-11-10T19:30:50Z"),
                        "lastHeartbeat" : ISODate("2017-11-10T19:31:16Z"),
                        "pingMs" : 0,
                        "errmsg" : "socket exception"
                },
                {
                        "_id" : 1,
                        "name" : "10.70.56.201:15552",
                        "health" : 1,
                        "state" : 2,
                        "stateStr" : "SECONDARY",
                        "uptime" : 88,
                        "optime" : {
                                "t" : 1510735865000,
                                "i" : 1
                        },
                        "optimeDate" : ISODate("2017-11-15T08:51:05Z"),
                        "lastHeartbeat" : ISODate("2017-11-15T08:51:30Z"),
                        "pingMs" : 0
                },
                {
                        "_id" : 2,
                        "name" : "10.70.56.197:15552",
                        "health" : 1,
                        "state" : 1,
                        "stateStr" : "PRIMARY",
                        "optime" : {
                                "t" : 1510735865000,
                                "i" : 1
                        },
                        "optimeDate" : ISODate("2017-11-15T08:51:05Z"),
                        "self" : true
                }
        ],
        "ok" : 1
}
PRIMARY> rs.remove('10.70.56.199:15552')// 删除旧的mongod
Wed Nov 15 16:53:57 DBClientCursor::init call() failed
Wed Nov 15 16:53:57 query failed : admin.$cmd { replSetReconfig: { _id: "shard2", version: 2, members: [ { _id: 1, host: "10.70.56.201:15552" }, { _id: 2, host: "10.70.56.197:15552" } ] } } to: 127.0.0.1:15552
Wed Nov 15 16:53:57 Error: error doing query: failed shell/collection.js:151
Wed Nov 15 16:53:57 trying reconnect to 127.0.0.1:15552
Wed Nov 15 16:53:57 reconnect 127.0.0.1:15552 ok

PRIMARY> rs.status() //查看结果
{
        "set" : "shard2",
        "date" : ISODate("2017-11-15T08:54:07Z"),
        "myState" : 1,
        "members" : [
                {
                        "_id" : 1,
                        "name" : "10.70.56.201:15552",
                        "health" : 1,
                        "state" : 2,
                        "stateStr" : "SECONDARY",
                        "uptime" : 8,
                        "optime" : {
                                "t" : 1510736036000,
                                "i" : 1
                        },
                        "optimeDate" : ISODate("2017-11-15T08:53:56Z"),
                        "lastHeartbeat" : ISODate("2017-11-15T08:54:05Z"),
                        "pingMs" : 0,
                        "errmsg" : "syncThread: 10278 dbclient error communicating with server: 10.70.56.197:15552"
                },
                {
                        "_id" : 2,
                        "name" : "10.70.56.197:15552",
                        "health" : 1,
                        "state" : 1,
                        "stateStr" : "PRIMARY",
                        "optime" : {
                                "t" : 1510736037000,
                                "i" : 1
                        },
                        "optimeDate" : ISODate("2017-11-15T08:53:57Z"),
                        "self" : true
                }
        ],
        "ok" : 1
}
PRIMARY> rs.add('10.70.56.196:15552')// 添加新的mongod
{ "ok" : 1 }

PRIMARY> rs.status() //
{
        "set" : "shard2",
        "date" : ISODate("2017-11-15T08:54:41Z"),
        "myState" : 1,
        "members" : [
                {
                        "_id" : 1,
                        "name" : "10.70.56.201:15552",
                        "health" : 1,
                        "state" : 2,
                        "stateStr" : "SECONDARY",
                        "uptime" : 42,
                        "optime" : {
                                "t" : 1510736078000,
                                "i" : 1
                        },
                        "optimeDate" : ISODate("2017-11-15T08:54:38Z"),
                        "lastHeartbeat" : ISODate("2017-11-15T08:54:39Z"),
                        "pingMs" : 0
                },
                {
                        "_id" : 2,
                        "name" : "10.70.56.197:15552",
                        "health" : 1,
                        "state" : 1,
                        "stateStr" : "PRIMARY",
                        "optime" : {
                                "t" : 1510736078000,
                                "i" : 1
                        },
                        "optimeDate" : ISODate("2017-11-15T08:54:38Z"),
                        "self" : true
                },
                {
                        "_id" : 3,
                        "name" : "10.70.56.196:15552",
                        "health" : 1,
                        "state" : 2,
                        "stateStr" : "SECONDARY",
                        "uptime" : 3,
                        "optime" : {
                                "t" : 1510730231000,
                                "i" : 1
                        },
                        "optimeDate" : ISODate("2017-11-15T07:17:11Z"),
                        "lastHeartbeat" : ISODate("2017-11-15T08:54:40Z"),
                        "pingMs" : 163
                }
        ],
        "ok" : 1
}

mongodb 对内存的严重占用以及解决方法【转载】

2016-11-10T13:53:33+08:00

刚开始使用mongodb的时候，不太注意mongodb的内存使用，但通过查资料发现mongodb对内存的占用是巨大的，在本地测试服务器中，8G的内存居然被占用了45%。汗呀。
本文就来剖析一下mongodb对内存的具体使用方法，以及生产环境针对mongodb占大量内存的问题的解决。
先看一个MongoDB服务器的top命令结果
shell> top -p $(pidof mongod)
Mem: 32872124k total, 30065320k used, 2806804k free,   245020k buffers
Swap: 2097144k total,      100k used, 2097044k free, 26482048k cached
VIRT RES SHR %MEM
1892g 21g 21g 69.6

或者先top后，然后 shift+m 把当前进场按占用内存的多少排序。看看你的mongodb能占用多少内存。

先了解一下linux对内存的管理方式：
在Linux里（别的系统也差不多），内存有物理内存和虚拟内存之说，物理内存是什么自然无需解释，虚拟内存实际是物理内存的抽象，多数情况下，出于方便性的考虑，程序访问的都是虚拟内存地址，然后操作系统会把它翻译成物理内存地址。
很多人会把虚拟内存和Swap混为一谈，实际上Swap只是虚拟内存引申出的一种技术而已：操作系统一旦物理内存不足，为了腾出内存空间存放新内容，就会把当前物理内存中的内容放到交换分区里，稍后用到的时候再取回来，需要注意的是，Swap的使用可能会带来性能问题，偶尔为之无需紧张，糟糕的是物理内存和交换分区频繁的发生数据交换，这被称之为Swap颠簸，一旦发生这种情况，先要明确是什么原因造成的，如果是内存不足就好办了，加内存就可以解决，不过有的时候即使内存充足也可能会出现这种问题，比如MySQL就有可能出现这样的情况，解决方法是限制使用Swap：
shell> sysctl -w vm.swappiness=0
查看内存情况最常用的是free命令：
shell> free -m
             total       used       free     shared    buffers     cached
Mem:         32101      29377       2723          0        239      25880
-/+ buffers/cache:       3258      28842
Swap:         2047          0       2047
新手看到used一栏数值偏大，free一栏数值偏小，往往会认为内存要用光了。其实并非如此，之所以这样是因为每当我们操作文件的时候，Linux都会尽可能的把文件缓存到内存里，这样下次访问的时候，就可以直接从内存中取结果，所以cached一栏的数值非常的大，不过不用担心，这部分内存是可回收的，操作系统会按照LRU算法淘汰冷数据。除了cached，还有一个buffers，它和cached类似，也是可回收的，不过它的侧重点在于缓解不同设备的操作速度不一致造成的阻塞，这里就不多做解释了。
知道了原理，我们就可以推算出系统可用的内存是free + buffers + cached：
shell> echo "2723 + 239 + 25880" | bc -l
28842
至于系统实际使用的内存是used – buffers – cached：
shell> echo "29377 - 239 - 25880" | bc -l
3258
除了free命令，还可以使用sar命令：
shell> sar -r
kbmemfree kbmemused %memused kbbuffers kbcached
3224392 29647732     90.19    246116 26070160
3116324 29755800     90.52    245992 26157372
2959520 29912604     91.00    245556 26316396
2792248 30079876     91.51    245680 26485672
2718260 30153864     91.73    245684 26563540

shell> sar -W
pswpin/s pswpout/s
    0.00      0.00
    0.00      0.00
    0.00      0.00
    0.00      0.00
    0.00      0.00
希望你没有被%memused吓到，如果不幸言中，请参考free命令的解释。

接着咱们分析一下mongodb是怎么使用内存的：

目前，MongoDB使用的是内存映射存储引擎，它会把磁盘IO操作转换成内存操作，如果是读操作，内存中的数据起到缓存的作用，如果是写操作，内存还可以把随机的写操作转换成顺序的写操作，总之可以大幅度提升性能。MongoDB并不干涉内存管理工作，而是把这些工作留给操作系统的虚拟缓存管理器去处理，这样的好处是简化了MongoDB的工作，但坏处是你没有方法很方便的控制MongoDB占多大内存，事实上MongoDB会占用所有能用的内存，所以最好不要把别的服务和MongoDB放一起。

有时候，即便MongoDB使用的是64位操作系统，也可能会遭遇臭名昭著的OOM问题，出现这种情况，多半是因为限制了虚拟内存的大小所致，可以这样查看当前值：

shell> ulimit -a | grep 'virtual'
多数操作系统缺省都是把它设置成unlimited的，如果你的操作系统不是，可以这样修改：

shell> ulimit -v unlimited
不过要注意的是，ulimit的使用是有上下文的，最好放在MongoDB的启动脚本里。

有时候，出于某些原因，你可能想释放掉MongoDB占用的内存，不过前面说了，内存管理工作是由虚拟内存管理器控制的，所以通常你只能通过重启服务来释放内存，你一定不齿于这样的方法，幸好可以使用MongoDB内置的closeAllDatabases命令达到目的：

mongo> use admin
mongo> db.runCommand({closeAllDatabases:1})
另外，通过调整内核参数drop_caches也可以释放缓存：

shell> sysctl -w vm.drop_caches=1
平时可以通过mongo命令行来监控MongoDB的内存使用情况，如下所示：

mongo> db.serverStatus().mem:
{
    "resident" : 22346,
    "virtual" : 1938524,
    "mapped" : 962283
}
还可以通过mongostat命令来监控MongoDB的内存使用情况，如下所示：
shell> mongostat
mapped vsize    res faults
940g 1893g 21.9g      0
940g 1893g 21.9g      0
940g 1893g 21.9g      0
940g 1893g 21.9g      0
940g 1893g 21.9g      0

其中内存相关字段的含义是：
mapped：映射到内存的数据大小
visze：占用的虚拟内存大小
res：实际使用的内存大小
注：如果操作不能再内存中完成，结果faults列的数值不会是0，视大小可能有性能问题。

在上面的结果中，vsize是mapped的两倍，而mapped等于数据文件的大小，所以说vsize是数据文件的两倍，之所以会这样，是因为本例中，MongoDB开启了journal，需要在内存里多映射一次数据文件，如果关闭journal，则vsize和mapped大致相当。

如果想验证这一点，可以在开启或关闭journal后，通过pmap命令来观察文件映射情况：
shell> pmap $(pidof mongod)
到底MongoDB配备多大内存合适？宽泛点来说，多多益善，如果要确切点来说，这实际取决于你的数据及索引的大小，内存如果能够装下全部数据加索引是最佳情况，不过很多时候，数据都会比内存大，比如本文说涉及的MongoDB实例：
mongo> db.stats()
{
        "dataSize" : 1004862191980,
        "indexSize" : 1335929664
}
本例中索引只有1G多，内存完全能装下，而数据文件则达到了1T，估计很难找到这么大内存，此时保证内存能装下热数据即可，至于热数据有多少，这就是个比例问题了，取决于具体的应用。如此一来内存大小就明确了：内存 > 索引 + 热数据。

根据以上的分析我们可以得出几点结论：
1. mongodb 直接用操作系统的内存管理器来管理内存。而操作系统采用的是LRU算法淘汰冷数据。
2. mongodb可以用重启服务、调整内核参数以及mongodb内部的语法去清理mongodb对内存的缓存。可能存在的问题是：这几种清理方式都是全部清理，这样的话mongodb的内存缓存就失效了。
3. mongodb 对内存的使用是可以被监控的，在生产环境中要定时的去监控这些数据。
4. mongodb 对内存这种占用方式使其尽量的和其他占用内存的业务分开部署，例如memcahe，sphinx，mysql等。
5. 操作系统中的交换分区swap 如果操作频繁的话，会严重降低系统效率。要解决可以禁用交换分区，以及增加内存以及做分布式。
6. 生产环境中mongodb所在的主机应该尽量的大内存。

mongodb java操作同一个字段的and操作。

2015-11-12T15:18:06+08:00

从网上查了很多但是没有同一个字段的and的查询。经过研究实现如下

关系。vc大于1 and pbh大于start AND pbh小于end 按照vc大到小排序，最多显示num条。

DBObject queryCondition = new BasicDBObject();
       queryCondition.put("vc", new BasicDBObject("$gt", 1));//大于

       BasicDBObject startendCondition = new BasicDBObject();
       if(start!=null){
           startendCondition.append("$gt", start);//大于
       }
       if(end!=null){
           startendCondition.append("$lte", end);//小于
       }
       queryCondition.put("pbh",startendCondition);



       DBObject sortCondition = new BasicDBObject("vc",-1);
       //.limit(10).sort(new BasicDBObject("create_time",-1));
       DBCursor resultset = collection.find(queryCondition).sort(sortCondition).limit(num);

Maongodb 慢查询Profiling

2015-10-09T10:21:06+08:00

在 MySQL中，慢查询日志是经常作为我们优化数据库的依据，那在MongoDB中是否有类似的功能呢?答案是肯定的，那就是Mongo Database Profiler.不仅有，而且还有一些比MySQL的Slow Query Log更详细的信息。它就是我们这篇文章的主题。

　　开启 Profiling 功能

　　有两种方式可以控制 Profiling 的开关和级别，第一种是直接在启动参数里直接进行设置。

　　启动MongoDB时加上–profile=级别即可。

　　也可以在客户端调用db.setProfilingLevel(级别) 命令来实时配置。可以通过db.getProfilingLevel()命令来获取当前的Profile级别。

　　> db.setProfilingLevel(2);
　　{"was" : 0 , "ok" : 1}
　　> db.getProfilingLevel()

　　上面斜体的级别可以取0，1，2 三个值，他们表示的意义如下：

　　0 – 不开启

　　1 – 记录慢命令 (默认为>100ms)

　　2 – 记录所有命令

　　Profile 记录在级别1时会记录慢命令，那么这个慢的定义是什么?上面我们说到其默认为100ms，当然有默认就有设置，其设置方法和级别一样有两种，一种是通过添加–slowms启动参数配置。第二种是调用db.setProfilingLevel时加上第二个参数：

　　db.setProfilingLevel( level , slowms )
　　db.setProfilingLevel( 1 , 10 );

　　查询 Profiling 记录

　　与MySQL的慢查询日志不同，Mongo Profile 记录是直接存在系统db里的，记录位置 system.profile ，所以，我们只要查询这个Collection的记录就可以获取到我们的 Profile 记录了。

　　> db.system.profile.find()
　　{"ts" : "Thu Jan 29 2009 15:19:32 GMT-0500 (EST)" , "info" : "query test.$cmd ntoreturn:1 reslen:66 nscanned:0
　　query: { profile: 2 } nreturned:1 bytes:50" , "millis" : 0}
　　db.system.profile.find( { info: /test.foo/ } )
　　{"ts" : "Thu Jan 29 2009 15:19:40 GMT-0500 (EST)" , "info" : "insert test.foo" , "millis" : 0}
　　{"ts" : "Thu Jan 29 2009 15:19:42 GMT-0500 (EST)" , "info" : "insert test.foo" , "millis" : 0}
　　{"ts" : "Thu Jan 29 2009 15:19:45 GMT-0500 (EST)" , "info" : "query test.foo ntoreturn:0 reslen:102 nscanned:2
　　query: {} nreturned:2 bytes:86" , "millis" : 0}
　　{"ts" : "Thu Jan 29 2009 15:21:17 GMT-0500 (EST)" , "info" : "query test.foo ntoreturn:0 reslen:36 nscanned:2
　　query: { $not: { x: 2 } } nreturned:0 bytes:20" , "millis" : 0}
　　{"ts" : "Thu Jan 29 2009 15:21:27 GMT-0500 (EST)" , "info" : "query test.foo ntoreturn:0 exception bytes:53" , "millis" : 88}

　　列出执行时间长于某一限度(5ms)的 Profile 记录：

　　> db.system.profile.find( { millis : { $gt : 5 } } )
　　{"ts" : "Thu Jan 29 2009 15:21:27 GMT-0500 (EST)" , "info" : "query test.foo ntoreturn:0 exception bytes:53" , "millis" : 88}

　　查看最新的 Profile 记录：

　　db.system.profile.find().sort({$natural:-1})

　　Mongo Shell 还提供了一个比较简洁的命令show profile，可列出最近5条执行时间超过1ms的 Profile 记录。

　　Profile 信息内容详解：

　　ts-该命令在何时执行.

　　millis Time-该命令执行耗时，以毫秒记.

　　info-本命令的详细信息.

　　query-表明这是一个query查询操作.

　　ntoreturn-本次查询客户端要求返回的记录数.比如, findOne()命令执行时 ntoreturn 为 1.有limit(n) 条件时ntoreturn为n.

　　query-具体的查询条件(如x>3).

　　nscanned-本次查询扫描的记录数.

　　reslen-返回结果集的大小.

　　nreturned-本次查询实际返回的结果集.

　　update-表明这是一个update更新操作.

　　fastmod-Indicates a fast modify operation. See Updates. These operations are normally quite fast.

　　fastmodinsert – indicates a fast modify operation that performed an upsert.

　　upsert-表明update的upsert参数为true.此参数的功能是如果update的记录不存在，则用update的条件insert一条记录.

　　moved-表明本次update是否移动了硬盘上的数据，如果新记录比原记录短，通常不会移动当前记录，如果新记录比原记录长，那么可能会移动记录到其它位置，这时候会导致相关索引的更新.磁盘操作更多，加上索引更新，会使得这样的操作比较慢.

　　insert-这是一个insert插入操作.

　　getmore-这是一个getmore 操作，getmore通常发生在结果集比较大的查询时，第一个query返回了部分结果，后续的结果是通过getmore来获取的。

　　MongoDB 查询优化

　　如果nscanned(扫描的记录数)远大于nreturned(返回结果的记录数)的话，那么我们就要考虑通过加索引来优化记录定位了。

　　reslen 如果过大，那么说明我们返回的结果集太大了，这时请查看find函数的第二个参数是否只写上了你需要的属性名。(类似于MySQL中不要总是select *)

　　对于创建索引的建议是：如果很少读，那么尽量不要添加索引，因为索引越多，写操作会越慢。如果读量很大，那么创建索引还是比较划算的。(和RDBMS一样，貌似是废话 -_-!!)

　　MongoDB 更新优化

　　如果写查询量或者update量过大的话，多加索引是会有好处的。以及～～～～(省略N字，和RDBMS差不多的道理)

　　Use fast modify operations when possible (and usually with these, an index). See Updates.

　　Profiler 的效率

　　Profiling 功能肯定是会影响效率的，但是不太严重，原因是他使用的是system.profile 来记录，而system.profile 是一个capped collection 这种collection 在操作上有一些限制和特点，但是效率更高。

mongodb 避免Out of semaphores to get db connection error

2014-07-24T17:44:07+08:00

com.mongodb.DBPortPool$SemaphoresOut: Out of semaphores to get db

MongoDB 并发测试，报出上述错误。究其原因，是数据库连接数太少，资源耗尽。查看com.mongodb.MongoOptions源代码，其中有 connectionsPerHost和threadsAllowedToBlockForConnectionMultiplier两个重要的属性。

connectionsPerHost：每个主机的连接数

threadsAllowedToBlockForConnectionMultiplier：线程队列数，它以上面connectionsPerHost值相乘的结果就是线程队列最大值。如果连接线程排满了队列就会抛出“Out of semaphores to get db”错误。

connectionsPerHost默认是10，threadsAllowedToBlockForConnectionMultiplier默认是5，也就是线程池有50个连接数可供使用。因此只要将这个属性的值加大就可以避免上述错误。

其它属性设置：

maxWaitTime:最大等待连接的线程阻塞时间

connectTimeout：连接超时的毫秒。0是默认和无限

socketTimeout：socket超时。0是默认和无限

autoConnectRetry：这个控制是否在一个连接时，系统会自动重试

java设置方法：

MongoOptions options = new MongoOptions();
       options.connectionsPerHost = 100;//链接池数量默认10 。避免Out of semaphores to get db connection error
       options.autoConnectRetry = true;
       options.threadsAllowedToBlockForConnectionMultiplier=5;
       options.slaveOk = true;
       mongo = new Mongo(replicaSetSeeds, options);

mongodb 数据文件里的moveChunk是什么。可以删除

2014-05-20T16:15:04+08:00

我可以把moveChunk目录里的旧文件删除吗?

没问题，这些文件是在分片(shard)进行均衡操作(balancing)的时候产生的临时文件。一旦这些操作已经完成，相关的临时文件也应该被删除掉。但目前清理工作是需要手动的，所以请小心地考虑再释放这些文件的空间。

MongoDB NoSQL数据库的面试问答吧

2014-05-20T16:14:12+08:00

MongoDB NoSQL数据库的面试问答吧：

1. 你说的NoSQL数据库是什么意思?NoSQL与RDBMS直接有什么区别?为什么要使用和不使用NoSQL数据库?说一说NoSQL数据库的几个优点?

我写了一篇完整的博客来回答这些问题，看这里

2. NoSQL数据库有哪些类型?

NoSQL数据库的类型

例如：MongoDB, Cassandra, CouchDB, Hypertable, Redis, Riak, Neo4j, HBASE, Couchbase, MemcacheDB, RevenDB and Voldemort are the examples of NoSQL databases. 详细阅读。

3. MySQL与MongoDB之间最基本的差别是什么?

MySQL和MongoDB两者都是免费开源的数据库。MySQL和MongoDB有许多基本差别包括数据的表示(data representation)，查询，关系，事务，schema的设计和定义，标准化(normalization)，速度和性能。通过比较MySQL 和MongoDB，实际上我们是在比较关系型和非关系型数据库。详细阅读

4. 你怎么比较MongoDB、CouchDB及CouchBase?

MongoDB和CouchDB都是面向文档的数据库。MongoDB和CouchDB都是开源NoSQL数据库的最典型代表。除了都以文档形式存储外它们没有其他的共同点。MongoDB和CouchDB在数据模型实现、接口、对象存储以及复制方法等方面有很多不同。

细节可以参见下面的链接：

MongDB vs CouchDB

CouchDB vs CouchBase

5. MongoDB成为最好NoSQL数据库的原因是什么?

以下特点使得MongoDB成为最好的NoSQL数据库：

面向文件的
高性能
高可用性
易扩展性
丰富的查询语言

6.32位系统上有什么细微差别?

journaling会激活额外的内存映射文件。这将进一步抑制32位版本上的数据库大小。因此，现在journaling在32位系统上默认是禁用的。

7. journal回放在条目(entry)不完整时(比如恰巧有一个中途故障了)会遇到问题吗?

每个journal (group)的写操作都是一致的，除非它是完整的否则在恢复过程中它不会回放。

8. 分析器在MongoDB中的作用是什么?

MongoDB中包括了一个可以显示数据库中每个操作性能特点的数据库分析器。通过这个分析器你可以找到比预期慢的查询(或写操作);利用这一信息，比如，可以确定是否需要添加索引。

9. 名字空间(namespace)是什么?

MongoDB存储BSON对象在丛集(collection)中。数据库名字和丛集名字以句点连结起来叫做名字空间(namespace)。

10. 如果用户移除对象的属性，该属性是否从存储层中删除?

是的，用户移除属性然后对象会重新保存(re-save())。

11. 能否使用日志特征进行安全备份?

是的。

12. 允许空值null吗?

对于对象成员而言，是的。然而用户不能够添加空值(null)到数据库丛集(collection)因为空值不是对象。然而用户能够添加空对象{}。

13. 更新操作立刻fsync到磁盘?

不会，磁盘写操作默认是延迟执行的。写操作可能在两三秒(默认在60秒内)后到达磁盘。例如，如果一秒内数据库收到一千个对一个对象递增的操作，仅刷新磁盘一次。(注意，尽管fsync选项在命令行和经过getLastError_old是有效的)(译者：也许是坑人的面试题??)。

14. 如何执行事务/加锁?

MongoDB没有使用传统的锁或者复杂的带回滚的事务，因为它设计的宗旨是轻量，快速以及可预计的高性能。可以把它类比成MySQL MylSAM的自动提交模式。通过精简对事务的支持，性能得到了提升，特别是在一个可能会穿过多个服务器的系统里。

15. 为什么我的数据文件如此庞大?

MongoDB会积极的预分配预留空间来防止文件系统碎片。

16. 启用备份故障恢复需要多久?

从备份数据库声明主数据库宕机到选出一个备份数据库作为新的主数据库将花费10到30秒时间。这期间在主数据库上的操作将会失败--包括写入和强一致性读取(strong consistent read)操作。然而，你还能在第二数据库上执行最终一致性查询(eventually consistent query)(在slaveOk模式下)，即使在这段时间里。

17. 什么是master或primary?

它是当前备份集群(replica set)中负责处理所有写入操作的主要节点/成员。在一个备份集群中，当失效备援(failover)事件发生时，一个另外的成员会变成primary。

18. 什么是secondary或slave?

Seconday从当前的primary上复制相应的操作。它是通过跟踪复制oplog(local.oplog.rs)做到的。

19. 我必须调用getLastError来确保写操作生效了么?

不用。不管你有没有调用getLastError(又叫"Safe Mode")服务器做的操作都一样。调用getLastError只是为了确认写操作成功提交了。当然，你经常想得到确认，但是写操作的安全性和是否生效不是由这个决定的。

20. 我应该启动一个集群分片(sharded)还是一个非集群分片的 MongoDB 环境?

为开发便捷起见，我们建议以非集群分片(unsharded)方式开始一个 MongoDB 环境，除非一台服务器不足以存放你的初始数据集。从非集群分片升级到集群分片(sharding)是无缝的，所以在你的数据集还不是很大的时候没必要考虑集群分片(sharding)。

21. 分片(sharding)和复制(replication)是怎样工作的?

每一个分片(shard)是一个分区数据的逻辑集合。分片可能由单一服务器或者集群组成，我们推荐为每一个分片(shard)使用集群。

22. 数据在什么时候才会扩展到多个分片(shard)里?

MongoDB 分片是基于区域(range)的。所以一个集合(collection)中的所有的对象都被存放到一个块(chunk)中。只有当存在多余一个块的时候，才会有多个分片获取数据的选项。现在，每个默认块的大小是 64Mb，所以你需要至少 64 Mb 空间才可以实施一个迁移。

23. 当我试图更新一个正在被迁移的块(chunk)上的文档时会发生什么?

更新操作会立即发生在旧的分片(shard)上，然后更改才会在所有权转移(ownership transfers)前复制到新的分片上。

24. 如果在一个分片(shard)停止或者很慢的时候，我发起一个查询会怎样?

如果一个分片(shard)停止了，除非查询设置了“Partial”选项，否则查询会返回一个错误。如果一个分片(shard)响应很慢，MongoDB则会等待它的响应。

25. 我可以把moveChunk目录里的旧文件删除吗?

26. 我怎么查看 Mongo 正在使用的链接?

db._adminCommand("connPoolStats");

27. 如果块移动操作(moveChunk)失败了，我需要手动清除部分转移的文档吗?

不需要，移动操作是一致(consistent)并且是确定性的(deterministic);一次失败后，移动操作会不断重试;当完成后，数据只会出现在新的分片里(shard)。

28. 如果我在使用复制技术(replication)，可以一部分使用日志(journaling)而其他部分则不使用吗?

可以。

mongodb拷贝数据库copyDatabase（）。实现释放磁盘空间的方法。

2013-09-07T10:27:46+08:00

db.copyDatabase("from","to","127.0.0.1:16161");

将127.0.0.1上的from库。拷贝到to库。

这样做有一个额外的好处。就是from库中可能是删除过数据的库。看我们知道删除数据时磁盘空间是不会被释放的。参考博客里的另一篇文章：mongodb删除集合后磁盘空间不释放

肯能造成占用很大磁盘空间。虽然可以用 db.repairDatabase()修复数据。但这种方法有两个不好的地方。1.在生产上操作如果意外停止可能会造成数据无法恢复的危险。2.如果磁盘空间不足，小于现在这个db时间占有的空间，这种情况是用不了 db.repairDatabase()的。

所以介绍用db.copyDatabase可以备份复制数据的方法。

1.db.copyDatabase("from","to","127.0.0.1:16161");复制出一个新的to数据库。这个已经是最小数据占用的数据。会在数据目录下产生to的相关数据文件。

2.将所有程序的配置从from库改为to库。测试无误。

3.这时可以删除from库。方法。use from 后 db.dropDatabase()。这个方法的好处是可以时间将磁盘上的数据删除掉。节省出很大的空间。

磁盘紧张的同学可以参考以上方法。

转：基于MongoDB GridFS的图片存储

2013-09-03T17:50:27+08:00

商品图片，平均200－500K，说大不大，说小不小，但量大且细碎，最早通过页面上传，全部保存在文件里，且不分目录，管理和索引都很慢，几乎无法备份，读取也很慢。

改进方案由大鱼设计，图片是保存在MySQL表里，每10万张图就换一张新表，操作语言是PHP，它解决了图片备份和缓存的问题。

经过一段运行时间后，我对效果并不满意，主要是速度还是有些慢，尤其是第一次加载的过程。这期间又负责主体商品数据迁移到MongoDB，大致研究了一下GridFS，并做了些测试，感觉这个比MySQL要靠谱，且MongoDB还有Sharding和Replica Set支持，帮我解决了分布存储的问题，很是诱人，决定一试。

设计思路和需求整理：

决不允许重复图片存在
文件只有原始的需要保留，其他各尺寸和效果都可以由原图生成
图片URL总是固定的，不管它出现在哪里
缩略图生成规则也简单的体现在URL里，参考 Abusing Amazon images http://aaugh.com/imageabuse.html
第一次请求，由图片处理程序生成静态文件，以后请求即直接定位到静态文件
多年前，郝培强同学送过我一本《Python语言入门》，但这么些年里只写过三两个小工具，按熟悉程度依然算新手。既然这个解决方案撞枪口上了，于是有改用Python实现的念头。我是这么想的，1.要简单；2.要快，不光运行快，还要写得快；3.最好是常驻型程序。貌似只有Python和Ruby符合，但Ruby我不熟悉，那就用Python好了。某个周六，花了一天时间，写了个雏形，支持图片读取并显示。又花了N天，添加管理和上传。

上传到github，命名为ImSto，将它作为我的第一个开源项目。

关于Python的Web框架，不得不絮叨几句，那真叫一个多，看了一些评论，也粗略研究了Pylons和CherryPy，很久以前学过一点点Django。但感觉似乎都有些复杂，这个需求也不复杂，决定干脆不用任何框架，自己动手丰衣足食算了。

所用到的组件：

MongoDB (GridFS): 这个不用说了，核心存储，初期环境用到了三台主机组成的 Replica Sets
Nginx: 解析URL并定位到静态文件，如果未生成则转向uWSGI程序去生成图片
Python + pymongo
ImageMagick: 用来生成图片缩略图，有两种调用方式：Api和命令行shell。Demo环境由于内存使用限制，用了shell方式。
uWSGI: 是用纯C写的WSGI服务器，支持多种语言（主要是Python）和Web Server（官方首推Cherokee和Nginx）。有点儿类似PHP-FPM。
项目地址: https://github.com/liut/imsto 只是完成了 TODO里的部分核心功能，代码结构也比较粗糙，待逐步重构。

演示地址: http://demo.imsto.org:81/ 稍后添加权限认证，所以，在这之前请随便添随便删，不要客气。

Update:
1. 上传的页面使用了 html5的一些特性，为了实现Ajax上传和进度显示，以及即时预览，暂时只支持Firefox3.5+。稍后再改进。
2. 请不要向我推荐用 Flash，谢谢。

mongodb删除集合后磁盘空间不释放

2013-08-31T17:37:33+08:00

mongodb删除集合后磁盘空间不释放，只有用db.repairDatabase()去修复才能释放。

修复可能要花费很长的时间,在使用db.repairDatabase()去修复时一定要停掉读写，并且mongodb要有备机才可以，不然千万不要随便使用db.repairDatabase()来修复数据库，切记。

但是在修复的过程中如果出现了非正常的mongodb的挂掉，再次启动时启动不了的，需要先修复才可以，可以利用./mongod --repair --dbpath=/data/mongo/ 如果你是把数据库单独的放在一个文件夹中指定dbpath时就指向要修复的数据库就可以