mongodb中文档id生成原理以及mock方法

用过Mongodb 的同学都知道,它会默认为每个 文档(document) 生成一个ObjectId类型_id字段。而且很多时候,在构建rest api的时候,都会用该字段来标识资源。比如:访问具体一篇博文的内容,URL就可能是:/posts/:postId,这里:postId就是直接用_id字段的字符串形式来表示。它通常会是这样一串值:** 538f0231d74805ed36fc30db**。

那么当我们在对rest api服务做测试的时候,就需要来模拟这样的id,而且它必须有效的。什么意思呢?我来举个例子:假设我们要对查看博文这个api做测试,那么其中就可能会有这样两条用例:

  1. 当postId不合法时,服务器应该返回处理错误
  2. 当postId合法但不存在时,服务器应该返回处理成功并返回0条记录

其中,第1条用例我们在测试的时候,可以很简单地模拟一个无效的postId,比如:12345 这样的就可以了。但是对于第2条,我们则必须要模拟一个有效的id,它是可以通过mongodb合法性校验的,但是呢mongodb利用这个id去数据库中寻找时又是找不到对应记录的。

为了达到这样一个目的,我们必须得要知道id到底是如何生成出来的,这样我们就可以模拟出符合要求的id了。

好,开干吧!既然说id是个ObjectId类型的,那么我们先去搞清楚ObjectId这种类型到底是什么东西,通过Mongodb官方文档 了解到ObjectId其实就是12个字节长的BSON 。其中12个字节具体内容为:

如上图所示,12个字节被拆成4个部分,每个部分都很好理解,无需多做解释。这里唯一要提的一点是其具体的实现是根据mongodb驱动器(driver)的。下面是node版本驱动器 中对于objectid生成部分的实现代码(具体实现见js-bson 中的generate方法):

ObjectID.prototype.generate = function(time) {
  if ('number' != typeof time) {
    time = parseInt(Date.now()/1000,10);
  }
  
  var time4Bytes = BinaryParser.encodeInt(time, 32, true, true);
  /* for time-based ObjectID the bytes following the time will be zeroed */
  var machine3Bytes = BinaryParser.encodeInt(MACHINE_ID, 24, false);
  var pid2Bytes = BinaryParser.fromShort(typeof process === 'undefined' ? Math.floor(Math.random() * 100000) : process.pid);
  var index3Bytes = BinaryParser.encodeInt(this.get_inc(), 24, false, true);

  return time4Bytes + machine3Bytes + pid2Bytes + index3Bytes;
};

这里的MACHINE_ID就直接采用了随机数,而其他的驱动器则采用了md5值。接下来,我们再来看看encodeInt方法:

BinaryParser.encodeInt = function encodeInt (data, bits, signed, forceBigEndian) {
    var max = maxBits[bits];

  if (data >= max || data < -(max / 2)) {
    this.warn("encodeInt::overflow");
    data = 0;
  }

    if (data < 0) {
    data += max;
  }

    for (var r = []; data; r[r.length] = String.fromCharCode(data % 256), data = Math.floor(data / 256));

    for (bits = -(-bits >> 3) - r.length; bits--; r[r.length] = "\0");

  return ((this.bigEndian || forceBigEndian) ? r.reverse() : r).join("");
};

该方法其实最终就会返回bits位字符串。那么此前的generate方法就是会返回一个包含12个字符的字符串。所以这其实就是ObjectId内部的表现形式。我们接着继续看mongodb的文档 发现ObjectId的对外字符串表现形式其实是一个16进制的字符串,那么字符串长度是多少呢?这里简单做换算就可以了:1个字节需要2位16进制来表示,那么12个字节就是24位。所以这个长度一定是24。

好了,那么归根结底,一个合法的id字符串表现形式其实就是:一个由16进制数字组成的长度为24的字符串

了解了这个原理,那要mock一个id就轻而易举了。这里推荐一个名为chancejs的随机数据生成工具,利用chance.hash({ length: 24 });就可以了!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 148,637评论 1 318
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 63,443评论 1 266
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 99,164评论 0 218
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 42,075评论 0 188
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 50,080评论 1 266
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 39,365评论 1 184
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 30,901评论 2 283
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 29,649评论 0 176
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 33,122评论 0 223
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 29,734评论 2 225
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,093评论 1 236
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 27,548评论 2 222
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,028评论 3 216
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 25,765评论 0 9
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,291评论 0 178
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 34,162评论 2 239
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 34,293评论 2 242

推荐阅读更多精彩内容