MongoDb学习总结

大纲:

1、MongoDB的体系结构
2、MongoDB安装配置与基础命令
3、MongoDB CRUD与全文索引
4、mongoDB的聚合操作
5、高可用的MongoDB集群
5、spring boot整合MongoDB

一、MongoDb的体系结构


概要:

  1. NoSql的概念
  2. NoSql的应用场景
  3. MongoDb的逻辑组成

1、NoSql的概念

NoSQL(NoSQL = Not Only SQL ),意即“不仅仅是 SQL ”,互联网的早期我们的数据大多以关系型数据库来存储的。其特点是规范的数据结构(预定义模式)、强一至性、表与表之间通过外键进行关联,这些特征使我们对数据的管理更加清晰和严谨,但随着互联网的发展数据成爆炸式的增长我们对数据库需要更好的灵活性和更快的速度。这就是NoSql可以做到的。它不需要预先定义模式,没有主外键关联、支持分片、支持复本。

NoSql的分类:

  • 键值(Key-Value)存储数据库
    这一类数据库主要会使用到一个哈希表,这个表中有一个特定的键和一个指针指向特定的数据。Key/value模型对于IT系统来说的优势在于简单、易部署。但是如果DBA只对部分值进行查询或更新的时候,Key/value就显得效率低下了。举例如:Tokyo Cabinet/Tyrant, Redis, Voldemort, Oracle BDB.
  • 列存储数据库
    这部分数据库通常是用来应对分布式存储的海量数据。键仍然存在,但是它们的特点是指向了多个列。这些列是由列家族来安排的。如:Cassandra, HBase, Riak.
  • 文档型数据库
    文档型数据库的灵感是来自于Lotus Notes办公软件的,而且它同第一种键值存储相类似。该类型的数据模型是版本化的文档,半结构化的文档以特定的格式存储,比如JSON。文档型数据库可 以看作是键值数据库的升级版,允许之间嵌套键值。而且文档型数据库比键值数据库的查询效率更高。如:CouchDB, MongoDb. 国内也有文档型数据库SequoiaDB,已经开源。
  • 图形(Graph)数据库
    图形结构的数据库同其他行列以及刚性结构的SQL数据库不同,它是使用灵活的图形模型,并且能够扩展到多个服务器上。NoSQL数据库没有标准的查询语言(SQL),因此进行数据库查询需要制定数据模型。许多NoSQL数据库都有REST式的数据接口或者查询API。如:Neo4J, InfoGrid, Infinite Graph.

2、NoSql的应用场景

NoSQL数据库在以下的这几种情况下比较适用:
1、数据模型比较简单;
2、需要灵活性更强的IT系统;
3、对数据库性能要求较高;
4、不需要高度的数据一致性;

3、MongoDb的逻辑组成

体系结构:

体系

逻辑结构与关系数据库的对比:

关系型数据库 MongoDb
database(数据库) database(数据库)
table (表) collection( 集合)
row( 行) document( BSON 文档)
column (列) field (字段)
index(唯一索引、主键索引) index (全文索引)
join (主外键关联) embedded Document (嵌套文档)
primary key(指定1至N个列做主键) primary key (指定_id field做为主键)
aggreation(groupy) aggreation (pipeline mapReduce)

二、MongoDb安装配置与基础命令


环境:
系统:mac os
mongoDb版本:4.2.8

概要:

  1. mongoDb版本说明
  2. mongoDb启动参数说明
  3. 客户端Shell 的使用及参数说明
  4. 数据库与集合的基础操作

1.mongoDb社区版说明

下载地址:https://www.mongodb.com/download-center/community

image.png

release condidate 表示发布候选版本,development 表示当前正在开发迭代的版本,current表示当前稳定版本。我们用这个current版本。

我采取的是本地下载解压,linux参考以下命令
#下载
wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-4.2.8.tgz 
# 解压
tar -zxvf mongodb-linux-x86_64-4.2.8.tgz

2.mongoDb启动参数说明

mongoDb 由C++编写,下载下来的包可以直接启动

#创建数据库目录
mkdir data
# 启动mongo
./bin/mongod --dbpath=/data

常规参数

参数 说明
dbpath 数据库目录,默认/data/db
bind_ip 监听IP地址,默认全部可以访问
port 监听的端口,默认27017
logpath 日志路径
logappend 是否追加日志
auth 是开启用户密码登陆
fork 是否已后台启动的方式登陆
config 指定配置文件

配置文件示例

vim mongo.conf

内容:

dbpath=./data/
port=27017
bind_ip=0.0.0.0
fork=true
logpath = ./data/log/mongodb.log
logappend = true
auth=false

已配置文件方式启动

./bin/mongod -f ./mongo.conf
image.png

配置文件中对应的文件路径不能错,否则启动不成功

3.客户端Shell 的使用及参数说明

#启动客户端 连接 本机的地的默认端口
./bin/mongo 
# 指定IP和端口
./bin/mongo --host=127.0.0.1 --port=27017

mongo shell 是一个js 控台,可以执行js 相关运算如:

> 1+1
2
> var i=123;
> print(i)
123
>

但本人更喜欢用链接工具写命令,如navicat。因为可以格式化,看起来不费眼。

4.数据库与集合的基础操作

  #查看数据库
  show dbs;
  #切换数据库
  use friend;
  #创建数据库与集合,在插入数据时会自动 创建数据库与集合
  db.friend.insertOne({
    name: "dzy",sex: "man"
});
  #查看集合
  show tables;
  show collections;
  #删除集合
  db.friend.drop();
  #删除数据库
  db.dropDatabase();

三、MongoDB CRUD与全文索引


概要:

  1. 数据的新增的方式

  2. 数据的查询

  3. 数据的修改删除

  4. 全文索引查询

  5. 数据的新增的方式

关于Mongodb数据插入的说明

  1. 数据库的新增不需要序先设计模型结构,插入数据时会自动创建。
  2. 同一个集合中不同数据字段结构可以不一样

插入相关方法:

//插入单条 
db.friend.insertOne({name:"wukong",sex:"man"});
// 插入多条
db.friend.insertMany([
    {
        "name": "lubu",
        "sex": "man"
    },
    {
        "name": "zhangfei",
        "sex": "man"
    }
])
// 指定ID 
db.friend.insert([
    {
        _id: 1,
        name: "wokong",
        sex: "man",
        age: 1
    },
    {
        _id: 2,
        name: "diaocan",
        sex: "women",
        birthday: new Date("1988-11-11")
    }
])

2、数据的查询

概要:

  1. 基于条件的基础查询
  2. $and、$or、$in、$gt、$gte、$lt、$lte 运算符
  3. 基于 sort skip limit 方法实现排序与分页
  4. 嵌套查询
  5. 数组查询
  6. 数组嵌套查询
测试数据:
// 职工信息
db.emp.insert(
[
{_id:1101,name:'鲁班' ,job:'讲师'    ,dep:'讲师部',salary:10000},
{_id:1102,name:'悟空' ,job:'讲师' ,dep:'讲师部',salary:10000},
{_id:1103,name:'诸葛'  ,job:'讲师' ,dep:'讲师部',salary:10000},
{_id:1105,name:'赵云' ,job:'讲师'  ,dep:'讲师部',salary:8000},
{_id:1106,name:'韩信',job:'校长' ,dep:'校办',salary:20000},
{_id:1107,name:'貂蝉' ,job:'班主任'  ,dep:'客服部',salary:8000},
{_id:1108,name:'安其' ,job:'班主任'  ,dep:'客服部',salary:8000},
{_id:1109,name:'李白' ,job:'教务'  ,dep:'教务处',salary:8000},
{_id:1110,name:'默子'  ,job:'教务',dep:'教务处',salary:8000},
{_id:1111,name:'大乔',job:'助教' ,dep:'客服部',salary:5000},
{_id:1112,name:'小乔' ,job:'助教' ,dep:'客服部',salary:3000},
]
);

// 学生信息
db.student.insertMany([
{_id:"001",name:"陈霸天",age:5,grade:{redis:87,zookeper:85,dubbo:90},subjects: ["redis", "Java", "mySql"]},
{_id:"002",name:"张明明",age:3,grade:{redis:86,zookeper:82,dubbo:59},subjects: ["mySql", "zookeper", "bootstrap"]},
{_id:"003",name:"肖炎炎",age:2,grade:{redis:81,zookeper:94,dubbo:88},subjects: ["Java", "dubbo", "Java"]},
{_id:"004",name:"李鬼才",age:6,grade:{redis:48,zookeper:87,dubbo:48},subjects: ["mySql", "zookeper", "bootstrap"]}
])

// 学生科目
db.subject.insertMany([
{_id:"001",name:"陈霸天",subjects:["redis","zookeper","dubbo"]},
{_id:"002",name:"张明明",subjects:["redis","Java","mySql"]},
{_id:"003",name:"肖炎炎",subjects:["mySql","zookeper","bootstrap"]},
{_id:"004",name:"李鬼才",subjects:["Java","dubbo","Java"]},
])

db.subject2.insertMany([
{_id:"001",name:"陈霸天",subjects:[
                    {name:"redis",hour:12},
                    {name:"dubbo",hour:120},
                    {name:"zookeper",hour:56}]
                    },
{_id:"002",name:"张明明",subjects:[{name:"java",hour:120},{name:"mysql",hour:10},{name:"oracle",hour:30}]},
{_id:"003",name:"肖炎炎",subjects:[{name:"mysql",hour:12},{name:"html5",hour:120},{name:"netty",hour:56}]},
{_id:"004",name:"李鬼才",subjects:[{name:"redis",hour:12},{name:"dubbo",hour:120},{name:"netty",hour:56}]}
])

// 课程项目
db.project.insert(
   [ { _id: 1, name: "Java Script", description: "name is js and jquery" },
     { _id: 2, name: "Git", description: "Git is a free and open source distributed version control system designed to handle everything from small to very large projects with speed and efficiency" },
     { _id: 3, name: "Apache dubbo", description: "Apache Dubbo  is a high-performance, java based open source RPC framework.阿里 开源 项目" },
     { _id: 4, name: "Redis", description: "Redis is an open source (BSD licensed), in-memory data structure store, used as a database, cache and message broker. It supports data structures" },
     { _id: 5, name: "Apache ZooKeeper", description: "Apache ZooKeeper is an effort to develop and maintain an open-source server which enables highly reliable distributed coordination" }
   ]
)

基础查询:

#基于ID查找
db.emp.find({_id:1101})
#基于属性查找
db.emp.find({"name":"鲁班"})
# && 运算 与大于 运算
db.emp.find({
    "job": "讲师",
    "salary": {
        $gt: 8000
    }
})
# in 运算
db.emp.find({
    "dep": {
        $in: ["讲师部", "客户部"]
    }
})
# or 运算
db.emp.find({
    $or: [{
        "job": "讲师"
    }, {
        "salary": {
            $gt: 10000
        }
    }]
})

排序与分页:

sort 排序 -1表示降序,1表示升序。可根据多列进行排序。
skip limit 分页。skip表示从skip+1行开始,显示limit行。.skip(5).limit(2)表示从第六行开始,显示2行。

db.emp.find().sort({
    salary: - 1
}).skip(5).limit(2)

db.emp.find().sort({
    dept: 1,
    salary: - 1
}).skip(5).limit(2)

嵌套查询:

# 错误示例:无结果
db.student.find({
    grade: {
        redis: 87,
        dubbo: 90
    }
});
#错误示例:无结果 
db.student.find({
    grade: {
        redis: 87,
        dubbo: 90,
        zookeper: 85
    }
})

# 基于复合属性查找 时必须包含其所有的值 并且顺序一至
db.student.find({
    grade: {
        redis: 87,
        zookeper: 85,
        dubbo: 90
    }
})

#基于复合属性当中的指定值 查找。注:名称必须用双引号
db.student.find({
    "grade.redis": 87
});

db.student.find({
    "grade.redis": {
        "$gt": 80
    }
});

数组查询:

#无结果
db.subject.find({subjects:["redis","zookeper"]})
#无结果
db.subject.find({subjects:["zookeper","redis","dubbo"]})
# 与嵌套查询一样,必须是所有的值 并且顺序一至
db.subject.find({subjects:["redis","zookeper","dubbo"]})

# $all 匹配数组中包含该两项的值。注:顺序不作要求
db.student.find({
    "subjects": {$all:["dubbo", "zookeper"]}
});
注:
# 简化数组查询
db.subject.find({subjects:"redis"})
# 简化数组查询 ,匹配数组中存在任意一值。与$all相对应
db.subject.find({
    subjects: {
        $in: ["redis", "zookeper"]
    }
});

数组嵌套查询:

#基础查询 ,必须查询全部,且顺序一至
db.subject2.find({
    subjects: [
       {name:"redis",hour:12}
    ]
});
#指定查询第一个数组 课时大于12
db.subject2.find({
    "subjects.0.hour": {
        $gt: 12
    }
})
#查询任科目 课时大于12
db.subject2.find({
    "subjects.hour": {
        $gt: 12
    }
})
# $elemMatch 元素匹配,指定属性满足,且不要求顺序一至
db.subject2.find({
    subjects: {
        $elemMatch: {
            name: "redis",
            hour: 12
        }
    }
})

# 数组中任意元素匹配 不限定在同一个对象当中
db.subject2.find({
    "subjects.name": "mysql",
    "subjects.hour": 120
})

修改

#设置值
db.emp.update({_id:1101} ,{ $set:{salary:10300}  })
#自增
db.emp.update({_id:1101} ,{ $inc:{salary:200}})

#基于条件 更新多条数据
# 只会更新第一条 
db.emp.update({"dep":"客服部"},{$inc:{salary:100}})
# 更新所有 匹配的条件 
db.emp.updateMany({"dep":"客服部"},{$inc:{salary:100}})

3、数据的修改与删除

修改

#设置值
db.emp.update({
    _id: 1101
}, {
    $set: {
        salary: 10300
    } 
})
#自增
db.emp.update({
    _id: 1101
}, {
    $inc: {
        salary: 200
    }
})

#基于条件 更新多条数据
# 只会更新第一条 
db.emp.update({
    "dep": "客服部"
}, {
    $inc: {
        salary: 100
    }
})
# 更新所有 匹配的条件 
db.emp.updateMany({
    "dep": "客服部"
}, {
    $inc: {
        salary: 100
    }
})

删除:

// 基于查找删除
db.emp.deleteOne({_id:1101})
// 删除整个集合
db.project.drop()
// 删除库
db.dropDatabase()

4、全文索引

索引的创建

db.project.createIndex({
    name: "text",
    description: "text"
})

基于索引分词进行查询

db.project.find({
    $text: {
        $search: "java jquery"
    }
})

基于索引 短语

db.project.find({
    $text: {
        $search: "\"Apache ZooKeeper\""
    }
})

过滤指定单词 '-'

db.project.find({
    $text: {
        $search: "java apache -阿里"
    }
})

查看执行计划

db.project.find({$text:{$search:"java -阿里"}}).explain("executionStats")

四、1.mongoDB的聚合操作


pipeline 聚合
pipeline相关运算符:

  • $match :匹配过滤聚合的数据
  • $project:返回需要聚合的字段
  • $group:统计聚合数据
    示例:
# $match 与 $project使用
db.emp.aggregate(
    {
        $match: {
            "dep": {
                $eq: "客服部"
            }
        }
    },
    {
        $project: {
            name: 1,
            dep: 1,
            salary: 1
        }
    }
);

# $group 与 $sum 使用
db.emp.aggregate(
     {
        $project: {
            dep: 1,
            salary: 1
        }
    },
     {
        $group: {
            "_id": "$dep",
            total: {
                $sum: "$salary"
            }
        }
    }
);

#  低于4000 忽略
db.emp.aggregate(
     {
        $match: {
            salary: {
                $gt: 4000
            }
        }
    },
     {
        $project: {
            dep: 1,
            salary: 1
        }
    },
     {
        $group: {
            "_id": "$dep",
            total: {
                $sum: "$salary"
            }
        }
    } 
);
# 基于多个字段 进行组合group  部门+职位进行统计
db.emp.aggregate(
     {
        $project: {
            dep: 1,
            job: 1,
            salary: 1
        }
    },
     {
        $group: {
            "_id": {
                "dep": "$dep",
                "job": "$job"
            },
            total: {
                $sum: "$salary"
            }
        }
    } 
);



二次过滤
db.emp.aggregate(
     {
        $project: {
            dep: 1,
            job: 1,
            salary: 1
        }
    },
     {
        $group: {
            "_id": {
                "dep": "$dep",
                "job": "$job"
            },
            total: {
                $sum: "$salary"
            }
        }
    },
    {
        $match: {
            "total": {
                $gt: 10000
            }
        }
    } 
);

2.mapRedurce 聚合
mapRedurce 说明:
为什么需要 MapReduce?
(1) 海量数据在单机上处理因为硬件资源限制,无法胜任
(2) 而一旦将单机版程序扩展到集群来分布式运行,将极大增加程序的复杂度和开发难度
(3) 引入 MapReduce 框架后,开发人员可以将绝大部分工作集中在业务逻辑的开发上,而将分布式计算中的复杂性交由框架来处理

mongodb中mapRedurce的使用流程
1.创建Map函数,
2.创建Redurce函数
3.将map、Redurce 函数添加至集合中,并返回新的结果集
4.查询新的结果集
示例操作
// 创建map 对象
var map1=function (){
emit(this.job,1);
}
// 创建reduce 对象
var reduce1=function(job,count){
return Array.sum(count);
}
// 执行mapReduce 任务 并将结果放到新的集合 result 当中
db.emp.mapReduce(map1,reduce1,{out:"result"})
// 查询新的集合
db.result.find()

使用复合对象作为key
var map2=function (){
emit({"job":this.job,"dep":this.dep},1);
}

var reduce2=function(key,values){
return values.length;
}

db.emp.mapReduce(map2,reduce2,{out:"result2"}).find()

mapRedurce的原理
在map函数中使用emit函数添加指定的 key 与Value ,相同的key 将会发给Redurce进行聚合操作,所以Redurce函数中第二个参数 就是 所有集的数组。return 的显示就是聚合要显示的值。

3.在聚合中使用索引
通过$Match内 可以包合对$text 的运算
示例:

db.project.aggregate(
    {
        $match: {
            $text: {
                $search: "apache"
            }
        }
    },
    {
        $project: {
            "name": 1,
            "price": 1
        }
    },
    {
        $group: {
            _id: "$name",
            price: {
                $sum: "$price"
            }
        }
    }
)

关于索引
除了全文索引之外,还有单键索引。即整个字段的值作为索引。单键索引用值1和-1表示,分别代表正序和降序索引。

示例:

de 创建单键索引
db.emp.createIndex({"dep":1})

查看基于索引的执行计划
db.emp.find({"dep":"客服部"}).explain()

除了单键索引外还可以创建联合索引如下:
db.emp.createIndex({"dep":1,"job":-1})
查看 复合索引的执行计划
db.emp.find({"dep":"ddd"}).explain()

查看索引在排序当中的使用
db.emp.find().sort({"job":-1,"dep":1}).explain()

五、高可用的MongoDB集群

高可用的MongoDB集群
在这篇文章中对集群介绍较为详细。

六、spring boot整合MongoDB

SpringBoot集成MongoDB
这篇文章可以学习到用MongoTemplate从基础到高级再到聚合对MongoDB的操作,是通过java代码来实现上文介绍到的MongoDB底层操作。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,015评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,262评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,727评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,986评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,363评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,610评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,871评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,582评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,297评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,551评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,053评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,385评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,035评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,079评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,841评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,648评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,550评论 2 270