快速了解MongoDB【基本概念与体系结构】
什么是MongoDB
MongoDB is a general purpose, document-based, distributed database built for modern application developers and for the cloud era.
MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。
MongoDB特点
Mongo最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。
它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有:
1、面向集合存储,易存储对象类型的数据。
2、模式自由。
3、支持动态查询。
4、支持完全索引,包含内部对象。
5、支持查询。
6、支持复制和故障恢复。
7、使用高效的二进制数据存储,包括大型对象(如视频等)。
8、自动处理碎片,以支持云计算层次的扩展性。
9、支持RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
10、文件存储格式为BSON(一种JSON的扩展)。
MongoDB体系结构
MongoDB 的逻辑结构是一种层次结构。主要由:文档(document)、集合(collection)、数据库(database)这三部分组成的。逻辑结构是面向用户的,用户使用 MongoDB 开发应用程序使用的就是逻辑结构。
1、MongoDB 的文档(document),相当于关系数据库中的一行记录。
2、多个文档组成一个集合(collection),相当于关系数据库的表。
3、多个集合(collection),逻辑上组织在一起,就是数据库(database)。
4、一个 MongoDB 实例支持多个数据库(database)。
文档(document)、集合(collection)、数据库(database)的层次结构如下图:
MongoDb | 关系型数据库Mysql |
---|---|
数据库(databases) | 数据库(databases) |
集合(collections) | 表(table) |
文档(document) | 行(row) |
文档 document
文档是MongoDB中数据的基本单元(类似于关系型数据库中的行,但是比行要复杂得多)。多个键及其关联的值有序地放置在一起便是文档。MongoDB的文件存储格式为BSON。
BSON是Binary JSON 的简称,是一个JSON文档对象的二进制编码格式。BSON同JSON一样支持往其它文档对象和数组中再插入文档对象和数组,同时扩展了JSON的数据类型。如:BSON有Date类型和BinDate类型。
BSON有三个特点:轻量性、可遍历性、高效性
文档就可以这样表示:{ "firstName": "egger", "lastName":"wong" }
文档的特征:
1、文档中的键/值对是有序的。
2、文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌人的文档)。
3、MongoDB区分类型和大小写。
4、MongoDB的文档不能有重复的键。
5、文档的键是字符串。除了少数例外情况,键可以使用任意UTF-8字符。
6、键不能含有\0 (空字符)。这个字符用来表示键的结尾。
7、.和$有特别的意义,只有在特定环境下才能使用。
8、以下划线"_"开头的键是保留的(不是严格要求的)。
集合
集合就是一组文档(类似于关系型数据库中的表),可以被看做是没有模式的表。
集合是无模式的。这意味着一个集合里面的文档可以是各式各样的。例如,下面两个文档可以存在于同一个集合里面:
{"name": "egger"}
{"age":18}
上面的文档不光是值的类型不同(字符串和整数),它们的键也是完全不一样的。
虽然集合里面可以放置任何文档,但是推荐使用多个集合:
把各种各样的文档都混在一个集合里面,无论对于开发者还是管理员来说都是噩梦。
在一个集合里面査询特定类型的文档在速度上也很不划算,分开做多个集合要快得多。
把同种类型的文档放在一个集合里,这样数据会更加集中。
当创建索引的时候,文档会有附加的结构(尤其是有唯一索引的时候)。索引是按照集合来定义的。把同种类型的文档放入同一个集合里面,可以使索引更加有效。
命名
我们可以通过名字来标识集合。集合名可以是满足下列条件的任意UTF-8字符串。
1、集合名不能是空字符串""。
2、集合名不能含有\0字符(空字符),这个字符表示集合名的结尾。
3、集合名不能以"system."开头,这是为系统集合保留的前缀。
4、用户创建的集合名字不能含有保留字符$。有些驱动程序的确支持在集合名里面包含$,这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合,否则千万不要在名字里出现$。
子集合
组织集合的一种惯例是使用"."字符分开的按命名空间划分的子集合。在MongoDB中使用子集合来组织数据是很好的方法
例如,一个个人信息可能包含两个集合,分别是person.name和person.age。这样做的目的只是为了使组织结构更好些,也就是说person这个集合(这里根本就不需要存在)及其子集合没有任何关系。把数据库的名字放到集合名前面,得到就是集合的完全限定名,称为命名空间。命名空间的长度不得超过121字节,在实际使用当中应该小于100字节。
很多MongoDB工具中都包含子集合。
GridFS是一种存储大文件的协议,使用子集合来存储文件的元数据,这样就与内容块分开了
MongoDB的Web控制台通过子集合的方式将数据组织在DBTOP部分.
绝大多数驱动程序都提供语法糖,为访问指定集合的子集合提供方便。
数据库
MongoDB中多个集合可以组成数据库。MongoDB的单个实例可以容纳多个独立的数据库,每一个都有自己的集合和权限,不同的数据库也放置在不同的文件中。
数据库也通过名字来标识。数据库名可以是满足以下条件的任意UTF-8字符串。
1、不能是空字符串("")。
2、不得含有' '(空格)、.、$、/、\和\0 (空宇符)。
3、应全部小写。
4、最多64字节。
5、有一些数据库名是保留的,可以直接访问这些有特殊作用的数据库。
• admin
从权限的角度来看,这是“root”数据库。要是将一个用户添加到这个数据库,这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行,比如列出所有的数据库或者关闭服务器。
• local
这个数据永远不会被复制,可以用来存储限于本地单台服务器的任意集合
• config
当Mongo用于分片设置时,config数据库在内部使用,用于保存分片的相关信息。
本文整理于网络
相关知识点
知识点
软件工具
相关教程
更多MongoDB的体系结构_深入浅出MongoDB(三)
MongoDB和关系数据库逻辑结构关系对比,数据存储结构,MongoDB数据类型
LVS体系结构
使用LVS架设的服务器集群系统有三个部分组成:最前端的负载均衡层,用Load Balancer表示,中间的服务器群组层,用Server Array表示,最底端的数据共享存储层,用Shared Storage表示。 Load Balancer层:位于整个集群系统的最前端,有一台或者多台负载调度器(Director Server)组成,LVS模块就安装在Director Server上,而Direct
Hibernate架构体系结构
org.hibernate.SessionFactory接口提供了工厂方法来获取Session的对象
MongoDB学习(二):数据类型和基本概念
MongoDB的文件存储格式为BSON,同JSON一样支持往其它文档对象和数组中再插入文档对象和数组,同时扩展了JSON的数据类型.与数据库打交道的那些应用。例如,JSON没有日期类型,这会使得处理本来简单的日期问题变得非常繁琐。只有一种数字类型,没法区分浮点数和整数,更不能区分32位和64位数字。也没有办法表示其他常用类型,如正则表达式或函数。
Hadoop storm大数据分析 知识体系结构
最近工作工作有用到hadoop 和storm,最近看到一个网站上例句的hadoop 和storm的知识体系。所以列出来供大家了解和学习。来自哪个网站就不写了以免以为我做广告额。 目录结构知识点还是挺全的,可以按照点学习。 转自:http://www.cnblogs.com/ExMan/p/3877180
《Apache源代码全景分析-第1卷:体系结构与核心模块》扫描版[PDF]
中文名: Apache源代码全景分析-第1卷:体系结构与核心模块 作者: 张中庆 梁雪平 图书分类: 网络 资源格式: PDF 版本: 扫描版 出版社: 电子工业出版社 书号: 9787121084744 发行时间: 2009年5月31日 地区: 大陆 语言: 简体中文 简介: 评论处1楼有网盘链接 内容介绍:
Apache zookeeper 基本概念
Apache zookeeper 是什么 当使用Hadoop Cloud时我们看到了zookeeper,当使用Solr Cloud时我们再次看到了zookeeper,zookeeper为神马一次又一次地与云接下了不解之缘?其实我们每个人对云(Cloud)的概念学习从幼儿园就开始了,先学习一首儿歌《蚂蚁搬豆》,歌词如下: 一只蚂蚁在洞口 找到一粒豆 用尽力气搬不动,只是连摇头 左思右想好
note:solr的基本概念
在 Solr 和 Lucene 中,使用一个或多个 Document 来构建索引。Document 包括一个或多个 Field。Field 包括名称、内容以及告诉 Solr 如何处理内容的元数据。例如,Field 可以包含字符串、数字、布尔值或者日期,也可以包含您想添加的任何类型。Field 可以使用大量的选项来描述,这些选项告诉 Solr 在索引和搜索期间如何处理内容。 主要是这
ZooKeeper基本架构与基本概念
初步了解JMS-基本概念
JMS是Java的消息服务,JMS的客户端之间可以通过JMS服务进行异步的消息传输。JMS支持两种消息模型:Point-to-Point(P2P)和Publish/Subscribe(Pub/Sub),即点对点和发布订阅模型。P2P模型规定了一个消息只能有一个接收者;Pub/Sub 模型允许一个消息可以有多个接收者。
java反射详解(二)_基本概念及应用
反射就是把Java类中的各种成分映射成相应的java类。例如,一个Java类中用一个Class类的对象来表示,一个类中的组成部分:成员变量,方法,构造方法,包等等信息也用一个个的Java类来表示,就像汽车是一个类,汽车中的发动机,变速箱等等也是一个个的类。
用 Hadoop 进行分布式并行编程, 第 1 部分基本概念与安装部署
简介: Hadoop 是一个实现了 MapReduce 计算模型的开源分布式并行编程框架,借助于 Hadoop, 程序员可以轻松地编写分布式并行程序,将其运行于计算机集群上,完成海量数据的计算。本文将介绍 MapReduce 计算模型,分布式并行计算等基本概念,以及 Hadoop 的安装部署和基本运行方法。 Hadoop 简介 Hadoop 是一个开源的可运行于大规模集群上的分布式并行编程框架,由
MongoDB学习 (四):创建、读取、更新、删除(CRUD)快速入门
本文介绍数据库的4个基本操作:创建、读取、更新和删除(CRUD)。接下来的数据库操作演示,我们使用MongoDB自带简洁但功能强大的JavaScript shell,MongoDB shell是一个独立的DB客户端(它也是功能完备的JavaScript解释器 可以运行任何JavaScript程序),MongoDB shell的使用介绍请阅读博文《MongoDB学习(三):MongoDB Shell的使用》
Storm重要概念
This page lists the main concepts of Storm and links to resources where you can find more information. The concepts discussed are: Topologies Streams Spouts Bolts Stream groupings Reli
solr mongoDB 对比
1 solr 字段是写死的 2 solr优势是大块文本模糊查询,mongoDB还支持正则查询以及类似js语法代码语句查询 3 mongoDB已经原生支持了局部更新,以及有个upsert,solr先查有就更新,没有就直接覆盖的 4 mongDB支持批量更新 4 mongDB工具较多,实时监控mongodstat,支持热备份、热恢复mongodump和mongorestore,还提供锁命令控制以及角色
最新教程
更多java线程状态详解(6种)
java线程类为:java.lang.Thread,其实现java.lang.Runnable接口。 线程在运行过程中有6种状态,分别如下: NEW:初始状态,线程被构建,但是还没有调用start()方法 RUNNABLE:运行状态,Java线程将操作系统中的就绪和运行两种状态统称为“运行状态” BLOCK:阻塞状态,表示线程阻塞
redis从库只读设置-redis集群管理
默认情况下redis数据库充当slave角色时是只读的不能进行写操作,如果写入,会提示以下错误:READONLY You can't write against a read only slave. 127.0.0.1:6382> set k3 111 (error) READONLY You can't write against a read only slave. 如果你要开启从库
Netty环境配置
netty是一个java事件驱动的网络通信框架,也就是一个jar包,只要在项目里引用即可。
Netty基于流的传输处理
在TCP/IP的基于流的传输中,接收的数据被存储到套接字接收缓冲器中。不幸的是,基于流的传输的缓冲器不是分组的队列,而是字节的队列。 这意味着,即使将两个消息作为两个独立的数据包发送,操作系统也不会将它们视为两个消息,而只是一组字节(有点悲剧)。 因此,不能保证读的是您在远程定入的行数据
Netty入门实例-使用POJO代替ByteBuf
使用TIME协议的客户端和服务器示例,让它们使用POJO来代替原来的ByteBuf。
Netty入门实例-时间服务器
Netty中服务器和客户端之间最大的和唯一的区别是使用了不同的Bootstrap和Channel实现
Netty入门实例-编写服务器端程序
channelRead()处理程序方法实现如下
Netty开发环境配置
最新版本的Netty 4.x和JDK 1.6及更高版本
电商平台数据库设计
电商平台数据库表设计:商品分类表、商品信息表、品牌表、商品属性表、商品属性扩展表、规格表、规格扩展表
HttpClient 上传文件
我们使用MultipartEntityBuilder创建一个HttpEntity。 当创建构建器时,添加一个二进制体 - 包含将要上传的文件以及一个文本正文。 接下来,使用RequestBuilder创建一个HTTP请求,并分配先前创建的HttpEntity。
MongoDB常用命令
查看当前使用的数据库 > db test 切换数据库 > use foobar switched to db foobar 插入文档 > post={"title":"领悟书生","content":"这是一个分享教程的网站","date":new
windows系统安装MongoDB
安装 下载MongoDB的安装包:mongodb-win32-x86_64-2008plus-ssl-3.2.10-signed.msi,按照提示步骤安装即可。 安装完成后,软件会安装在C:\Program Files\MongoDB 目录中 我们要启动的服务程序就是C:\Program Files\MongoDB\Server\3.2\bin目录下的mongod.exe,为了方便我们每次启动,我
Spring boot整合MyBatis-Plus 之二:增删改查
基于上一篇springboot整合MyBatis-Plus之后,实现简单的增删改查 创建实体类 添加表注解TableName和主键注解TableId import com.baomidou.mybatisplus.annotations.TableId; import com.baomidou.mybatisplus.annotations.TableName; import com.baom
分布式ID生成器【snowflake雪花算法】
基于snowflake雪花算法分布式ID生成器 snowflake雪花算法分布式ID生成器几大特点: 41bit的时间戳可以支持该算法使用到2082年 10bit的工作机器id可以支持1024台机器 序列号支持1毫秒产生4096个自增序列id 整体上按照时间自增排序 整个分布式系统内不会产生ID碰撞 每秒能够产生26万ID左右 Twitter的 Snowflake分布式ID生成器的JAVA实现方案
Spring boot整合mybatis plus
快速了解mybatis plus 是对Mybatis框架的二次封装和扩展 纯正血统:完全继承原生 Mybatis 的所有特性 最少依赖:仅仅依赖Mybatis以及Mybatis-Spring 性能损耗小:启动即会自动注入基本CURD ,性能无损耗,直接面向对象操作 自动热加载:Mapper对应的xml可以热加载,大大减少重启Web服务器时间,提升开发效率 性能分析:自带Sql性能分析插件,开发测试