MongoDB培训讲诉.ppt
文本预览下载声明
* MongoDB的分布式部署 分布式-Sharding(碎片) MongoDB的auto-sharding功能是指mongodb通过mongos自动建立一个水平扩展的数据库集群系统,将数据库分表存储在sharding的各个节点上。一个mongodb集群包括一些shards(包括一些mongod进程),mongos路由进程,一个或多个config服务器 Shards 每一个shard包括一个或多个服务和存储数据的mongod进程(mongod是MongoDB数据的核心进程) 典型的每个shard开启多个服务来提高服务的可用性。这些服务/mongod进程在shard中组成一个复制集 * MongoDB的分布式部署 Chunks Chunk是一个来自特殊集合中的一个数据范围,(collection,minKey,maxKey)描叙一个chunk,它介于minKey和maxKey范围之间。例如chunks 的maxsize大小是100M,如果一个文件达到或超过这个范围时,会被切分到2个新的chunks中。当一个shard的数据过量时,chunks将会被迁移到其他的shards上。同样,chunks也可以迁移到其他的shards上。 Config Servers Config服务器存储着集群的metadata信息,包括每个服务器,每个shard的基本信息和chunk信息,Config服务器主要存储的是chunk信息。每一个config服务器都复制了完整的chunk信息 详细的配置见《 Mongodb配置Sharding详细过程.doc》 * MongoDB的网络资料 官方在线文档 官方Cookbook MongoDB系列教程 MongoDB资料汇总专题 加拿大人做的MongoDB教学网站 MongoDB+Hadoop构建MapReduce运算系统 MongoDB的映射框架- mandango 谢谢大家 sueprwen superwen@ * superwen superwen@ MongoDB培训 第一部分 MongoDB简介 * * MongoDB特性 MongoDB是一个可扩展、高性能的下一代数据库,它的特点是高性能、易部署、易使用、存储数据非常方便,主要特性有: 1、面向文档存储,json格式的文档易读,高效。 2、模式自由,支持动态查询、完全索引,无模式。 3、高效的数据存储,效率提高。 4、支持复制和故障恢复。 5、以支持云级别的伸缩性,支持水平的数据库集群,可动态添加额外的服务器 * MongoDB工作方式 传统的关系数据库一般由数据库(database)、表(table)、记录(record)三个层次概念组成,MongoDB同样也是由数据库(database) 、集合(collection)、文档对象(document)三个层次组成。 文档 类似于json的键值对。{“name”: ”jone”,”age”: 13} 集合 一组文档的集合。一个集合下的稳定无模式限制。 提问:既然是这样为什么还会有多个集合? 注意:集合命名 不能为空,\0,不能以system.开头,不能含有 $ 数据库命名 小写 不能含有 空格,$ \ / \0等 * 在32位系统上,不支持大于2.5G的数据。 单个文档大小限制为 16 M 锁粒度太粗,MongoDB使用的是一把全局的读写锁,详见这里 不支持join操作和事务机制,这个确实是非MongoDB要做的领域 对内存要求比较大,至少要保证热数据(索引,数据及系统其它开销)都能装进内存 用户权限方面比较弱,将机器部署在安全的内网环境中,尽量不要用权限 MapReduce在单个实例上无法并行,可用Auto-Sharding实现。是由JS引擎的限制造成的。 MapReduce的结果无法写入到一个被Sharding的Collection中,2.0版本对这个问题的解决好像也不彻底 对于数组型的数据操作不够丰富 MongoDB的局限与不足 * MongoDB 支持的语言 * 谁在使用MongoDB * null 布尔 ture|false 整数 123 浮点 12.3 字符串 “hello world” 对象ID 用 new ObjectId()来申明。 日期 用 new Date()来申明 时间戳 数组 [“apple”,”blanan”,”pear”] 内嵌文档 {“username” : “jone”,
显示全部