传统“关系型数据库”在应付互联网WEB2.0应用已显示的力不从心,由其是超大规模和高并发的SNS类型的WEB2.0网站。
主要需要应对以下三方面难题:
1、对数据库高并发读写的要求。
2、对数据库高可扩展性和高可用性的要求。
3、对海量数据高效存储和访问的要求。
”关系型数据库“固有的特性确用处不大
1、对数据库事务一致性要求低。很多WEB应用不要求严格的数据库事务,有些对读一致性要求不高,更有些对写一致性也要求不高。
2、对数据库写实时性和读实时性要求低。如发送消息给订阅者,可以接受延迟。
为了解决以上问题,”非关系型数据库“(Nosql -- not only sql)应运而生,再很短的时间内涌现出众多的Nosql产品。他们各有各的适用场景,你是否对这些特性有所了解?你是否在选型时一片茫然? 本文将解答你的疑惑,帮助你选择正确的Nosql产品,让你少走些弯路。
1、key-value存储型--满足极高读写要求。
2、文档存储型--海量存储和访问的数据库。
3、列存储型--高可扩展性,可用性,面向分布式计算的数据库。
4、图存储型--适合存储关系
类型 |
部分代表 |
特点 |
列存储 |
Hbase Cassandra Hypertable |
顾名思义,是按列存储数据的。最大的特点是方便存储结构化和半结构化数据,方便做数据压缩,对针对某一列或者某几列的查询有非常大的IO优势。 |
文档存储 |
MongoDB CouchDB |
文档存储一般用类似json的格式存储,存储的内容是文档型的。这样也就有有机会对某些字段建立索引,实现关系数据库的某些功能。 |
key-value存储 |
Tokyo Cabinet / Tyrant Berkeley DB MemcacheDB Redis |
|
图存储 |
Neo4J FlockDB InfoGrid |
|
对象存储 |
db4o Versant |
通过类似面向对象语言的语法操作数据库,通过对象的方式存取数据。 |
xml数据库 |
Berkeley DB XML BaseX |
来自:http://my.oschina.net/u/1757446/blog/289977
不合理的性能比较:
以下数据来自网络,因不知道测试环境的情况,如数量大小,并发数量,硬件情况等,以下数据没有说服力,只供不能亲自测试时的参考。
Memcached 读写速度 1.6万/秒
Memcachedb 读写速度 8000/秒
Redis 读写 1万次/秒
MongoDB 读写 8000次/秒 (数据量达到50G后,是MysqL的10倍)(使用笔记本的5400转硬盘测试时 4000次写/s)
Oracle 插入 5000行/秒
MysqL(内存表)插入5000行/秒
MysqL 表 插入4000行/秒
sqlServer 插入2600行/秒
Cassandra (5000 OPS 每条数据1.5K,50%读,50%写,单节点)OPS =operations per second
Cassandra (2000 OPS 每条数据15K,50%读,50%写,单节点)OPS =operations per second
---------------------------------------------------------------------------------------------------------------
参考文档:
http://www.iteye.com/topic/524977
http://sebug.net/paper/databases/nosql/Nosql.html
对Cassandra的初体验
http://www.iteye.com/topic/784054
基于应用场景的Nosql选型与实践_李刚(奇艺)
http://wenku.it168.com/d_000096483.shtml
http://database.51cto.com/art/201107/274036.htm