五个常用数据库:
1.关系数据库
我们一直在使用关系型数据,比如Oracle、MySQL、SQL Server、Postgress。保存到关系数据库的数据必须满足一定的要求。通俗地说,就是满足一定的数据范式,比如主键、外键、数据冗余等。例如,学生信息可以保存在数据库中,班级信息也可以保存在数据库中。而且,一个班级包含很多学生,他们之间可以通过外键建立一对多的对应关系。这些信息和关系可以通过关系数据库来存储。值得注意的是,关系数据库需要预先定义其表结构,并且在存储之前需要定义其相应的数据类型或长度。一旦添加了新的属性,就必须修改其表的结构。传统的关系数据库实际上是行数据库,逐行存储信息。
2. 列数据库
一般用来对应大量的字符串数据,如HBase、cassandra、Sybase IQ、HP Vertica、EMC Greenplum等。列数据库从一开始就是为了大数据环境下数据仓库的数据分析而开发的,主要是适用于批量数据处理和实时查询。下面两张图形象地说明了什么是列式数据库,什么是行式数据库,以及两者的区别。
3.键值数据库
即Key-Value存储,简称KV存储。它是NoSQL存储的一种方式。其数据以键值对的形式组织、索引和存储。 KV存储非常适合不涉及太多数据关系的业务数据。同时可以有效减少磁盘读写次数,比SQL数据库存储有更好的读写性能。典型产品包括:亚马逊的DynamoDB、redis。
4.图数据库
图数据库并不是专门用来存储图形图像的,而是因为它使用类似图的结构来维护其数据之间的关系,所以被称为图数据库。 Neo4j和Sones是其典型代表。
在图数据结构中,只有两种基本数据类型,即Node和Relationship。节点可以有属性,关系也可以有属性。属性都是键值对的形式。存储中,节点(Node)之间的连接是通过关系(Relationship)建立的,它们建立的关系是有方向的。
Neo4j 是一种高性能的NOSQL 图形数据库,它在网络上而不是表中存储结构化数据。 Neo4j也可以被视为一个高性能的图引擎,具有成熟数据库的所有功能。程序员在面向对象的灵活网络结构中工作,而不是在严格的静态表中工作,但他们可以享受完全事务性企业级数据库的所有好处。 Neo4j因其嵌入式、高性能、轻量级等优点而受到越来越多的关注。支持几乎所有主流开发语言。
5.分布式文档存储数据库
无需定义,应用灵活。文档存储支持对结构化数据的访问。与关系模型不同,文档存储没有强制的架构。与关系模型不同,文档存储模型支持嵌套结构。例如,文档存储模型支持XML和JSON文档,字段的值可以嵌套存储其他文档。文档存储模型还支持数组和列值键。与键值存储不同,文档存储关心文档的内部结构。这使得存储引擎可以直接支持二级索引,从而可以对任意字段进行高效查询。支持嵌套文档存储的能力使得查询语言能够搜索嵌套对象。 XQuery 就是一个例子。 MongoDB 通过支持在查询中指定JSON 字段路径来实现类似的功能。例如,CouchDB、MongoDB 等。