为什么会出现NoSQL数据库

一、总结

一句话总结:sql不支持分布式且且有性能瓶颈且不支持分布式,不同NoSQL适合不同的场景

 

1、”不同的NoSQL数据库只适合不同的场景”这句话对么?

对的,NoSQL数据库是针对点的,关系型数据库是针对面的

 

2、NoSQL数据库有哪四种?

KV键值对:redis,内容缓存,主要用于处理大量数据的高访问负载等; 
②bson:文档数据库,MongoDB 是一个基于分布式文件存储的数据库,C++编写的。皆在为web应用提供可扩展的高性能数据存储解决方案。它介于关系型数据库与非关系型数据库之间的产品,是非关系型中功能最丰富的,且最像关系型数据库的; 
列存储数据库:分布式文件系统 
图关系型数据库 :它不是放图的,放的是 关系:如朋友圈社交网络等。专注于关系图谱。

 

3、数据库主从复制和读写分离是什么?

主从复制:往主服务里插入一条数据的同时,也往从服务里写入一条数据(备份、容灾) 
读写分离:一般主作为写(20%),从作为读(80%)

 

 

 

二、互联网背景下为什么会出现NoSQL?

一、传统应用模式 (ALL IN ONE) 

所有的东西都部署在一台机器上,包括站点、数据库、文件等等(现在阿里云的出现方便了很多)。核心工作就是:前端传过来一些数据,然后业务逻辑层拼装,然后访问数据库,数据库返回数据,数据拼装成页面,最终返回到浏览器。 
这时候数据库可能会率先成为瓶颈在流量峰值期容易宕机,第一可以优化sql语句,第二,典型的应用都是读数据库频率远大于写数据库频率。这时候可以采用读写分离,多读一写的数据库架构(一般是20%是写库,80%是读库);

这时候的主要矛盾点已经变为业务复杂度的提升带来的耦合,导致升级困难,开发容易引入bug,维护成本也提升

1、Memcached 分布式缓存服务器,通过文件缓存来缓解数据库压力,为多个web服务器提供了一个共享的高性能缓存服务。在Memcached服务器上,又发展了根据hash算法来进行多台Memcached缓存服务的扩展,然后又出现了一致性hash来解决增加或减少缓存服务器导致重新hash带来的大量缓存失效的弊端。

不足: 
由于数据库的写入压力增加,Memcached只能缓解数据库的读取压力。读写集中在一个数据库上让数据库不堪重负,大部分网站开始使用主从复制技术来达到读写分离,以提高读写性能和读库的可扩展性。Mysql的master-slave模式成为这个时候的网站标配了。

2、主从复制读写分离 
主从复制:往主服务里插入一条数据的同时,也往从服务里写入一条数据(备份、容灾) 
读写分离:一般主作为写(20%),从作为读(80%)

3、在Memcached 高速缓存、MySQL主从复制,读写分离的基础之上,由于大量数据的增加,写压力开始出现瓶颈,由于MyISAM使用表锁,在高并发下会出现严重的锁问题,大量的高并发MySQL应用开始使用InnoDB引擎代替MyISAM。 
同时开始使用分库分表来缓解压力。 
MySQL的扩展性差(需要复杂的技术来实现),大数据下IO压力大,表结构更改困难,正是当前使用MySQL的开发人员面临的问题。

4、为什么用NoSQL? 
今天我们可以通过第三方平台(如:Google,Facebook等)可以很容易的访问和抓取数据。用户的个人信息,社交网络,地理位置,用户生成的数据和用户操作日志已经成倍的增加。 
我们如果要对这些用户数据进行挖掘,那SQL数据库已经不适合这些应用了, NoSQL数据库的发展也却能很好的处理这些大的数据。

 

二、什么是NoSQL?

NoSQL(NoSQL = Not Only SQL ),意即“不仅仅是SQL”, 泛指非关系型的数据库。

1、作用 
NoSQL数据库种类繁多,但是一个共同的特点都是去掉关系数据库的关系型特性。数据之间无关系,这样就非常容易扩展。也无形之间,在架构的层面上带来了可扩展的能力。 
NoSQL数据库都具有非常高的读写性能,尤其在大数据量下,这得益于它的无关系性,数据库的结构简单。 
NoSQL无需事先为要存储的数据建立字段,随时可以存储自定义的数据格式。而在关系数据库里,增删字段是一件非常麻烦的事情。如果是非常大数据量的表,增加字段简直就是一个噩梦。

2、关系型数据库(RDBMS)VS 非关系型数据库(NoSQL) 
RDBMS:

  • 高度组织化结构化数据
  • 结构化查询语言(SQL)
  • 数据和关系都存储在单独的表中。
  • 数据操纵语言,数据定义语言
  • 严格的一致性
  • 基础事务

    NoSQL:

  • 代表着不仅仅是SQL
  • 没有声明性查询语言
  • 没有预定义的模式
  • 键 – 值对存储,列存储,文档存储,图形数据库
  • 最终一致性,而非ACID属性
  • 非结构化和不可预知的数据
  • CAP定理
  • 高性能,高可用性和可伸缩性

总结: RDBMS 和NoSQL都有各自的特点和使用的应用场景,让关系数据库关注在关系上,NoSQL关注在存储上

 

三、互联网时代面临的问题 

1、3V 和 3高 
3V: 海量的数据流量;多样(商品种类、各式各样);实时的数据需求 
3高: 高并发;高可用;高性能

四、NoSQL 数据模型简介 
传统的关系型数据模型的设计基本上是 基于数据库范式建立1:1 / 1:N / N:N,主外键的关系设计。 
1、NoSQL的设计: 
使用Bson() 类似于json的一种二进制形式的存储格式,简称 Binary JSON,它也同样支持内嵌的文档对象和数组对象。 
2、聚合模型 
高并发的操作是不太建议有关联查询的,互联网公司用冗余数据来避免关联查询,分布式事务是支持不了太多的并发的。 
3、NoSQL数据库的四大分类: 
KV键值对:redis,内容缓存,主要用于处理大量数据的高访问负载等; 
②bson:文档数据库,MongoDB 是一个基于分布式文件存储的数据库,C++编写的。皆在为web应用提供可扩展的高性能数据存储解决方案。它介于关系型数据库与非关系型数据库之间的产品,是非关系型中功能最丰富的,且最像关系型数据库的; 
列存储数据库:分布式文件系统 
图关系型数据库 :它不是放图的,放的是 关系:如朋友圈社交网络等。专注于关系图谱

 

参考:互联网背景下为什么会出现NoSQL? – CSDN博客
https://blog.csdn.net/u013709087/article/details/78313923

 

 

 

 

版权声明:本文为Renyi-Fan原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/Renyi-Fan/p/9497389.html