数据分析之MySQL(一)数据库及MySQL介绍
数据库简介
数据库就是数据的仓库,它是一种特殊的文件,其中存储着需要的数据
数据存储
以前是这样记录的:结绳记事
也有这样记录的:甲骨
后来开始这样记录:图书
传统记录数据的缺点:
- 不易保存
- 备份困难
- 查找不便
现代化手段—-文件
- 使用简单,例如python中的open可以打开文件,用read/write对文件进行读写,close关闭文件
- 对于数据容量较大的数据,不能够很好的满足,而且性能较差
- 不易扩展
现代化手段—-数据库
- 持久化存储
- 读写速度极高
- 保证数据的有效性
- 对程序支持性非常好,容易扩展
真实的仓库是这样的:
我们看到的是这个样子的
顾客看到的是这个样子的:
数据库分类
当前主要使用两种类型的数据库:关系型数据库、非关系型数据库,本部分主要讨论关系型数据库,对于非关系型数据库会在后面学习
所谓的关系型数据库****: 是建立在关系模型基础上的数据库,通俗讲这种数据库由多个表组成,表与表存在一定的关系。
- 关系型数据库, 由多个表组成,表内部有一定关系,表与表之间有一定的关系,web开发几乎用到的都是关系型数据库,目前讲的也是关系型数据库,使用sql语句来管理数据库
- 非关系型数据库,数据之间是离散的,主要用于爬虫项目; mangodb :非关系型数据库,nosql
关系型数据库核心元素
- 记录(数据行)
- 字段(数据列)
- 数据表(数据行的集合,记录的集合)
- 数据库(数据表的集合)
- 主键(它是特殊的字段,用来唯一标识记录)
RDBMS关系型数据库管理系统
关系型数据库管理系统Relational Database Management System 简称 RDBMS
Relational:相关的,关系的 Database: 基本数据(数据库)
- 所谓的关系型数据库管理系统RDBMS,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。好比excel、wps软件系统 可以管理类似xxx.xls 电子表格文件
- 关系型数据库RDBMS的主要产品:
- oracle:在大型项目中使用,银行,电信等项目
- mysql:web时代使用最广泛的关系型数据库
- ms sql server:在微软的项目中使用
- sqlite:轻量级数据库,主要应用在移动平台
RDBMS数据库排名:https://db-engines.com/en/ranking
RDBMS和数据库的关系
从图中看到信息
- 关系型数据库由多个工作表组成
- 通过RDBMS来管理数据库
- RDMBS分为客户端和服务端
- 客户端通过SQL命令(语句)实现对数据库的管理
SQL
Structured Query Language简称SQL
SQL是结构化查询语言,是一种用来操作RDBMS的数据库语言,当前关系型数据库都支持使用SQL语言进行操作,也就是说可以通过 SQL 操作 oracle,ms sql server,mysql,sqlite 等等所有的关系型的数据库
- SQL语句主要分为:
- DQL:数据查询语言(命令),用于对数据进行查询,如select
- DML:数据操作语言(命令),对数据进行增加、修改、删除,如insert、udpate、delete
- TPL:事务处理语言,对事务进行处理,包括begin transaction、commit、rollback
- DCL:数据控制语言,进行授权与权限回收,如grant、revoke
- DDL:数据定义语言(命令),进行数据库、表的管理等,如create、drop
- CCL:指针控制语言,通过控制指针完成表的操作,如declare cursor
单词扩展:
select 选择 insert 插入,嵌入 transaction 执行,处理
commit 委托 Roll 滚动 rollback 反转
grant 授予 revoke 撤回,废除 drop 投入,接入
declare 声明,宣告 cursor 指针
- 对于web程序员来讲,重点是数据的crud(增删改查),必须熟练编写DQL、DML,能够编写DDL完成数据库、表的操作,其它语言如TPL、DCL、CCL了解即可
- SQL 是一门特殊的语言,专门用来操作关系数据库
- 不区分大小写
# 创建Connection连接
conn = connect(host=\'localhost\', port=3306, user=\'root\', password=\'mysql\', database=\'python1\', charset=\'utf8\')
# 得Cursor对象
cs = conn.cursor()
# 更新
# sql = \'update students set name="刘邦" where id=6\'
# 删除
# sql = \'delete from students where id=6\'
# 执行select语句,并返回受影响的行数:查询一条学生数据
sql = \'select id,name from students where id = 7\'
# sql = \'SELECT id,name FROM students WHERE id = 7\'
count=cs.execute(sql)
# 打印受影响的行数
print(count)
MySQL简介
点击查看MySQL官方网站
MySQL是一个关系型数据库管理系统,最早由瑞典MySQL AB公司开发,后来被Sun公司收购,Sun公司后来又被Oracle公司收购,目前属于Oracle旗下产品
MySQL对跨平台支持性好,提供了多种主流语言调用的API
MySQL 市场占有率高,且开源,免费,是中小型项目首选的关系型数据库系统
MySQL的优势
- 关系型数据库管理系统,是oracle公司的产品
- web开发中最常用的数据库
- 开源,免费,web开发首选数据库
- 社区版 (ubuntu其实就是debian的社区版,centos就是ret hat的社区版)
特点(了解)
- 使用C和C++编写,并使用了多种编译器进行测试,保证源代码的可移植性
- 支持多种操作系统,如Linux、Windows、AIX、FreeBSD、HP-UX、MacOS、NovellNetware、OpenBSD、OS/2 Wrap、Solaris等
- 为多种编程语言提供了API,如C、C++、Python、Java、Perl、PHP、Eiffel、Ruby等
- 支持多线程,充分利用CPU资源
- 优化的SQL查询算法,有效地提高查询速度
- 提供多语言支持,常见的编码如GB2312、BIG5、UTF8
- 提供TCP/IP、ODBC和JDBC等多种数据库连接途径
- 提供用于管理、检查、优化数据库操作的管理工具
- 大型的数据库。可以处理拥有上千万条记录的大型数据库
- 支持多种存储引擎
- MySQL 软件采用了双授权政策,它分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择MySQL作为网站数据库
- MySQL使用标准的SQL数据语言形式
- Mysql是可以定制的,采用了GPL协议,你可以修改源码来开发自己的Mysql系统
- 在线DDL更改功能
- 复制全局事务标识
- 复制无崩溃从机
- 复制多线程从机