一、数据库分类
说明:mysql 适合中小企业,开源、灵活、具有代表性;DB2、oracle适合大型企业;达梦数据库属于国内
二、文件系统管理数据存在的问题
1. 数据的冗余性和不一致性
如果没有数据库,那么所有的服务器都需要存一份数据;而且每一份数据需实时一致
2. 数据访问
数据会越来越大,如果没有数据库,搜索数据缓慢
3. 数据相对独立
不同类型的文件,保存格式不同,如果拷贝给第三方,需要对应的应用程序
4. 完整性和原子性问题
存储文件时突然中断,会导致损失
5. 并发访问异常问题
2个用户同时访问一个文件,删掉前十行,另一个客户访问时,给不给他看
6. 安全性问题
设置文件被哪些用户访问,访问某些行,文件中的一部分,读写执行做不到
数据库,指的是以一定方式存储在一起、能为多个用户共享、具有尽可能小的冗余度的特点、是与应用程序彼此独立的数据集合,实现:
数据共享
减少数据的冗余度
数据实现集中控制
数据的一致性
故障恢复
三、模型
1. 层次模型:也是树状模型;缺点:随着数据量的增多,会出现大量的数量冗余
2. 网状模型:解决了树状模型的数据冗余,缺点:网络太多,不便于维护
3. 关系模型:使用行和列作为基础,建立关系表,被广泛采用
说明:由于关系模型的出现,原来的数据库管理系统DBMS,衍生成关系数据库管理系统RDBMS,行业也默认将两者划成等号(实际为子系统):DBMS=RDBMS
4. E-R模型:ERM概念,实体关系建模(创建数据库的思路和步骤)
联系:一个或多个实体之间的关系
属性:实体的某一特性
四、操作数据库
1. sql语句
数据操作语言(DML):用于操作数据库对象中包含的数据。例如insert,update,delete
数据定义语言(DDL):用户定义和管理数据对象,包括数据库,表等。例如create,drop,alter
数据查询语言(DQL):用于查询数据库对象中包含的数据。例如select
数据控制语言(DCL):用于管理数据库的语言,包括管理权限以及数据更改。例如grant,revoke
2. 逻辑关系
文件系统的逻辑关系:
上层 :文件系统中的数据,文件
底层 :硬盘中的数据块
中间层:文件系统,将数据块以文件形式呈现
数据库的逻辑关系:
上层 :数据表
底层 :文件,相当于文件系统的上层
中间层:能够将文件逻辑成表的组件,即存储引擎,如MyISAM,InnoDB, Memory......
3. 存储引擎
说明: Mysql支持多种存储引擎,可以根据需要灵活的选择不同的存储引擎; 而ORACLE只支持一种存储引擎,这也是mysql流行的原因之一
MyISAM:最早的存储引擎,Mysql默认引擎,查询速度较快,而5.5版本以上默认为InnoDB;
缺点:
a. 不支持事务:事务,即一段sql语句的批处理,且具有原子性(要么所有语句都执行成功,要么都失败)
b. 不支持行级锁:行级锁(冲突少,但是速度慢,锁多行则需要执行多条命令),只有InnoDB支持,即锁定表中的某一行,不允许修改,同一个表中的其他行可以修改;支持表级锁(锁表速度快,但时冲突也比较多),锁定时,所有用户可以写入或者只能进行读取,不能修改;页级锁(行级锁和表级别锁折中,即锁定相邻的几行,不能跳跃),DBD存储引擎才支持
c. 不支持外键约束:域约束,即在某个位置只允许某种类型的数据限制;但是如果新建的数据符合类型,只是在对应的关系表中,没有该值定义,也不允许新建该条数据,即外键约束。主键约束、唯一性约束、检查性约束.......
InnoDB :对MyISAM的补充的一种存储引擎
Memory:基于内存的存储引擎,速度快,但是不能永久保存数据,需要和MyISAM或InnoDB结合起来使用,比较特殊
五、数据库结构
1. 存储管理器
权限以及完整性管理器组件:授予哪个客户什么权限,去执行
事务管理器组件:一个批处理文件中的所有命令,要么全部成功,要么全部失败
文件管理器组件:将文件和表建立起对应关系
缓冲区管理器组件:表表较大时,缓冲表中哪部分数据
2. 查询管理器
说明:接收、理解、提交请求,给存储管理器
查询执行引擎:将理解的请求提交给存储管理器
用户请求(应用程序、管理员手动执行sql命令、第三方API接口访问、第三方工具phpmyadmin图形化访问,监听在同一个套接字上)->查询管理器->存储管理器->本地磁盘
六、数据库工作模式
说明:采用单进程多线程模式;每一个线程负责一个用户的连接
守护线程:后台默认运行,不需要跟用户进行交互的进程,比如处理完请求,从缓存中拿出数据写进存储设备
应用线程:用户连接时分配给用户,用户断开时撤销的进程
七、数据库性能优化
1. 增加缓存机制,提高用户访问速度
2. 线程重用,当用户断开访问时,不断开线程,而是把线程给其他用户使用(因为在断开、建立线程时,会消耗系统资源)
3. 结合硬件和系统的兼容性,增加内存
八、数据库短板
SMP 对称多处理结构,一个查询语句请求只能由一个cpu来处理(框架写死了),其他cpu只能围观;如果同时有16个查询语句请求,则可以由16个cpul来处理;一般用户小企业,但是诸如淘宝之类大公司也在使用,因为用到了解决短板对应的技术,如集群、读写分离、分区分表等