MySql数据库基础
1.什么是数据库
用来存储数据。数据库可在硬盘及内存中存储数据
数据库与文件存储数据的区别
数据库本质也是通过文件来存储数据,数据库的概念就是系统的管理存储数据的文件
数据库介绍
本质就是存储数据的C/S架构的socket套接字软件
数据库服务器端:存放数据的主机集群
数据库客户端:可以连接数据库的任意客户端
数据库管理员:DBA
2.数据库基本概念
库:多个表构建一个数据库
表:多条数据构建一张表
记录:存放一条条数据,本质就是文件中的一条条数据记录
字段,字段,字段。。。==》一条数据
3.数据库分类
关系型数据库(MySQL 、Oracle 、 SQL server 、access、db2)
1.有表的概念
2.以表中一条条的纪录存储数据
非关系型数据库 (mongodb、redis、memcache)
1.有表的概念
2.以key-value键值对方式存储数据
4.数据库安装、启动与连接
安装 server端h和client端
如何启动server? 如果通过client连接server
前提:配置环境变量
1、前往数据库安装路径,bin文件夹下,cmd执行MySQL启动服务器端
2、前往数据库安装路径,bin文件夹下,cmd执行MySQL启动客户端链接服务器端
将MySQL服务器添加到系统服务,在系统服务中启动MySQL,命令:mysqld --install
进入系统 win+r=> services.msc=>找到MySQL服务手动启动或关闭
连接数据库:mysql -hlocalhost -P3306 -uroot -p
通过最高权限进入数据库,要采用root用户进入,连入本地数据库: mysql -uroot -p
查看MySQL版本:select version();
查看当前用户:select user();
查看MySQL下(当前用户可以操作的)数据库:show databases;
5.密码操作:
修改密码: mysqladmin -uroot -p旧密码 password“新密码”
忘记旧密码
1.绕过授权表启动服务(安全认证的服务停止):mysqld --skip-grant-tables;
2.以任意密码登陆root用户:mysql -uroot -p任意
3.更新密码: updata mysql.user set password=passwore("新密码")where user=root and host="localhost"
4.刷新权限:flush privileges;
6.统一字符编码
查看数据库配置信息
1.在mysql安装目录下:创建my.ini (my.cnf) (命令:type nul>文件名.文件后缀)
2.设置配置信息并保存
[mysqld]
character-set-server=utf8
collation-server=utf8_general_ci
[client]
default-character-set=utf8
3.重启服务
库的基本操作
1.增,创建数据库
采用默认编码集: create database db1; # db1为数据库名
自定义编码集: create database db1 charset="gbk";
2.查,查看数据库全部信息
纵观所有数据库: show databases;
详细信息: show create database db1;
3.改,修改数据库编码集
alter database db1 charset="utf8";
4.删, 移除数据库
drop database db1;
表的基本操作
进入指定数据库: use db1
确定当前使用的数据库: select database();
1.增, 创建表(字段1 类型, ..., 字段n 类型)
create table t1(name char, age int);
2.查,查看表信息
纵观所有数据库: show tables;
详细信息: show create table t1;
表字段结构信息: desc t1;
3.改
修改字段属性: alter table t1 modify name char(20);
修改字段名: alter table t1 change name usr char(16);
修改表名: alter table t1 rename t2;
4.删, 移除表
drop table t1;
字段的基本操作
1.增, 添加字段
insert into t1 (usr, age) values ("aa", 18),("bb", 8);
2.查
select * from t1;
3.改
update t1 set age=28 where usr="aa";
4.删
delete from t1 where age>8;
引擎与数据类型
前提: 引擎是建表是规定, 提供给表使用的, 不是数据库
mysql> show engines; # 展示所有引擎
mysql> use db1;
mysql> create table t1(id int)engine=innodb;
mysql> create table t2(id int)engine=myisam;
mysql> create table t3(id int)engine=blackhole;
mysql> create table t4(id int)engine=memory;
insert into t1 values(1);
insert into t2 values(1);
insert into t3 values(1);
insert into t4 values(1);
select * from t1; ...
创建表完整语法
‘‘‘
create table 表名(
字段名1 类型[(宽度) 约束条件],
字段名2 类型[(宽度) 约束条件],
字段名3 类型[(宽度) 约束条件]
)engine=innodb charset=utf8;
‘‘‘
数据库的模式
no_engine_substitution:非安全性,默认
strict_trans_tables:安全模式
show variables like "%sql_mode%"; # %匹配0~n个任意字符 => 模糊查询
set global sql_mode="strict_trans_tables";
quit
create table t1(name char(2));
insert into t1 values ("ab") # 正常
insert into t1 values ("zero") # 错误 Data too long for column ‘name‘ at row 1
数据类型
整型
‘‘‘类型
tinyint:1字节 -128~127
smallint:2字节
mediumint:3字节
int:4字节 -2147483648~2147483647
bigint:8字节
‘‘‘
‘‘‘约束 *
unsigned:无符号
zerofill:0填充
‘‘‘
create table t8(x tinyint);
insert into t8 values(200); # 非安全模式存入,值只能到最大值127
select x from t8;
‘‘‘宽度
1.不能决定整型存放数据的宽度, 超过宽度可以存放, 最终由数据类型所占字节决定
2.如果没有超过宽度,且有zerofill限制, 会用0填充前置位的不足位
3.没有必要规定整型的宽度, 默认设置的宽度就为该整型能存放数据的最大宽度 *
‘‘‘
create table t9(x int(5));
insert into t9 values(123456);
select (x) from t9; # 结果: 123456
insert into t9 values(2147483648);
select (x) from t9; # 结果: 2147483647
insert into t9 values(10);
select (x) from t9; # 结果: 10
create table t10(x int(5) unsigned zerofill); # 区域0~4294967295
insert into t10 values(10);
select x from t10; # 结果: 00010
insert into t10 values(12345678900);
select x from t10; # 结果: 4294967295
浮点型
‘‘‘类型
float:4字节,3.4E–38~3.4E+38 *
double:8字节,1.7E–308~1.7E+308
decimal:M,D大值基础上+2
‘‘‘
‘‘‘宽度:
限制存储宽度
(M, D) => M为总位数,D为小数位
float(255, 30):精度最低,最常用
double(255, 30):精度高,占位多
decimal(65, 30):字符串存,全精度
‘‘‘
create table t11 (age float(256, 30)); # Display width out of range for column ‘age‘ (max = 255)
create table t11 (age float(255, 31)); # Too big scale 31 specified for column ‘age‘. Maximum is 30.
create table t12 (x float(255, 30));
create table t13 (x double(255, 30));
create table t14 (x decimal(65, 30));
insert into t12 values(1.11111111111111111111);
insert into t13 values(1.11111111111111111111);
insert into t14 values(1.11111111111111111111);
select * from t12; # 1.111111164093017600000000000000 => 小数据,精度要求不高, 均采用float来存储
select from t13; # 1.111111111111111200000000000000
select * from t14; # 1.111111111111111111110000000000
alter table t14 modify x decimal(10, 5); # 1.11111 => 限制了数据的存储宽度
字符型
‘‘‘类型
char:定长
varchar:不定长
‘‘‘
‘‘‘宽度
限制存储宽度
char(4):以4个字符存储定长存储数据
varchar(4):数据长度决定字符长度,为可变长度存储数据
‘‘‘
create table t15 (x char(4), y varchar(4));
insert into t15 values("zero", ‘owen‘); # ‘‘ | "" 均可以表示字符
select x,y from t15; # 正常
insert into t15 values("yanghuhu", ‘lxxVSegon‘); # 非安全模式数据丢失,可以存放, 安全模式报错
select x,y from t15; # 可以正常显示丢失后(不完整)的数据
insert into t15 values(‘a‘, ‘b‘);
set global sql_mode="strict_trans_tables,PAD_CHAR_TO_FULL_LENGTH";
select char_length(x), char_length(y) from t15; # a占4 b占1
‘‘‘重点: 存储数据的方式 ** => 数据库优化
char: 一定按规定的宽度存放数据, 以规定宽度读取数据, 通常更占空间
varchar: 首先根据数据长度计算所需宽度, 并在数据开始以数据头方式将宽度信息保存起来, 是一个计算耗时过程, 取先读取宽度信息,以宽度信息为依准读取数据, 通常节省空间
‘‘‘
8: zero egon lxx yanghuhu
8: 4zero4egon3lxx8yanghuhu
注: varchar的数据头占1~2字节
规定char|varchar宽度均为4,用来存放4个字符的数据, char存取更高效,char占4字符,varchar占5字符,char更省空间
总结: 数据长度相近的数据提倡用char来存放数据, 数据需要高速存取,以空间换时间, 采用char
时间类型
‘‘‘类型
year:yyyy(1901/2155)
date:yyyy-MM-dd(1000-01-01/9999-12-31)
time:HH:mm:ss
datetime:yyyy-MM-dd HH:mm:ss(1000-01-01 00:00:00/9999-12-31 23:59:59)
timestamp:yyyy-MM-dd HH:mm:ss(1970-01-01 00:00:00/2038-01-19 ??)
‘‘‘
create table t16(my_year year, my_date date, my_time time);
insert into t16 values(); # 三个时间类型的默认值均是null
insert into t16 values(2156, null, null); # 在时间范围外,不允许插入该数据
insert into t16 values(1, ‘2000-01-01 12:00:00‘, null); # 2001 2000-01-01 null
insert into t16 values(2019, ‘2019-01-08‘, "15-19-30"); # time报格式错误 => 按照时间规定格式存放数据
alter table t16 change my_year myYear year(2); # 时间的宽度修改后还是采用默认宽度 => 不需要关系宽度
create table t17(my_datetime datetime, my_timestamp timestamp);
insert into t17 values(null, null); # 可以为空, 不能为null,赋值null采用默认值current_timestamp
insert into t17 values(‘4000-01-01 12:00:00‘, ‘2000-01-01 12:00:00‘); # 在各自范围内可以插入对应格式的时间数据
datetime:时间范围,不依赖当前时区,8字节,可以为null
timestamp:时间范围,依赖当前时区,4字节,有默认值CURRENT_TIMESTAMP
枚举与集合
‘‘‘类型
enum:单选
set:多选
‘‘‘
create table t19(
sex enum(‘male‘,‘female‘,‘wasai‘) not null default ‘wasai‘, # 枚举
hobbies set(‘play‘,‘read‘,‘music‘) # 集合
);
insert into t19 values (null, null); # sex不能设置null
insert into t19 values (); # wasai null
insert into t19 (hobbies) values (‘play,read‘), (‘music,play‘); # sex采用默认值, 对hobbies字段添加两条记录
insert into t19 (sex,hobbies) values (‘male,female‘, ‘play‘); # sex字段只能单选
约束条件
"""
primary key:主键,唯一标识,表都会拥有,不设置为默认找第一个 不空,唯一 字段,未标识则创建隐藏字段
foreing key:外键
unique key:唯一性数据, 该条字段的值需要保证唯一,不能重复
auto_increment:自增,只能加给key字段辅助修饰
not null:不为空
default:默认值
unsigned:无符号
zerofill:0填充
"""
注:
1.键是用来讲的io提供存取效率
2.联合唯一
create table web (
ip char(16),
port int,
unique(ip,port)
);
3.联合主键
create table web (
ip char(16),
port int,
primary key(ip,port)
);
create table t20 (
id int unique
);
create table web (
ip char(16),
port int,
unique(ip,port)
);
insert into web values (‘10.10.10.10‘, 3306), (‘10.10.10.10‘, 3306);
create table t21(id int auto_increment); # 自增约束必须添加给key的字段
create table t21(id int primary key auto_increment); # 自增要结合key,不赋值插入,数据会自动自增, 且自增的结果一直被记录保留
create table t22(
ip char(16),
port int,
primary key(ip,port)
);
insert into web values (‘10.10.10.10‘, 3306), (‘10.10.10.10‘, 3306);
表关系
1.表的详细操作
1.修改表名
alter table 旧表名 rename 新表名;
2.修改表的引擎与字符编码
alter table 表名 engine="引擎名" charset="编码名";
3.复制表 *
create table 新表名 like 旧表名;#只复制表的结构,包括约束
eg:
create table nt like tt; # 将tt的表结构复制到新表nt中, 约束条件一并复制
create table 新表名 select * from 旧表名;
注: 会复制表结构+数据, 但不会复制约束条件
eg:
create table nt1 select * from tt where 1=2; # 将tt的表结构复制到新表nt1中, 键(相关)的约束条件不会复制
4.清空表
truncate 表名;
注:表被重置,自增字段重置
表中字段的详细操作
create table t2(
id int primary key auto_increment,
x int,
y int
);
insert into t2(x, y) values(10, 20), (100, 200), (1000, 2000);
1.修改字段信息
alter table 表名 modify 字段名 类型[(宽度) 约束];
alter table t2 modify x bigint default 0; # 模式不同, 涉及精度问题
2.修改字段名及信息
alter table 表名 change 旧字段名 新字段名 类型[(宽度) 约束];
alter table t2 change y c char(10) not null; # 模式不同, 涉及类型转换问题
3.添加字段名
alter table 表名 add 字段名 类型[(宽度) 约束], ..., add 字段名 类型[(宽度) 约束];
alter table t2 add age int, add gender enum("male", "female", "wasai") default "wasai";
alter table 表名 add 字段名 类型[(宽度) 约束] first;
alter table 表名 add 字段名 类型[(宽度) 约束] after 旧字段名;
alter table t2 add y int after x;
4.删除字段名
alter table 表名 drop 字段名;
alter table t2 drop y;
5.移动字段名
alter table t1 modify 字段名 类型[(宽度) 约束] first;
alter table t1 modify 字段名 类型[(宽度) 约束] after 指定字段名;
???
如果想删除自增约束,如何操作?
auto_increment 需跟在key后,比如自增的是id,表t1:
alter table t1 change id id int;
特殊表 (mysql.user) => 用户管理
mysql -uroot -p
1.重要字段
Host | User | Password
2.新建用户
create user 用户名@主机名 identified by ‘密码‘; # 正确
create user zero@localhost identified by ‘zero‘;
注:insert into mysql.user(Host,User,Password) values("主机名","用户名",password("密码")); # 错误
3.设置用户权限
grant 权限们 on 数据库名.表名 to 用户名@主机名 [with grant option];
grant create on db1. to zero@localhost with grant option;
重点: grant all on db1.* to owen@localhost identified by ‘owen‘; # (创建用户)设置权限
4.撤销权限
revoke 权限名 on 数据库名.表名 from 用户名@主机名;
revoke delete on db1.* from owen@localhost;
5.修改密码
set password for 用户名@主机名 = password(‘新密码‘);
set password for owen@localhost = password(‘123‘);
6.删除用户
drop user 用户名@主机名;
‘‘‘
表关系
社会中存储需要可以构建成表的数据, 它们形成的表,往往之间存储某种或某些社会关系,
mysql数据库建立表结构就是社会中产生的各种数据, 分门别类管理
但mysql建立的(代码层次的)表之间, 同样需要处理表与表之间的关系
形成了 多对一 | 多对多 | 一对一 三种关系
‘‘‘
外键直接影响数据库效率,但会提高数据的完整性(安全),一般首先效率,因为安全可以通过其他方式来处理
‘‘‘
多对一
案例:员工employees表 | 部门department表
建表规则:
先建立主表,再建立从表,在从表中设置主表的唯一字段(通常为主键)作为外键
建表语法:
create table 主表(
id int primary key auto_increment,
...
);
create table dep(
id int primary key auto_increment,
name varchar(16),
work varchar(16)
);
create table 从表(
id int primary key auto_increment,
...
主表_id int, # 只是在从表中起了一个名字, 该名字和主表主键对应,所有起了个见名知义的名字
foreign key(主表_id) references 主表(唯一字段名id)
on update cascade
on delete cascade
);
create table emp(
id int primary key auto_increment,
name varchar(16),
salary float,
dep_id int,
foreign key(dep_id) references dep(id)
on update cascade # 设置级联
on delete cascade
);
插入记录规则:
先插入主表数据,再插入从表数据
insert into dep values(1, ‘市场部‘, ‘销售‘), (2, ‘教学部‘, ‘授课‘);
insert into emp(name, salary, dep_id) values(‘egon‘, 3.0, 2),(‘yanghuhu‘, 2.0, 2),(‘sanjiang‘, 10.0, 1),(‘owen‘, 88888.0, 2),(‘liujie‘, 8.0, 1);
更新删除数据:
两表间相互影响,先从依赖数据入手,再进行更新删除操作
eg:1
删除主表dep中一个部门
delete from dep where id=1; => 从表emp中属于该部门的员工都被删除了
更新从表emp中一个员工的部门
update emp set dep_id=3 where name=‘egon‘; <= 部门必须存在
insert into dep values(3, ‘管理部‘, ‘吃饭睡觉打豆豆, 明确团队方针‘);
多对多
案例:作者author表 | 书book表
建表规则:
新建第三张表,通过两个外键形成多对多关系
建表语法:
create table 表1(
id int primary key auto_increment,
...
);
create table book(
id int primary key auto_increment,
name varchar(16),
price int
);
create table 表2(
id int primary key auto_increment,
...
);
create table author(
id int primary key auto_increment,
name varchar(16)
);
create table 关系表(
id int primary key auto_increment,
表1_id int,
表2_id int,
foreign key(表1_id) references 表1(id)
on update cascade
on delete cascade,
foreign key(表2_id) references 表2(id)
on update cascade
on delete cascade
);
create table book_author(
id int primary key auto_increment,
book_id int,
author_id int,
foreign key(book_id) references book(id)
on update cascade
on delete cascade,
foreign key(author_id) references author(id)
on update cascade
on delete cascade
);
一对一
为了提高效率,强行将海量数据中相关信息抽离成一个对应表来与依赖表形成一对一
案例:丈夫husband表 | 妻子wife表
建表规则:
未存放外键的表被依赖,称之为左表;存放外键的表示依赖表,称之为右表;先操作左边再操作右表
建表语法:
create table 左表(
id int primary key auto_increment,
...
);
create table husband(
id int primary key auto_increment,
name varchar(16)
);
create table 右表(
id int primary key auto_increment,
...
左表_id int unique, # 一对一的外键需要唯一性
foreign key(左表_id) references 左表(id)
on update cascade
on delete cascade
);
create table wife(
id int primary key auto_increment,
name varchar(16),
husband_id int unique, # 一对一的外键需要唯一性
foreign key(husband_id) references husband(id)
on update cascade
on delete cascade
);
练习
练习
查询语句
sql_mode配置
sql_mode=ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION
增语法
1.所有数据按顺序插入
insert [into] 表名 values (值1, ..., 值n)[, ..., (值1, ..., 值n)];
2.指定字段匹配插入,可以任意顺序
insert [into] 表名(字段2, 字段1, ..., 字段n) values (值2, 值1, ..., 值n)[, ..., (值2, 值1, ..., 值n)];
3.插入查询结果
insert [into] 表1(字段1, ..., 字段n) select 字段1, ..., 字段n from 表2 [条件];# 表2与表1字段相同或要插入至表1的字段与表1相同时,表1后字段可以*替
create table t1(
id int auto_increment,
x int,
y int,
primary key(id)
);
insert t1 values(1,2,3),(2,3,4); # 按顺序插入
insert into t1(y,x) values (5,4); # 按规定字段顺序
create table nt1 like t1;复制表即完整结构
insert into nt1 select * from t1; # 创建新表并按照字段顺序指定插入复制数据
删语法
1.会记录自增信息,操作会被日志记录,效率低
delete from [库名].表名 [条件];
delete from t1; # 没有条件的情况下是清空所有数据。但会记录自增的约束
insert into t1(x,y)values(6,66)
2.清空表,会重置自增信息
truncate table 表名;
truncate table nt1;
insert into nt1(x, y) values(6, 66);
改语法
update 表名 set 字段1=值1[, ..., 字段n=值n] [条件]
updata tt1 set x=666;# 无条件,全改
update tt1 set x=777, z=555 where z<888; # 只修改满足条件的行
没有满足条件的不改变
查询语法
select [distinct] 字段1 [as 别名], ..., 字段n [as 别名] from [库名.]表名
[
where 约束条件
group by 分组依据 =》查询结果只能为聚合结果或分组字段
having 筛选,过滤条件=》对聚合结果的筛选
order by 排序的字段=》asc|desc
limit 限制显示的条数 =>n| i,n
];
注:
1.查表中所有字段用*表示
2.条件的书写规则严格按照语法顺序书写,可以缺省,但不可以错序
3.约束条件的流程:from -> where -> group by -> having -> distinct -> order by -> limit
4.字段可以起别名
5.字段可以直接做运算 select age + 1 ‘new_age‘ from emp;
6.分组后的条件均可以使用聚合函数
"""
def select(from=from, where=null, ..., limit=null):
file = from()
res = where(file) if where else file
res = group_by(res) if group_by else res
...
res = limit(res) if limit else res
return res
select(where=where, group_by=group_by)
"""
单表依赖数据
CREATE TABLE ‘emp‘ (
id
int(0) NOT NULL AUTO_INCREMENT,
name
varchar(10) NOT NULL,
gender
enum(‘男‘,‘女‘,‘未知‘) NULL DEFAULT ‘未知‘,
age
int(0) NULL DEFAULT 0,
salary
float NULL DEFAULT 0,
area
varchar(20) NULL DEFAULT ‘中国‘,
port
varchar(20) DEFAULT ‘未知‘,
dep
varchar(20),
PRIMARY KEY (id
)
);
INSERT INTO emp
VALUES
(1, ‘yangsir‘, ‘男‘, 42, 10.5, ‘上海‘, ‘浦东‘, ‘教职部‘),
(2, ‘engo‘, ‘男‘, 38, 9.4, ‘山东‘, ‘济南‘, ‘教学部‘),
(3, ‘jerry‘, ‘女‘, 30, 3.0, ‘江苏‘, ‘张家港‘, ‘教学部‘),
(4, ‘tank‘, ‘女‘, 28, 2.4, ‘广州‘, ‘广东‘, ‘教学部‘),
(5, ‘jiboy‘, ‘男‘, 28, 2.4, ‘江苏‘, ‘苏州‘, ‘教学部‘),
(6, ‘zero‘, ‘男‘, 28, 8.8, ‘中国‘, ‘黄浦‘, ‘咨询部‘),
(7, ‘owen‘, ‘男‘, 28, 8.8, ‘安徽‘, ‘宣城‘, ‘教学部‘),
(9, ‘ying‘, ‘女‘, 36, 1.2, ‘安徽‘, ‘芜湖‘, ‘咨询部‘),
(10, ‘kevin‘, ‘男‘, 36, 5.8, ‘山东‘, ‘济南‘, ‘教学部‘),
(11, ‘monkey‘, ‘女‘, 28, 1.2, ‘山东‘, ‘青岛‘, ‘教职部‘),
(12, ‘san‘, ‘男‘, 30, 9.0, ‘上海‘, ‘浦东‘, ‘咨询部‘),
(13, ‘san1‘, ‘男‘, 30, 6.0, ‘上海‘, ‘浦东‘, ‘咨询部‘),
(14, ‘san2‘, ‘男‘, 30, 6.0, ‘上海‘, ‘浦西‘, ‘教学部‘);
常用内部函数
concat(字段1,...,字段n):完成字段的拼接
concat_ws(x, 字段1,...,字段n):完成字段的拼接,x为连接符
lower():小写
upper():大写
ceil():向上取整
floor():向下取整
round():四舍五入
简单查询
去重前提:所查所有字段的综合结果完全一致/相同,才认为是重复的,只保留重复中的一行数据
select distinct * from emp; # 去重,去的是所查结果完全相同的
select contat(area,‘-‘,port)[as ‘xx‘] from emp; # 上海-浦东 属于起的别名xx 列
select contat_ws("-",name,area,port)[as ‘xx‘] from emp; #以"-"字符拼接后面的所有字段
select upper(name) ‘name‘, gender, age from emp; # 可以指定多个字段
select name, ceil(salary), floor(salary), round(salary) from emp where name=‘kevin‘; # 数学函数
where 条件
1.比较运算符
= | < | > | <= | >= | !=
select * from emp where area!="上海";
2.区间运算符
between 10 and 20:10~20
in(10, 20, 30):10或20或30
select * from emp where id between 3 and5; # [3,5]闭合的区间
select * from emp where id in (2,4,6,8);# 分离的区间 2,4,6,8,10,12,14都会被显示
3.逻辑运算符
and | or | not
select * from emp where area="山东" and port="济南";
4.相似运算符
like ‘_owen%‘:模糊匹配字符串owen,_表示一个字符,%表示任意字符
select * from emp where name like ‘__en%‘; # 在en前可以出现2个任意字符, 之后可以出现0或多个任意字符
需求:
查找姓名有数字的员工信息
正则匹配
对like的扩展,like完成模糊匹配,但功能局限,可以模糊个数,但不能模糊类型。正则可以完成类型及个数的模糊匹配
语法:字段 regexp ‘正则表达式‘
注:只支持部分正则语法
select * from emp where name regexp ‘.[0-9]+.‘;
group by 分组
注意:分了组,一个组就是一个整体, 你不能直接拿到组里的具体的某一条信息(安全模式下会报错), 但是你可以用比如max的方法取出每个组信息里的最大值
分组:根据字段相同值形成不同的类别,不明确分组其实整个表就为一个默认大组
原因:把以值共性得到的类别作为考虑单位,不再关系单条记录,而且一组记录
结果:只能考虑组内多条数据的聚合 结果 (聚合函数结果),分组的字段同样是聚合结果,如:组内的最大最小值
sql_mode=ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION
聚合函数:
max():最大值
min():最小值
avg():平均值
sum():和
count():记数
group_concat():组内字段拼接,用来查看组内其他字段
eg:1
每个部门的平均薪资
select dep, avg(salary) ‘平均薪资‘ from emp group by dep;
eg:2
每个部门都有哪些人
select dep, group_concat(name) from emp group by dep;
需求:
各性别中附属于教学部的最高薪资
select max(salary) ‘最高薪资‘, gender from emp where dep=‘教学部‘ group by gender;
思考:
想知道需求中员工的姓名 => 子查询
思考:
想知道需求中员工的姓名 => 子查询
上方结果: 男的最高薪资对应的人名, 女的最高薪资对应的人名
select max(salary)"最高薪资",gender,name from emp where dep = "教学部" group by gender;
‘‘‘
‘‘‘
14条数据部门有3个, 并且每个部分有多条记录, 可以作为分组依据, 同理, 性别也可以
select dep from emp group by dep;
如果就像以姓名进行分组, 可以, 但没多大意义, 原因name值基本上都不相同, 以组考虑会导致组内大多只要一条记录(自成一组), 组的利用就不是很强烈, 此类分组是无意义的
select name from emp group by name; # 可以分组, 意义不大
考虑的三个问题: 以什么分组(相同数据较多的字段) 分组后的考虑单位(组并非组内的每一条记录) 可以查询的结果(当前分组的字段及聚合函数形成的聚合结果)
解决分组中思考题的过程
子查询
子查询:将一条查询结果作为另外一条查询的条件
语法:一条select语句用()包裹得到的结果作为另一条select语句的条件
单行子查询:
子查询语句的结果为一行数据,可以结合 = | < | > | <= | >= | != 运算符来完成父查询
select salary from emp where salary > 10; # => 作为子查询
eg: 1
select name, gender, area from emp where salary = (select salary from emp where salary > 10);
多行子查询:
子查询语句的结果为多行数据,可以结合 in | all | any 运算符来完成父查询
in:任意单一值,只能考虑子查询中的一个结果
all:全部值,将子查询结果作为一个整体考虑
any:任意多个值:子查询的每一个结果都可以作为参考依据
eg: 2
select name from emp where salary in (select max(salary) ‘最高薪资‘ from emp where dep=‘教学部‘ group by gender);
select * from emp where salary < all(select max(salary) ‘最高薪资‘ from emp where dep=‘教学部‘ group by gender);
select * from emp where salary > any(select max(salary) ‘最高薪资‘ from emp where dep=‘教学部‘ group by gender);
having 筛选
why:完成在分组之后的筛选
注意:having条件是实现聚合结果层面上的筛选 => 拿聚会结果完成判断
需求:
1.各部门的平均薪资
select dep, avg(salary) ‘平均薪资‘ from emp group by dep;
2.平均薪资大于6w的部门(部门与部门的平均薪资)
解决: 以dep进行分组, 以avg(salary)作为判断条件(筛选)
select dep, avg(salary) ‘平均薪资‘ from emp group by dep having avg(salary) > 6;
select max(salary) from emp having max(salary) > 9.4;
order by 排序
why:完成排序
注意:可以使用聚合函数,哪怕没有明确group by
升序 | 降序:asc | desc
eg:order by age desc => 按照年龄降序
select * from emp order by age desc;
需求:
将部门按照工资降序方式排序
select dep, avg(salary) from emp group by dep order by avg(salary) desc;
limit 限制
why:限制最终结果的显示数据行数
注意:limit只与数字结合使用
应用:
limit 1:只能显示一行数据
limit 6,5:从第6+1行开始显示5条数据(索引从0开始)
select * from emp limit 1;
select * from emp limit 6,5;
需求:
获得薪资最高的人的一条信息
select * from emp order by salary desc limit 1;
练习
练习
多表操作
多表依赖数据
create table dep(
id int primary key auto_increment,
name varchar(16),
work varchar(16)
);
create table emp(
id int primary key auto_increment,
name varchar(16),
salary float,
dep_id int
);
insert into dep values(1, ‘市场部‘, ‘销售‘), (2, ‘教学部‘, ‘授课‘), (3, ‘管理部‘, ‘开车‘);
insert into emp(name, salary, dep_id) values(‘egon‘, 3.0, 2),(‘yanghuhu‘, 2.0, 2),(‘sanjiang‘, 10.0, 1),(‘owen‘, 88888.0, 2),(‘liujie‘, 8.0, 1),(‘yingjie‘, 1.2, 0);
笛卡尔积(交叉连接)
select * from emp;
select * from dep;
select * from emp where dep_id in (select id from dep); # Empty set (0.06 sec)
默认查询结果:笛卡尔积
select * from emp, dep; # Empty set (0.07 sec)
数学概念:A{a, b}B{0, 1, 2} => O{{a, 1}, {a, 2}, {a, 3}, {b, 1}, {b, 2}, {b, 3}}
交叉查询:select from emp,dep;| select * from emp course join dep;
select * from emp, dep where db2.emp.dep_id = db2.dep.id; # 同sql语句上表现是从两张表拿数据
合理对应关系的虚拟表
select * from emp, dep where emp.dep_id = dep.id;
注:虚拟表中可能出现重复字段,需要在sql语句中明确实体表名
多表连接(*****)
===>虚拟的单表
用专业的语法来关联多表
内连接
内连接:结果为两张表有对应关系的数据(emp有dep无\emp无dep有的数据均不会被显示)
语法:左表 inner join 右表 on 两表有关联的字段的条件
eg:
select * from emp inner join dep on emp.dep_id = dep.id;
左连接
左连接:在内连接的基础上还保留左表的记录
语法:左表 left join 右表 on 两表有关联的字段的条件
eg:
select * from emp left join dep on emp.dep_id = dep.id;
右连接
右连接:在内连接的基础上还保留右表的记录
语法:左表 right join 右表 on 两表有关联的字段的条件
eg:
select * from emp right join dep on emp.dep_id = dep.id;
全连接
全连接:在内连接的基础上分别保留这左表右表的记录
语法:mysql没有full join on语法,但可以通过去重达到效果
eg:
select * from emp left join dep on emp.dep_id = dep.id
union # ???
select * from emp right join dep on emp.dep_id = dep.id;
练习
1.查询每一位员工对应的工作职责
=> 左表为dep表, 那么右表的所有数据均需要被保留, 所有采用右连接
select emp.name, dep.work from dep right join emp on emp.dep_id = dep.id;
2.查询每一个部门下的员工们及员工职责
select max(dep.name), max(dep.work), group_concat(emp.name) from dep left join emp on emp.dep_id = dep.id group by emp.dep_id;
navicat
Navicat Premium是一款专业的数据管理工具,
支持连接MsSql、MySQL、SQLite、Oracle、PostgreSQL等类型的数据库,
可导入/导出连接。编辑数据库各项数据。
同步传输数据或数据库结构,
在数据库或模式中查找数据。
2.连接数据库,并建库
3.创建表、设置字段、插入数据
4.新建查询
python使用mysql
1.建立连接
conn = pymysql.connect(host="localhost", port=3306, db=‘db2‘, user=‘root‘, password=‘root‘)
2.设置字典类型游标
cursor = conn.cursor(pymysql.cursors.DictCursor)
line=cursor.execute(sql,args)args=>防注入,其可为元组|列表|字典
3.执行sql语句并使用执行结果
sql = ‘select * from emp‘
line = cursor.execute(sql)
print(line)
‘‘‘
date=cursor.fetchone()当前游标往后获取一行记录
cursor.fetchall()当前游标往后所有的记录
scroll(num, mode="relative|absolute")
relative: 游标从当前位置往后移动num行
ablolute: 游标从头往后移动num行, 一般可以结合line来使用能定位到任意位置
‘‘‘
tag = cursor.fetchone() # 第一条
print(tag)
print(tag[‘salary‘])
tag = cursor.fetchone() # 第二条
print(tag)
cursor.scroll(1, mode=‘relative‘) # 偏移第三条
tags = cursor.fetchall() # 第四条到最后
print(tags)
4.断开连接
cursor.close()
conn.close()
pymysql处理了sql注入
sql = ‘select * from user where usr="%s" and pwd="%s"‘ % (usr, pwd)
res = cursor.execute(sql)
import pymysql
conn = pymysql.connect(host=‘localhost‘, port=3306, user=‘root‘, passwd=‘root‘, db=‘db2‘)
cursor = conn.cursor(pymysql.cursors.DictCursor)
usr = input("请输入用户名: ") #abc
pwd = input("请输入密码: ") #123
sql = ‘select * from user where usr=%s and pwd=%s‘
res = cursor.execute(sql, (usr, pwd))
if res:
print(‘login success‘)
else:
print(‘login failed‘)
cursor.close()
conn.close()
增删改
import pymysql
conn = pymysql.connect(host=‘localhost‘, port=3306, user=‘root‘, passwd=‘root‘, db=‘db2‘)
cursor = conn.cursor(pymysql.cursors.DictCursor)
sql1 = ‘insert into user(usr, pwd) values (%s, %s)‘# cursor执行sql语句,在内存中完成了对数据的插入, 但不能将数据存放到硬盘.会将id完成自增
cursor.execute(sql1, ("opq", "123"))
cursor.executemany(sql1, [("aaa", "000"), ("bbb", "111")])
conn.commit()
sql2 = ‘delete from user where usr=%s‘
cursor.execute(sql2, ("aaa"))
conn.commit()
sql3 = ‘update user set pwd=%s where usr=%s‘
res = cursor.execute(sql3, ("222", "bbb"))
conn.commit()
练习
1、准备数据
create table book(
id int primary key auto_increment,
name varchar(16),
price int
);
create table author(
id int primary key auto_increment,
name varchar(16)
);
create table book_author(
id int primary key auto_increment,
book_id int,
author_id int
);
insert into book values(1, ‘葵花宝典‘, 88), (2, ‘九阴真经‘, 78), (3, ‘辟邪剑谱‘, 99);
insert into author values(1, ‘张全蛋‘), (2, ‘李诞‘), (3, ‘寡人‘);
insert into book_author(id, book_id, author_id) values(1,1,1),(2,1,2),(3,1,3),(4,2,1),(5,2,3),(6,3,2),(7,3,2);
id name pirce
1 葵花宝典 88
2 九阴真经 78
3 辟邪剑谱 99
id name
1 张全蛋
2 李诞
3 寡人
id book_id author_id
1 1 1
2 1 2
3 1 3
4 2 1
5 2 3
6 3 2
7 3 2
2、查看每本书的作者们
select book.name,group_concat(distinct author.name) from book left join book_author on book.id=book_author.book_id inner join author on author.id=book_author.author_id group by book.name;
1.去重
select distinct book_id,author_id from book_author;
2.连表
book inner join author inner join (select distinct book_id,author_id from book_author)as ba on book_id=ba.book_id and author.id=ba.author_id;
3.分组
group by ba.book_id;
4.查询字段
select book.name,group_concat(author.name)
5.结果
select max(book.name),group_concat(author.name)from book inner join author inner join (select distinct book_id,author_id from book_author;
)as ba on book_id=ba.book_id and author.id=ba.author_id group by ba.book_id;
视图
3、查看每位作者都有哪些作品
select author.name,group_concat(distinct book.name) from book right join book_author on book.id=book_author.book_id inner join author on author.id=book_author.author_id group by author.name;
4、假设每本书各卖出10本,每位作者的收益是多少
按作者分组--》看查啥字段--》=好--》看查出的字段是几条数据--》数据关系--》再按作者分组,求和
select author.name author_name,sum(book.price*10) money
from author,book,book_author c
where author.id = c.author_id and book.id = c.book_id
group by author.name;
5、一个历史操作残留的数据库表user,有自增主键id,账号usr及密码pw两个字段,有4条数据,但数据id值分别为2,3,5,7(第1条数据等被删除操作了),现需求要保证数据主内容不变,重构数据索引从1开始,4条数据id分别修改为1,2,3,4
create table new_user select * from user;
truncate user;
insert into user(usr,pwd)select usr,pwd from new_user;
drop table new_user;
6、通过pymysql完成对表emp的完全拷贝(结果+数据),得到新表new_emp
import pymysql
conn=pymysql.connect(
host="localhost",
port=3306,
user="root",
password="root",
db="db1"
)
cursor = conn.cursor(pymysql.cursors.DictCursor)
sql1 = "create table new_emp like emp "
sql2 ="insert into new_emp select * from emp"
cursor.execute(sql)
cursor.execute(sql)
conn.commit()
cursor.close()
conn.close()
7、实现注册功能
账号密码由控制台录入
数据库已有该用户则提示用户登录
数据库没有该用户则完成注册
usr=input("输入账号")
pwd=input("输入密码")
emmm 我知道我没写完,就酱。。什么时候想起来有空了我会再捋一遍的!!!
数据库高级
一.视图
what: 由一张表或多张表的查询结果形成的一张虚拟表 -- 有实体的表结构 | 没有实体属于自己的数据, 数据来源于真实表 | (没有键, 存在于真实表) why: 多张表的某一查询结果需要不断的重复使用(复用性) | 一张表可以通过不同需求(权限)来形成多张子表
视图的另一个作用是,可以不同的视图来展示开放不同数据的访问
例如,同一张工资表,老板可以查看全部,部门主管可以查看该部门所有人,员工只能看自己的一条记录
创建视图
CREATE [OR REPLACE] VIEW view_name [(column_list字段名们)]
AS select_statement查询结果
加上OR REPLACE 时如果已经存在相同视图则替换原有视图
column_list指定哪些字段要出现在视图中
注意:由于是一张虚拟表,视图中的数据实际上来源于其他其他表,所以在视图中的数据不会出现在硬盘上
使用视图
视图是一张虚拟表 所以使用方式与普通表没有任何区别
查看视图
1.desc view_name; //查看数据结构
2.show create view view_name;//查看 创建语句
修改视图
alter view_name select_statement
删除视图
drop view view_name
案例1: 简化多表sql语句
create database db02 charset utf8;
use db02
create table student(
s_id int(3),
name varchar(20),
math float,
chinese float
);
insert into student values(1,‘tom‘,80,70),(2,‘jack‘,80,80),(3,‘rose‘,60,75);
create table stu_info(
s_id int(3),
class varchar(50),
addr varchar(100)
);
insert into stu_info values(1,‘二班‘,‘安徽‘),(2,‘二班‘,‘湖南‘),(3,‘三班‘,‘黑龙江‘);
create view stu_v (编号,姓名,班级) as
select
student.s_id,student.name ,stu_info.class
from student,stu_info
where student.s_id=stu_info.s_id;
select *from stu_v;
案例2: 隔离数据
create table salarys(
id int primary key,
name char(10),
salary double,
dept char(10)
);
insert into salarys values
(1,"刘强东",900000,"市场"),
(2,"马云",800090,"市场"),
(3,"李彦宏",989090,"财务"),
(4,"马化腾",87879999,"财务");
create view dept_sc as select *from salarys where dept = "市场";
select *from dept_sc;
注意 对视图数据的insert update delete 会同步到原表中,但由于视图可能是部分字段,很多时候会失败
总结:mysql可以分担程序中的部分逻辑,但这样一来后续的维护会变得更麻烦
如果需要改表结构,那意味着视图也需要相应的修改,没有直接在程序中修改sql来的方便
二.触发器
what: 在一个表数据发生变化时(增删改), 触发(对另一表)某项功能(执行sql语句块) why: 需要完成的操作基于对某一种表的增删改操作
创建触发器
delimiter &&
CREATE TRIGGER t_name t_time t_event ON table_name FOR EACH ROW
begin
stmts.....
end &&
delimiter ;
结论: 触发器内不能出现查询语句(Not allowed to return a result set from a trigger), 不对对自身表完成增删改查
支持的时间点(t_time):时间发生前和发生前后 before|after
支持的事件(t_event): update insert delete
在触发器中可以访问到将被修改的那一行数据 根据事件不同 能访问也不同 update 可用OLD访问旧数据 NEW访问新数据 insert 可用NEW访问新数据 delete 可用OLD访问旧数据
可以将NEW和OLD看做一个对象其中封装了这列数据的所有字段
案例:有cmd表和错误日志表,需求:在cmd执行失败时自动将信息存储到错误日志表中
CREATE TABLE cmd (
id INT PRIMARY KEY auto_increment,
USER CHAR (32),
priv CHAR (10),
cmd CHAR (64),
sub_time datetime, #提交时间
success enum (‘yes‘, ‘no‘) #0代表执行失败
);
CREATE TABLE errlog (
id INT PRIMARY KEY auto_increment,
err_cmd CHAR (64),
err_time datetime
);
delimiter //
create trigger trigger1 after insert on cmd for each row
begin
if new.success = "no" then
insert into errlog values(null,new.cmd,new.sub_time);
end if;
end//
delimiter ;
INSERT INTO cmd (
USER,
priv,
cmd,
sub_time,
success
)
VALUES
(‘egon‘,‘0755‘,‘ls -l /etc‘,NOW(),‘yes‘),
(‘egon‘,‘0755‘,‘cat /etc/passwd‘,NOW(),‘no‘),
(‘egon‘,‘0755‘,‘useradd xxx‘,NOW(),‘no‘),
(‘egon‘,‘0755‘,‘ps aux‘,NOW(),‘yes‘);
select *from errlog;
delimiter 用于修改默认的行结束符 ,由于在触发器中有多条sql语句他们需要使用分号来结束,但是触发器是一个整体,所以我们需要先更换默认的结束符,在触发器编写完后在将结束符设置回分号
注意:
外键不能触发事件 主表删除了某个主键 从表也会相应删除 但是并不会执行触发器。触发器中不能使用事务,相同时间点的相同事件的触发器 不能同时存在
删除触发器
语法:
drop trigger trigger_name;
案例:
drop trigger trigger1;
同样的这种需求我们完全可以在python中来完成! mysql最想完成的事情是讲所有能处理的逻辑全部放到mysql中,那样一来应用程序开发者的活儿就变少了,相应的数据库管理员的工资就高了,可惜大多中小公司都没有专门的DBA;
疑惑:修改行结束符后,触发器内的sql语句任然是以分号结束,为什么? 实际上在mysql中输入分号回车,mysql会立即将语句发送给服务器端,修改行结束符仅仅是告诉mysql客户端,语句没有写完,不要立即发送!
三.事务
what: 一组sql操作, 要么全部成功, 要么全部失败 why: 一组操作需要同时成功,否则就判定为失败, 要将其构建成事务
例如转账操作,
1.从原有账户减去转账金额
2.给目标账户加上转账金额
若中间突然断电了或系统崩溃了,钱就不翼而飞了!
使用事务
start transaction; --开启事物,在这条语句之后的sql将处在同一事务,并不会立即修改数据库
commit;--提交事务,让这个事物中的sql立即执行数据的操作,
rollback;--回滚事务,取消这个事物,这个事物不会对数据库中的数据产生任何影响
案例:转账过程中发生异常
create table account(
id int primary key auto_increment,
name varchar(20),
money double
);
insert into account values(1,‘赵大儿子‘,1000);
insert into account values(2,‘刘大牛‘,1000);
insert into account values(3,‘猪头三‘,1000);
insert into account values(4,‘王进‘,1000);
insert into account values(5,‘黄卉‘,1000);
update account set money = money - 1000 where id = 1;
update account set moneys = money - 1000 where id = 1; # money打错了导致执行失败
sql = ‘update account set money = money - 1000 where id = 1;‘
sql2 = ‘update account set moneys = money + 1000 where id = 2;‘ # money打错了导致执行失败
try:
cursor.execute(sql)
cursor.execute(sql2)
conn.commit()
except:
conn.rollback()
注意:事务的回滚的前提是能捕捉到异常,否则无法决定何时回滚,Python中很简单就实现了,另外mysql中需要使用存储过程才能捕获异常!
事务的四个特性:
原子性:事务是一组不可分割的单位,要么同时成功,要么同时不成功
一致性:事物前后的数据完整性应该保持一致,(数据库的完整性:如果数据库在某一时间点下,所有的数据都符合所有的约束,则称数据库为完整性的状态);
隔离性:事物的隔离性是指多个用户并发访问数据时,一个用户的事物不能被其它用户的事务所干扰,多个并发事务之间数据要相互隔离
持久性:持久性是指一个事物一旦被提交,它对数据的改变就是永久性的,接下来即使数据库发生故障也不应该对其有任何影响
事务的用户隔离级别:
数据库使用者可以控制数据库工作在哪个级别下,就可与防止不同的隔离性问题
read uncommitted --不做任何隔离,可能脏读,幻读
read committed----可以防止脏读,不能防止不可重复读,和幻读,
Repeatable read --可以防止脏读,不可重复读,不能防止幻读
Serializable--数据库运行在串行化实现,所有问题都没有,就是性能低
修改隔离级别:
select @@tx_isolation;--查询当前级别
set[session|global] transaction isolation level .... ;修改级别
实例:
set global transaction isolation level Repeatable read ;
修改后重新连接服务器生效
四.存储过程
1.什么是存储过程
存储过程是一组任意的sql语句集合,存储在mysql中,调用存储过程时将会执行其包含的所有sql语句;与python中函数类似;
2.为什么使用存储过程
回顾触发器与视图都是为了简化应用程序中sql语句的书写,但是还是需要编写,而存储过程中可以包含任何的sql语句,包括视图,事务,流程控制等,这样一来,应用程序可以从sql语句中完全解放,mysql可以替代应用程序完成数据相关的的逻辑处理!
那我们以后都是用存储过程不就完了?
三种开发方式对比
1.应用程序仅负责业务逻辑编写,所有与数据相关的逻辑都交给mysql来完成,通过存储过程(推荐使用)
优点:
应用程序与数据处理完解耦合,一堆复杂的sql被封装成了一个简单的存储过程,考虑到网络环境因素,效率高
应用程序开发者不需要编写sql语句,开发效率高
缺点:
python语法与mysql语法区别巨大,学习成本高,并且各种数据库的语法大不相同,所以移植性非常差
应用程序开发者与BDA的跨部门沟通成本高,造成整体效率低
2.应用程序不仅编写业务逻辑,还需要编写所有的sql语句
优点:扩展性高,对于应用程序开发者而言,扩展性和维护性相较于第一种都有所提高
缺点:sql语句过于复杂,导致开发效率低,且需要考虑sql‘优化问题
3.应用程序仅负责业务逻辑,sql语句的编写交给ORM框架,(常用解决方案)
优点:应用程序开发者不需要编写sql语句,开发效率高
缺点:执行效率低,由于需要将对象的操作转化为sql语句,且需要通过网络发送大量sql
创建存储过程
create procedure pro_name(p_Type p_name data_type)
begin
sql语句......流程控制
end
p_type 参数类型
in 表示输入参数
out 表示输出参数
inout表示既能输入又能输出
p_name 参数名称
data_type 参数类型 可以是mysql支持的数据类型
案例:使用存储过程完成对student表的查询
delimiter //
create procedure p1(in m int,in n int,out res int)
begin
select from student where chinese > m and chinese < n;
#select from student where chineseXXX > m and chinese < n; 修改错误的列名以测试执行失败
set res = 100;
end//
delimiter ;
set @res = 0;
call p1(70,80,@res);
select @res;
需要注意的是,存储过程的out类参数必须是一个变量,不能是值;
在python中调用存储过程
import pymysql
conn = pymysql.connect(
host="127.0.0.1",
user="root",
password="admin",
database="db02"
)
cursor = conn.cursor(pymysql.cursors.DictCursor)
cursor.callproc("p1",(70,80,0)) #p1为存储过程名 会自动为为每个值设置变量,名称为 @_p1_0,@_p1_1,@_p1_2
print(cursor.fetchall())
cursor.execute("select @_p1_2")
print(cursor.fetchone())
此处pymysql会自动将参数都设置一个变量所以可以直接传入一个值,当然值如果作为输出参数的话,传入什么都无所谓!
删除存储过程
drop procedure 过程名称;
修改存储过程意义不大,不如删除重写!
查看存储过程
#当前库所有存储过程名称
select name
from mysql.proc where db = ‘db02‘ and type
= ‘PROCEDURE‘;
#查看创建语句
show create procedure p1;
存储过程中的事务应用
存储过程中支持任何的sql语句包括事务!
案例:模拟转账中发送异常,进行回滚
delimiter //
create PROCEDURE p5(
OUT p_return_code tinyint
)
BEGIN
DECLARE exit handler for sqlexception
BEGIN
# ERROR
set p_return_code = 1;
rollback;
END;
# exit 也可以换成continue 表示发送异常时继续执行
DECLARE exit handler for sqlwarning
BEGIN
# WARNING
set p_return_code = 2;
rollback;
END;
START TRANSACTION;
update account set money = money - 1000 where id = 1;
update account set moneys = money - 1000 where id = 1; # moneys字段导致异常
COMMIT;
# SUCCESS
set p_return_code = 0; #0代表执行成功
END //
delimiter ;
set @res=123;
call p5(@res);
select @res;
总结:抛开沟通成本,学习成本,存储过程无疑是效率最高的处理方式,面试会问,一些公司也有一些现存的存储过程,重点掌握!
五.函数
函数与python中的定义一致,不再啰嗦!
内置函数
日期相关:
字符串相关:
数字相关:
其他函数:
当然也包括之前学习的聚合函数
自定义函数
语法:
CREATE FUNCTION f_name(paramters)
returns dataType;
return value;
说明: paramters 只能是in 输入参数 参数名 类型 必须有返回值 不能呢加begin 和end returns 后面是返回值的类型 这里不加分号return 后面是要返回的值
案例: 将两数相加
create function addfuntion(a int,b int)
returns int return a + b;
select addfuntion(1,1);
注意:
函数只能返回一个值 函数一般不涉及数据的增删改查 就是一个通用的功能 调用自定义的函数 与调用系统的一致 不需要call 使用select 可获得返回值 函数中不能使用sql语句 就像在java中不能识别sql语句一样
六.数据备份与恢复
使用mysqldump程序进行备份
mysqldump -u -p db_name [table_name,,,] > fileName.sql
可以选择要备份哪些表 如果不指定代表 全部备份
mysqldump -uroot -p123 db1 > db1.sql
mysqldump -uroot -p123 db1 table1 table2 > db1-table1-table2.sql
mysqldump -uroot -p123 --databases db1 db2 mysql db3 > db1_db2_mysql_db3.sql
mysqldump -uroot -p123 --all-databases > all.sql
使用 mysql 进行恢复
1.退出数据库后
mysql -u -p < filename.sql;
2.不用退出数据库
2.1 创建空数据库
2.2选择数据库
2.3然后使用source filename; 来进行还原
use db1;
source /root/db1.sql
数据库迁移
务必保证在相同版本之间迁移
七.流程控制
if语句的使用
if 条件 then 语句; end if;
第二种 if elseif if 条件 then 语句1; elseif 条件 then 语句2; else 语句3; end if;
案例:编写过程 实现 输入一个整数type 范围 1 - 2 输出 type=1 or type=2 or type=other;
create procedure showType(in type int,out result char(20))
begin
if type = 1 then
set result = "type = 1";
elseif type = 2 then
set result = "type = 2";
else
set result = "type = other";
end if;
end
CASE 语句
大体意思与Swtich一样的 你给我一个值 我对它进行选择 然后执行匹配上的语句 语法:
create procedure caseTest(in type int)
begin
CASE type
when 1 then select "type = 1";
when 2 then select "type = 2";
else select "type = other";
end case;
end
定义变量
declare 变量名 类型 default 值; 例如: declare i int default 0;
WHILE循环
循环输出10次hello mysql
create procedure showHello()
begin
declare i int default 0;
while i < 10 do
select "hello mysql";
set i = i + 1;
end while;
end
LOOP循环的
没有条件 需要自己定义结束语句 语法:
输出十次hello mysql;
create procedure showloop()
begin
declare i int default 0;
aloop: LOOP
select "hello loop";
set i = i + 1;
if i > 9 then leave aloop;
end if;
end LOOP aloop;
end
REPEAT循环
create procedure showRepeat()
begin
declare i int default 0;
repeat
select "hello repeat";
set i = i + 1;
until i > 9
end repeat;
end
create procedure showjishu()
begin
declare i int default 0;
aloop: loop
set i = i + 1;
if i >= 101 then leave aloop; end if;
if i % 2 = 0 then iterate aloop; end if;
select i;
end loop aloop;
end
索引
在关系数据库中,索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构; 也称之为key
索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。
为什么需要索引
相比较下,对数据的读操作会更加频繁,比例在10:1左右,也就是说对数据库的查询操作是非常频繁的
随着时间的推移,表中的记录会越来越多,此时如果查询速度太慢的话对用户体验是非常不利的
索引是提升查询效率最有效的手段!
简单的说索引的就是用帮我们加快查询速度的
需要注意的是:在数据库中插入数据会引发索引的重建
小白的误区
既然索引如此神奇,那以后只要速度慢了就加索引,
这种想法是非常low的,
索引是不是越多越好,并且有了索引后还要考虑索引是否命中
加上索引后对数据的写操作速度会降低
索引的实现原理
如何能实现加快查询的效果呢?
来看一个例子:
第一版的新华字典共800页,那时没有检字表,每个字的详细信息,随机的罗列在书中,一同学买回来查了一次,在也没用过,因为没有任何的数据结构,查字只能一页一页往后翻,反了两小时没翻着,只能放弃了!
后来出版社发现了这个问题,他们将书中所有字按照拼音音节顺序进行了排序,拼音首字母为a的排在最前,首字母为z的排在最后:
如此一来再不再需要一页一页的去查字了,而是先查看索引,找出字的拼音首字母到索引中进行对照,例如:找搭字其拼音首字母为d,所以直接找到D对应的索引目录,很快就能定位到要找的搭字在79页,查询速度得到数量级的提升!
需要注意的是,原来内容为800页现在因为多了索引数据,整体页数必然增加了
数据库中的索引,实现思路与字典是一致的,需要一个独立的存储结构,专门存储索引数据
本质上索引是通过不断的缩小查询范围来提高查询效率
磁盘IO问题(了解)
数据库的数据最终存储到了硬盘上
机械硬盘由于设计原理,导致查找数据时需要有一个寻道时间与平均延迟时间,常规硬盘寻道为5ms,平均延迟按照每分钟7200转来计算,7200/60 = 120 ; 1000/120/2 = 4ms 总共为9ms,那么9毫秒对于cpu而言已经非常非常的长了,足够做很多运算操作,目前最新的处理器每秒能处理数万亿次运算,拿一个非常垃圾的处理器来举例子,假设处理器每秒处理5亿次计算,每毫秒是50万次运算,9ms可以进行450万次运算,数据库中成千上万的数据,每条数据9ms显然慢到不行!
操作系统预读取(了解)
考虑到磁盘IO是非常高昂的操作,计算机操作系统做了一些优化,当一次IO时,不仅获取当前磁盘地址的数据,而且把相邻的数据也都读取到内存缓冲区内,因为局部预读性原理告诉我们,当计算机访问一个地址的数据的时候,与其相邻的数据也会很快被访问到。每一次IO读取的数据我们称之为一页(page)。具体一页有多大数据跟操作系统有关,一般为4k或8k,也就是我们读取一页内的数据时候,实际上才发生了一次IO,这个理论对于索引的数据结构设计非常有帮助。
索引数据结构剖析
在字典的例子中我们知道了,索引是独立于真实数据的一个存储结构,这个结构到底是什么样的?
索引最终的目的是要尽可能降低io次数,减少查找的次数,以最少的io找到需要的数据,此时B+树闪亮登场
光有数据结构还不行,还需要有对应的算法做支持,就是二分查找法
有了B+数据结构后查找数据的方式就不再是逐个的对比了,而是通过二分查找法来查找(流程演示)
另外,其实大多数文件系统都是使用B+是来完成的!
应该尽可能的将数据量小的字段作为索引
通过分析可以发现在上面的树中,查找一个任何一个数据都是3次IO操作, 但是这个3次并不是固定的,它取决于数结构的高度,目前是三层,如果要存储新的数据比99还大的数据时,发现叶子节点已经不够了必须在上面加一个子节点,由于树根只能有一个,所以整个数的高度会增加,一旦高度增加则 查找是IO次数也会增加,所以:
应该尽可能的将数据量小的字段作为索引,这样一个叶子节点能存储的数据就更多,从而降低树的高度;
例如:name 和id,应当将id设置为索引而不是name
最左匹配原则
当b+树的数据项是复合的数据结构,比如(name,age,sex)的时候(多字段联合索引),b+树会按照从左到右的顺序来建立搜索树,比如当(张三,20,F)这样的数据来检索的时候,b+树会优先比较name来确定下一步的所搜方向,如果name相同再依次比较age和sex,最后得到检索的数据;但当(20,F)这样的没有name的数据来的时候,b+树就不知道下一步该查哪个节点,因为建立搜索树的时候name就是第一个比较因子,必须要先根据name来搜索才能知道下一步去哪里查询。比如当(张三,F)这样的数据来检索时,b+树可以用name来指定搜索方向,但下一个字段age的缺失,所以只能把名字等于张三的数据都找到,然后再匹配性别是F的数据了, 这个是非常重要的性质,即索引的最左匹配特性。
聚集索引
mysql官方文档原文: 插入了解 或折叠
MySQL为表把它的数据词典信息以.frm文件的形式存在数据库目录里,这对所有MySQL存储引擎都是真的。但 是每个InnoDB表在表空间内的InnoDB内部数据词典里有它自己的条目。当MySQL移除表或数据库,它不得不 删除.frm文件和InnoDB数据词典内的相应条目。这就是为什么你不能在数据库之间简单地移动.frm文件来移 动InnoDB表。
每个InnoDB表有专门索引,被称为clustered index,对行的数据被存于其中。如果你对你的表定义一 个PRIMARY KEY, 主键的索引是集束索引。
如果你没有为表定义PRIMARY KEY,MySQL拾取第一个仅有NOT NULL列的UNIQUE索引作为主键,并 且InnoDB把它当作集束索引来用。如果表中没有这样一个索引,InnoDB内部产生一个集束索引,其中 用InnoDB在这样一个表内指定给行的行ID来排序行。行ID是一个6字节的域,它在新行被插入的时候简单地增加。因此被行ID排序的行是物理地按照插入顺序排的。
通过集束索引访问一个行是较快的,因为行数据是在索引搜索引导的同一页面。如果表是巨大的,当对比于传 统解决方案,集束索引构架经常节约磁盘I/O。(在许多数据库,数据传统地被存在与索引记录不同的页)。
在InnoDB中,非集束索引里的记录(也称为第二索引)包含对行的主键值。InnoDB用这个 主键值来从集束索 引中搜索行。注意,如果主键是长的,第二索引使用更多空间。
简单总结:
聚焦索引的特点:
叶子节点保存的就是完整的一行记录,如果设置了主键,主键就作为聚集索引,
如果没有主键,则找第一个NOT NULL 且QUNIQUE的列作为聚集索引,
如果也没有这样的列,innoDB会在表内自动产生一个聚集索引,它是自增的
辅助索引*
除了聚集索引之外的索引都称之为辅助索引或第二索引,包括 foreign key 与 unique
辅助索引的特点:
其叶子节点保存的是索引数据与所在行的主键值,InnoDB用这个 主键值来从聚集索引中搜查找数据
覆盖索引
覆盖索引指的是需要的数据仅在辅助索引中就能找到:
select name from stu where name = "jack";
这样的话则不需要在查找聚集索引数据已经找到
回表
如果要查找的数据在辅助索引中不存在,则需要回到聚集索引中查找,这种现象称之为回表
select sex from stu where name = "jack";
需要从辅助索引中获取主键的值,在拿着主键值到聚集索引中找到sex的值
查询速度对比:
聚集索引 > 覆盖索引 > 非覆盖索引
正确使用索引
案例:首先准备一张表数据量在百万级别
create table usr(id int,name char(10),gender char(3),email char(30));
delimiter //
create procedure addData(in num int)
begin
declare i int default 0;
while i < num do
insert into usr values(i,"jack","m",concat("xxxx",i,"@qq.com"));
set i = i + 1;
end while;
end //
delimiter ;
select count(*) from usr where id = 1;
alter table usr add primary key(id);
select count(*) from usr where id = 1;
select count(*) from usr where id > 1;
select count(*) from usr where id > 1 and id < 10;
select count(*) from usr where name = "jack";
create index name_index on usr(name);
select count(*) from usr where name = "jack";
select count(*) from usr where name = "aaaaaaaaa";
select count() from usr where name like "xxx"; #快
select count() from usr where name like "xxx%"; #快
select count(*) from usr where name like "%xxx"; #慢
4.索引字段不能参加运算
select count() from usr where id 12 = 120;
select count(*) from usr where id = 120/12;
select count(*) from usr where id = 10;
5.有多个匹配条件时 索引的执行顺序 and 和 or
alter table usr drop primary key;
drop index name_index on usr;
select count(*) from usr where name = "jack" and gender = "m" and id = 1 and email = "xxxx2@qq.com";
create index name_index on usr(name);
select count(*) from usr where name = "jack" and gender = "m" and id = 1 and email = "xxxx2@qq.com";
create index gender_index on usr(gender);
select count(*) from usr where name = "jack" and gender = "m" and id = 1 and email = "xxxx2@qq.com";
alter table usr add primary key(id);
select count(*) from usr where name = "jack" and gender = "m" and id = 1 and email = "xxxx1@qq.com";
select count(*) from usr where name = "jack" and gender = "m" and id > 1 and email = "xxxx1@qq.com";
alter table usr drop primary key;
create index email_index on usr(email);
select count(*) from usr where name = "jack" and gender = "m" and id = 1 and email = "xxxx2@qq.com";
select count(*) from usr where name = "jackxxxx" or email = "xxxx0@qq.com";
6.多字段联合索引
为什么需要联合索引
案例:
select count(*) from usr where name = "jack" and gender = "m" and id > 3 and email = "xxxx2@qq.com";
假设所有字段都是区分度非常高的字段,那么除看id为谁添加索引都能够提升速度,但是如果sql语句中没有出现所以字段,那就无法加速查询,最简单的办法是为每个字段都加上索引,但是索引也是一种数据,会占用内存空间,并且降低写入效率
此处就可以使用联合索引,
联合索引最重要的是顺序 按照最左匹配原则 应该将区分度高的放在左边 区分度低的放到右边
drop index name_index on usr;
drop index email_index on usr;
create index mul_index on usr(email,name,gender,id);
select count(*) from usr where name = "xx" and id = 1 and email = "xx";
只要语句中出现了最左侧的索引(email) 无论在前在后都能提升效率
drop index mul_index on usr;
原文:https://www.cnblogs.com/abdm-989/p/11587493.html