读写分离架构(读性能较高)1.代码级别MySQL proxy (Atlas,mysql router,proxySQL(percona),maxscale)、amoeba(taobao)xx-dbproxy等。2.分布式架构(读写性能都提高):分库分表——cobar--->TDDL(头都大了),DRDSMycat--->DBLE自主研发等。NewSQL-->TiDB
(1)单活:MMM架构——mysql-mmm(google)(2)单活:MHA架构——mysql-master-ha(日本DeNa),T-MHA(3)多活:MGR ——5.7 新特性 MySQL Group replication(5.7.17) --->Innodb Cluster (4)多活:MariaDB Galera Cluster架构,(PXC)Percona XtraDB Cluster、MySQL Cluster(Oracle rac)架构
1. MHA是基于主从复制部署的,所以要先部署好主从复制2. MHA架构中的mysql不能是多实例,必须是单独的实例3. MHA架构必须是1主2从的架构
主机名称 | IP地址 | |
---|---|---|
管理节点 | db03 | 192.168.114.52 |
主库 | db01 | 192.168.114.50 |
从库1 | db02 | 192.168.114.51 |
从库2 | db03 | 192.168.114.52 |
binlong-server | binlong-server | 192.168.114.53 |
这里我把管理节点安装在了db03上;在实际生产中,如果没有足够的服务器,也可以把管理节点和binlogserver装在同一个从节点上
mkdir /softmkdir /data/mysql/data -pmkdir /data/binlogmkdir /data/errorchown -R mysql:mysql /data/*
vim /etc/my.cnf#服务端[mysqld]user=mysql#软件安装路劲basedir=/soft/mysql5726#数据路劲datadir=/data/mysql/data#服务端socket文件位置socket=/tmp/mysql.sock#服务器ID号server_id=27#二进制日志log_bin=/data/binlog/mysql-bin#错误日志路劲log_error=/data/error/mysql.loglog_timestamps=system#端口号port=3306#GTIDgtid-mode=onenforce-gtid-consistency=truelog-slave-updates=1#客户端[mysql]#客户端socket文件位置socket=/tmp/mysql.sock
vim /etc/systemd/system/mysqld.service[Unit]Description=MySQL ServerDocumentation=man:mysqld(8)Documentation=http://dev.mysql.com/doc/refman/en/using-systemd.htmlAfter=network.targetAfter=syslog.target[Install]WantedBy=multi-user.target[Service]User=mysqlGroup=mysqlExecStart=/soft/mysql5726/bin/mysqld --defaults-file=/etc/my.cnfLimitNOFILE=5000
mysqld --initialize-insecure --user=mysql --basedir=/soft/mysql5726 --datadir=/data/mysql/data
systemctl start mysqld
mysqladmin -uroot -p password 123
mkdir /softmkdir /data/mysql/data -pmkdir /data/binlogmkdir /data/errorchown -R mysql:mysql /data/*
vim /etc/my.cnf#服务端[mysqld]user=mysql#软件安装路劲basedir=/soft/mysql5726#数据路劲datadir=/data/mysql/data#服务端socket文件位置socket=/tmp/mysql.sock#服务器ID号server_id=28#二进制日志log_bin=/data/binlog/mysql-bin#错误日志路劲log_error=/data/error/mysql.loglog_timestamps=system#端口号port=3306#GTIDgtid-mode=onenforce-gtid-consistency=truelog-slave-updates=1#客户端[mysql]#客户端socket文件位置socket=/tmp/mysql.sock
vim /etc/systemd/system/mysqld.service[Unit]Description=MySQL ServerDocumentation=man:mysqld(8)Documentation=http://dev.mysql.com/doc/refman/en/using-systemd.htmlAfter=network.targetAfter=syslog.target[Install]WantedBy=multi-user.target[Service]User=mysqlGroup=mysqlExecStart=/soft/mysql5726/bin/mysqld --defaults-file=/etc/my.cnfLimitNOFILE=5000
mysqld --initialize-insecure --user=mysql --basedir=/soft/mysql5726 --datadir=/data/mysql/data
systemctl start mysqld
mysqladmin -uroot -p password 123
mkdir /softmkdir /data/mysql/data -pmkdir /data/binlogmkdir /data/errorchown -R mysql:mysql /data/*
vim /etc/my.cnf#服务端[mysqld]user=mysql#软件安装路劲basedir=/soft/mysql5726#数据路劲datadir=/data/mysql/data#服务端socket文件位置socket=/tmp/mysql.sock#服务器ID号server_id=29#二进制日志log_bin=/data/binlog/mysql-bin#错误日志路劲log_error=/data/error/mysql.loglog_timestamps=system#端口号port=3306#GTIDgtid-mode=onenforce-gtid-consistency=truelog-slave-updates=1#客户端[mysql]#客户端socket文件位置socket=/tmp/mysql.sock
vim /etc/systemd/system/mysqld.service[Unit]Description=MySQL ServerDocumentation=man:mysqld(8)Documentation=http://dev.mysql.com/doc/refman/en/using-systemd.htmlAfter=network.targetAfter=syslog.target[Install]WantedBy=multi-user.target[Service]User=mysqlGroup=mysqlExecStart=/soft/mysql5726/bin/mysqld --defaults-file=/etc/my.cnfLimitNOFILE=5000
mysqld --initialize-insecure --user=mysql --basedir=/soft/mysql5726 --datadir=/data/mysql/data
systemctl start mysqld
mysqladmin -uroot -p password 123
grant replication slave on *.* to repl@‘192.168.114.%‘ identified by ‘123‘;
change master to master_host=‘192.168.114.50‘,master_user=‘repl‘,master_password=‘123‘ ,MASTER_AUTO_POSITION=1;
start slave;
ln -s /soft/mysql5726/bin/mysqlbinlog /usr/bin/mysqlbinlogln -s /soft/mysql5726/bin/mysql /usr/bin/mysql#为什么要做软连接?因为MHA调用命令的时候不读取环境变量,除非在代码里面把路劲写进去,但是MHA是基于自己环境开发的,所以我们想要用的话,要做软连接
当主机宕机的时候,主机需要通过网络把数据传输到备选的主上,这个时候需要建立SSH连接,这个过程由脚本来实现的,脚本最怕的是需要交互,所以我们要提前做好交互,这样通过脚本传输数据的时候就不需要交互了
这里选择的是在管理节点上
rm -rf /root/.ssh ssh-keygencd /root/.ssh mv id_rsa.pub authorized_keysscp -r /root/.ssh 192.168.114.50:/rootscp -r /root/.ssh 192.168.114.51:/rootscp -r /root/.ssh 192.168.114.52:/rootscp -r /root/.ssh 192.168.114.53:/root (后面配置的binlog-server那台服务器)
ssh 192.168.114.50 datessh 192.168.114.51 datessh 192.168.114.52 datessh 192.168.114.53 date (binlog-server那台主机)
这里以提前下载好,传上去即可
#3台节点都要执行以下命令yum install perl-DBD-MySQL -yrpm -ivh mha4mysql-node-0.56-0.el6.noarch.rpm
登录mysql执行以下命令mysql>grant all privileges on *.* to mha@‘192.168.114.%‘ identified by ‘mha‘;
在管理节点安装
yum install -y perl-Config-Tiny epel-release perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes perl-DBD-MySQLrpm -ivh mha4mysql-manager-0.56-0.el6.noarch.rpm
1. 创建配置文件目录 mkdir -p /etc/mha2. 创建日志目录 mkdir -p /var/log/mha/app13. 编辑mha配置文件vim /etc/mha/app1.cnf[server default]manager_log=/var/log/mha/app1/manager manager_workdir=/var/log/mha/app1 master_binlog_dir=/data/binlog user=mha password=mha ping_interval=1repl_password=123repl_user=replssh_user=root [server1] hostname=192.168.114.50port=3306 [server2] hostname=192.168.114.51port=3306[server3]hostname=192.168.114.52port=3306
在管理节点执行
masterha_check_ssh --conf=/etc/mha/app1.cnfmasterha_check_repl --conf=/etc/mha/app1.cnf2条命名应该都显示OK说明:这个app1在生产中就是对应的业务名字
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null> /var/log/mha/app1/manager.log 2>&1 &
#互信检查[root@db03 ~]# masterha_check_status --conf=/etc/mha/app1.cnfapp1 (pid:15890) is running(0:PING_OK), master:192.168.114.50#主从状态检查masterha_check_repl --conf=/etc/mha/app1.cnf
上传脚本到管理机的/usr/local/bin
测试环境,我是传到了别的目录,移动到/usr/local/bin 这个目录可以随便是哪里,但是官方是这样的mv master_ip_failover.txt /usr/local/bin/master_ip_failover
vi /usr/local/bin/master_ip_failovermy $vip = ‘10.0.1.55/24‘;my $key = ‘1‘;my $ssh_start_vip = "/sbin/ifconfig eth0:$key $vip";my $ssh_stop_vip = "/sbin/ifconfig eth0:$key down";#修改内容说明:my $vip = ‘10.0.1.55/24‘; 1.选择一个MySQL对外提供服务同一个网段的地址 2. 此IP不能被别的程序占用my $key = ‘1‘; 这个1 只要大于0就可以了my $ssh_start_vip = "/sbin/ifconfig eth0:$key $vip"; 这里要把eth0改为和服务器一样的网卡名my $ssh_stop_vip = "/sbin/ifconfig eth0:$key down"; 这里要把eth0改为和服务器一样的网卡名后面2条的内容就是主机宕机以后,调用这个脚本在新主上重新生成一个VIP#给脚本执行权限 chmod +x /usr/local/bin/master_ip_failover.txt#这个脚本里面有一个中文地方用命令修改一下 yum install dos2unix -y dos2unix /usr/local/bin/master_ip_failover
vi /etc/mha/app1.cnf添加:master_ip_failover_script=/usr/local/bin/master_ip_failover
细节(主库上执行)
#这个脚本只有在切换的时候才会去触发,所以第一次启动MHA的时候,要在主库上生成一个VIPifconfig eth0:1 192.168.114.55/24
#关闭命令masterha_stop --conf=/etc/mha/app1.cnf#启动命令nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null> /var/log/mha/app1/manager.log 2>&1 &
masterha_check_status --conf=/etc/mha/app1.cnf
vim /etc/mha/app1.cnf添加:report_script=/usr/local/bin/send
send_report(1)准备发邮件的脚本(上传 email_2019-最新.zip中的脚本,到/usr/local/bin/中)(2)将准备好的脚本添加到mha配置文件中,让其调用cp -a email/* /usr/local/bin/cd /usr/local/bin/chmod +x *
#关闭命令masterha_stop --conf=/etc/mha/app1.cnf#启动命令nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null> /var/log/mha/app1/manager.log 2>&1 &
masterha_check_status --conf=/etc/mha/app1.cnfapp1 (pid:4153) is running(0:PING_OK), master:10.0.1.11
MHA架构中binlog server是用来专门复制主库的二进制,当主库宕机以后SSH不通时,可以同步binlog server来把数据补偿给新主
1. 必须和主库一样的版本2. 支持GTID
mkdir /softmkdir /data/mysql/data -pmkdir /data/binlogmkdir /data/errormkdir /data/mysql/binlogchown -R mysql:mysql /data/*
vim /etc/my.cnf#服务端[mysqld]user=mysql#软件安装路劲basedir=/soft/mysql5726#数据路劲datadir=/data/mysql/data#服务端socket文件位置socket=/tmp/mysql.sock#服务器ID号server_id=30#二进制日志log_bin=/data/binlog/mysql-bin#错误日志路劲log_error=/data/error/mysql.loglog_timestamps=system#端口号port=3306#GTIDgtid-mode=onenforce-gtid-consistency=truelog-slave-updates=1#客户端[mysql]#客户端socket文件位置socket=/tmp/mysql.sock
vim /etc/systemd/system/mysqld.service[Unit]Description=MySQL ServerDocumentation=man:mysqld(8)Documentation=http://dev.mysql.com/doc/refman/en/using-systemd.htmlAfter=network.targetAfter=syslog.target[Install]WantedBy=multi-user.target[Service]User=mysqlGroup=mysqlExecStart=/soft/mysql5726/bin/mysqld --defaults-file=/etc/my.cnfLimitNOFILE=5000
mysqld --initialize-insecure --user=mysql --basedir=/soft/mysql5726 --datadir=/data/mysql/data
systemctl start mysqld
mysqladmin -uroot -p password 123
ln -s /soft/mysql5726/bin/mysqlbinlog /usr/bin/mysqlbinlogln -s /soft/mysql5726/bin/mysql /usr/bin/mysql
yum install perl-DBD-MySQL -yrpm -ivh mha4mysql-node-0.56-0.el6.noarch.rpm
vim /etc/mha/app1.cnf [binlog1]no_master=1 hostname=192.168.114.53master_binlog_dir=/data/mysql/binlog #参数说明:no_master=1 不参加选主hostname=192.168.114.53 主机名称(这里用IP地址表示的)master_binlog_dir=/data/mysql/binlog 保存主库的二进制目录#注意保存主库的二进制目录一定要和主库的二进制目录不一样
#必须进入到自己创建好的目录cd /data/mysql/binlog #放在后台一直监控主库的二进制,一有新的就拉取过来mysqlbinlog -R --host=192.168.114.50 --user=mha --password=mha --raw --stop-never mysql-bin.000002 & *****************************************************************注意:在实际生产中拉取日志的起点,需要按照目前主库正在使用的binlog为起点****************************************************************#参数说明--raw: 以binlog 格式存储日志,方便后期使用;--host: 远程库的主机 IP 或者主机名;--port: 远端库的端口号;--user: 远程库上用于复制的账号;--password: 远端库上复制账号的密码;--stop-never: 一直连接到远程的server上读取binlog日志,直接到远程的server关闭后才会退出或是被pkill掉--stop-never-slave-server-id:如果需要启动多个 binlog server ,需要给 binlog server 指定 server-id--result-file: 指定存储到本地的目录,注意后缀需要加上/
#关闭命令masterha_stop --conf=/etc/mha/app1.cnf#启动命令nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null> /var/log/mha/app1/manager.log 2>&1 &
[root@db03 app1]# masterha_check_status --conf=/etc/mha/app1.cnfapp1 (pid:20716) is running(0:PING_OK), master:192.168.114.50
主库宕机systemctl stop mysqld故障预想:1. 管理机MHA停止工作2. VIP会飘到新主上3. binlog server 停止工作
systemctl start mysqld
CHANGE MASTER TO MASTER_HOST=‘192.168.114.51‘,MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER=‘repl‘, MASTER_PASSWORD=‘123‘;--开启线程start slave ;--说明:MHA宕机以后恢复主从的时候,只需要把宕机的那台重新构建主从关系即可,没有宕机的那一台,会自动与新的主节点构成主从关系的
因为MHA是一个一次性的高可用,它宕机以后会把原来的配置文件的主库给删除,所以我们重加进去就可以了[server1]hostname=10.0.1.11port=3306[server2]hostname=10.0.1.12port=3306[server3]hostname=10.0.1.13port=3306
#启动命令nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null> /var/log/mha/app1/manager.log 2>&1 &#检查状态[root@db03 tmp]# masterha_check_status --conf=/etc/mha/app1.cnfapp1 (pid:20948) is running(0:PING_OK), master:192.168.114.51
cd /data/mysql/binlog rm -rf /data/mysql/binlog/*mysqlbinlog -R --host=192.168.114.51 --user=mha --password=mha --raw --stop-never mysql-bin.000002 &
1主2从1binlog server,master:db01 slave:db02 db03 binlog server ):MHA 高可用方案软件构成Manager软件:管理节点上安装Node软件:所有节点都要安装
Manager工具包主要包括以下几个工具:masterha_manger 启动MHA masterha_check_ssh 检查MHA的SSH配置状况 masterha_check_repl 检查MySQL复制状况 masterha_master_monitor 检测master是否宕机 masterha_check_status 检测当前MHA运行状态 masterha_master_switch 控制故障转移(自动或者手动)masterha_conf_host 添加或删除配置的server信息Node工具包主要包括以下几个工具:这些工具通常由MHA Manager的脚本触发,无需人为操作save_binary_logs 保存和复制master的二进制日志 apply_diff_relay_logs 识别差异的中继日志事件并将其差异的事件应用于其他的purge_relay_logs 清除中继日志(不会阻塞SQL线程)
主库宕机处理过程 1. 监控节点 (通过配置文件获取所有节点信息) 系统,网络,SSH连接性主从状态,重点是主库2. 选主(1) 如果判断从库(position或者GTID),数据有差异,最接近于Master的slave,成为备选主 (2) 如果判断从库(position或者GTID),数据一致,按照配置文件顺序,选主. (3) 如果设定有权重(candidate_master=1),按照权重强制指定备选主. 1. 默认情况下如果一个slave落后master 100M的relay logs的话,即使有权重,也会失效. 2. 如果check_repl_delay=0的化,即使落后很多日志,也强制选择其为备选主 3. 数据补偿 (1) 当SSH能连接,从库对比主库GTID 或者position号,立即将二进制日志保存至各个从节点并且应用(save_binary_logs ) (2) 当SSH不能连接, 对比从库之间的relaylog的差异(apply_diff_relay_logs) 4. Failover 将备选主进行身份切换,对外提供服务 其余从库和新主库确认新的主从关系 5. 应用透明(VIP) 6. 故障切换通知(send_reprt) 7. 二次数据补偿(binlog_server) 8. 自愈自治(待开发...)
说明:主库宕机谁来接管?1. 所有从节点日志都是一致的,默认会以配置文件的顺序去选择一个新主。2. 从节点日志不一致,自动选择最接近于主库的从库3. 如果对于某节点设定了权重(candidate_master=1),权重节点会优先选择。但是此节点日志量落后主库100M日志的话,也不会被选择。可以配合check_repl_delay=0,关闭日志量的检查,强制选择候选节点。(1) ping_interval=1#设置监控主库,发送ping包的时间间隔,尝试三次没有回应的时候自动进行failover(2) candidate_master=1#设置为候选master,如果设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个主库不是集群中事件最新的slave(3)check_repl_delay=0#默认情况下如果一个slave落后master 100M的relay logs的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master
从启动--->故障--->转移--->业务恢复(1) MHA通过masterha_manger脚本启动MHA的功能.(2) 在manager启动之前,会自动检查ssh互信(masterha_check_ssh)和主从状态(masterha_check_repl)(3) MHA-manager 通过 masterha_master_monitor脚本(每隔ping_interval秒)(4) masterha_master_monitor探测主库3次无心跳之后,就认为主库宕机了.(5) 进行选主过程 算法一: 读取配置文件中是否有强制选主的参数? candidate_master=1 ===强制选主 算法二: 自动判断所有从库的日志量.将最接近主库数据的从库作为新主 check_repl_delay=0 算法三: 按照配置文件先后顺序的进行选新主. 扩展一下:candidate_master=1 应用场景(1) MHA+KeepAlive VIP(早期MHA架构)(2) 多地多中心(6) 数据补偿 判断主库SSH的连通性情况一: SSH能连调用 save_binary_logs脚本,立即保存缺失部分的binlog到各个从节点,恢复情况二: SSH无法连接调用 apply_diff_relay_logs 脚本,计算从库的relaylog的差异,恢复到从库(6.1) 提供额外的数据补偿的功能 (7) 解除从库身份(8) 剩余从库和新主库构建主从关系(9) 应用透明 (10) 故障节点自愈(待开发...)(11) 故障提醒
恢复MHA 故障(1) 检查各个节点是否启动(2) 找到主库是谁(3) 恢复1主2从CHANGE MASTER TO MASTER_HOST=‘192.168.114.50‘, MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER=‘repl‘, MASTER_PASSWORD=‘123‘;(4) 检查配置文件,恢复节点信息[server1]hostname=10.0.0.51port=3306[server2]hostname=10.0.0.52port=3306[server3]hostname=10.0.0.53port=3306(5) 检查vip和binlogserver 1. 检查vip是否在主库,如果不在,手工调整到主库2. 重新启动binlogserver 拉取[root@db03 binlog]# mysqlbinlog -R --host=10.0.0.51 --user=mha --password=mha --raw --stop-never mysql-bin.000004 &(6) 启动Mananer [root@db03 bin]# nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null> /var/log/mha/app1/manager.log 2>&1 &masterha_check_status --conf=/etc/mha/app1.cnf
1. 搭建:MHA+VIP+SendReport+BinlogServer2. 监控及故障处理 3. 高可用架构的优化 核心是:尽可能降低主从的延时,让MHA花在数据补偿上的时间尽量减少。 4. 5.7 版本,开启GTID模式,开启从库SQL并发复制。