1. HAProxy简介
- HAProxy是一个开源的项目,其代码托管在Github上,代码链接如下:HAProxy代码链接。
- HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。
- HAProxy实现了一种事件驱动, 单一进程模型,此模型支持非常大的并发连接数。
2. HAProxy实现openGauss集群的读写分离和负载均衡
-
HAProxy实现openGauss集群的读写分离和负载均衡,前提条件需由Patroni管理openGauss数据库集群,关键点在于配置文件的配置。
-
HAProxy 配置中分成五部分内容,分别如下:
- global:设置全局配置参数,属于进程的配置,通常是和操作系统相关。 - defaults:配置默认参数,这些参数可以被用到frontend,backend,listen组件; - frontend:接收请求的前端虚拟节点,frontend可以更加规则直接指定具体使用后端的backend; - backend:后端服务集群的配置,是真实服务器,一个backend对应一个或者多个实体服务器; - listen :frontend和backend的组合体。
-
在HAProxy配置文件中,我们定义了两个listen模块,名称分别为opengauss和opengauss_balance,对应集群主机的写操作和备机的读操作及负载均衡。在listen模块中,使用server关键字设置后端服务器,即设置Patroni管理的openGauss集群中各个数据库节点的ip和端口号,即可将数据库节点的信息加入到HAProxy的管理中。
global
maxconn 100
defaults
log global
mode tcp
retries 2
timeout client 30m
timeout connect 4s
timeout server 30m
timeout check 5s
listen stats
mode http
bind *:7000
stats enable
stats uri /
listen opengauss
bind *:5000
option httpchk
http-check expect status 200
default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
# server opengauss_ip0_port0 ip0:port0 maxconn 100 check port 8008
# server opengauss_ip1_port1 ip1:port1 maxconn 100 check port 8008
# server opengauss_ip2_port2 ip2:port2 maxconn 100 check port 8008
# server opengauss_ip3_port3 ip3:port3 maxconn 100 check port 8008
# server opengauss_ip4_port4 ip4:port4 maxconn 100 check port 8008
# server opengauss_ip5_port5 ip5:port5 maxconn 100 check port 8008
# server opengauss_ip6_port6 ip6:port6 maxconn 100 check port 8008
# server opengauss_ip7_port7 ip7:port7 maxconn 100 check port 8008
# server opengauss_ip8_port8 ip8:port8 maxconn 100 check port 8008
listen opengauss_balance
bind *:5001
mode tcp
option tcplog
balance roundrobin
option httpchk OPTIONS /replica
http-check expect status 200
default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
# server opengauss_ip0_port0 ip0:port0 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
# server opengauss_ip1_port1 ip1:port1 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
# server opengauss_ip2_port2 ip2:port2 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
# server opengauss_ip3_port3 ip3:port3 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
# server opengauss_ip4_port4 ip4:port4 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
# server opengauss_ip5_port5 ip5:port5 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
# server opengauss_ip6_port6 ip6:port6 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
# server opengauss_ip7_port7 ip7:port7 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
# server opengauss_ip8_port8 ip8:port8 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
2.1 主机的写操作配置
listen opengauss # 用于主机
bind *:5000 #开放的端口之一,用于连接主机
option httpchk
# 开启对后端服务器的健康检测,接受健康监测[check]
http-check expect status 200
default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
# 监测的间隔时间[inter 3s], 监测失败多少次后被认为后端服务器是不可用的[fall 3],监测正常多少次后被认为后端服务器是可用的[rise 2],当标记为down时,关闭HAProxy到后台服务器的连接[on-marked-down shutdown-sessions]
server opengauss_ip1_port1 ip1:port1 maxconn 100 check port 8008
server opengauss_ip2_port2 ip2:port2 maxconn 100 check port 8008
server opengauss_ip3_port3 ip3:port3 maxconn 100 check port 8008
server opengauss_ip4_port4 ip4:port4 maxconn 100 check port 8008
# 使用server关键字设置后端服务器,为后端服务器所设置的内部名称[opengauss_ip1_port1], 该名称将会呈现在日志或警报中,后端服务器的IP地址,支持端口映射[ip1:port1]
原理分析:
HAProxy配置中调用了健康监测REST API端点,通过Patroni获取集群中的主机备机信息。
Patroni有一个丰富的REST API(Representational State Transfer,表现层状态转化),所谓REST API,其是前后端分离的最佳实践,是开发的一套标准或者是一套规范,其特点总结如下:
(1) 每一个URI代表一种资源;
(2) 客户端和服务器之间,传递这种资源的表现层;
(3) 客户端通过四个HTTP动词,对服务器端资源进行操作,实现“表现层状态转化”。
在HTTP协议中,四个表示操作方式的动词为:GET、POST、PUT、DELETE,它们分别对应四种基本的操作:GET用来获取资源,POST用来新建资源(也可以用于更新资源),PUT用来更新资源,DELETE用来删除资源。
Patroni中的REST API,有以下几种使用场景:参考链接:Patroni REST API
(1) 由Patroni自身使用用以leader竞选;
(2) 由patronictl工具使用用以执行 failovers、switchovers、reinitialize、restarts、reloads操作;
(3) 由HAProxy或者其他负载均衡器进行HTTP健康监测,或者监控。
本文中HAProxy即利用Patroni中的REST API进行健康监测,进而识别集群中的主机,备机,以及各个节点的健康状态。
对于健康监测中的GET请求,Patroni返回一个包含节点状态、HTTP状态码的JSON文档。如果不需要复杂的JSON文档,只保留一些关键信息,可以用OPTIONS代替GET。
对于下列的请求:当Patroni节点拥有leader锁,且作为primary节点running时,Patroni REST API将返回HTTP状态码200:
(1) GET /
(2) GET /master
(3) GET /primary
(4) GET /read-write
上述配置中,option httpchk
相当于调用了GET /
请求,http-check expect status 200
相当于过滤出健康监测返回的状态码应为200,对于所配置的数据库,当为主机时,其状态码为200,于是上面的配置即选出了数据库集群中的主机,用HAProxy的ip和5000端口号即可代理集群中的主机。在openGauss集群中,通过gsql命令即可连接到集群的主机
gsql -d postgres -h HAProxy_ip -p 5000 -U user -W password
2.2 备机的读操作及负载均衡配置
listen opengauss_balance #用于备机
bind *:5001 #开放的端口之一,用于连接备机
mode tcp
option tcplog
balance roundrobin #balance定义负载均衡算法,roundrobin表示基于权重进行轮询,在服务器的处理时间保持均匀分布时,这是最平衡、最公平的算法。此算法是动态的,这表示某权重可以在运行时进行调整
option httpchk OPTIONS /replica
http-check expect status 200
default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
server opengauss_ip1_port1 ip1:port1 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
server opengauss_ip2_port2 ip2:port2 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
server opengauss_ip3_port3 ip3:port3 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
server opengauss_ip4_port4 ip4:port4 maxconn 100 check port 8008 inter 5000 rise 2 fall 2
原理分析:
对于GET /replica
请求,当Patroni节点为running状态,角色为replica,未设置noloadbalance标签时,http返回状态码为200。
上述配置中,option httpchk OPTIONS /replica
即调用了OPTIONS /replica
请求,并以OPTIONS代替GET简化返回的信息,http-check expect status 200
相当于过滤出健康监测返回的状态码应为200,因此当所配置的数据库为集群中的备机时,其状态码为200,于是上面的配置即选出了数据库集群中的备机,同时配置balance roundrobin
,即定义负载均衡算法,对于读请求,将轮询发送于各个运行中的备机,因此,上述的配置可以用HAProxy的ip和5001端口号代理集群中的备机,且实现负载均衡。
在openGauss集群中,通过gsql命令即可连接到集群的备机
gsql -d postgres -h HAProxy_ip -p 5001 -U user -W password
2.3 监控界面描述
除此之外,我们还配置了一个HAProxy的监控界面,通过访问该界面可以查看集群中各个节点的状态。
listen stats #定义一个名为stats的部分
mode http
# 定义为HTTP模式
bind *:7000 #开放的端口之一,用于监控
# 定义监听的套接字
stats enable
# stats是HAProxy的一个统计页面的套接字
stats uri /
# 设置统计页面的uri为/
上述配置中,访问 http://ip:7000/ 即可查看监控界面,其中ip为部署HAProxy机器的ip,页面信息如下图所示:
上图中,对应一主三备集群,第一个模块openGauss对应写操作,绿色的一栏表示集群中的主机,第二个模块opengauss_balance对应读操作,绿色的栏表示集群中的备机。
至此,已通过HAProxy实现Patroni管理的openGauss集群的读写分离和负载均衡。