问题描述 :
观察客户端 每2分钟 websocket
断开连接, 提示 1006 CLOSE_ABNORMAL.
排查问题 :
服务端观察日志能发现的确与客户端同一时间断开连接. 但服务端onClose
事件并不是服务端主动要求断开的.
客户端也有6秒 定时发ping
包, 双方心跳检测都不是超时问题.
知道运维同学 帮忙查了下, 使用cloudflare CDN
的新域名观察后并没有这个问题.
那就破案了,现有的域名CND
用的都是Google Cloud
, 运维同学咨询了谷歌售后服务. 回答的都绝了
聊天内容如下 :
> $1 : 关于负载均衡的问题,,用户 -> 负载均衡 -> nginx,https的服务没有问题,websocket的服务2分钟后就断了
> $1 : timeout设置为999999999
> $2 : 这是有哪些地方需要单独设置吗
> $1 : 对
> $2 : 那会影响https的服务吗
> $1 : 对
> $2 : 把websocket单独令出来
上面对话简单来说就是 我们webscoket服务用的谷歌云的负载均衡,又一个超时配置. 120秒没有请求过来负载机切换到其他服务器了. 就算后面是单机他也会断开. 调整这个问题很简单,单独配置websocket
的负载. 调大超时秒数.
谷歌云的负载均衡超时仅依赖于短链接请求. 并不适用于长连接, 只能通过加超长的timeout
解决问题
重要信息错误状态码
WebSocket
断开时,会触发CloseEvent
, CloseEvent
会在连接关闭时发送给使用 WebSockets 的客户端. 它在 WebSocket
对象的 onclose
事件监听器中使用。CloseEvent
的code字段表示了WebSocket断开的原因。可以从该字段中分析断开的原因。
CloseEvent
有三个字段需要注意, 通过分析这三个字段,一般就可以找到断开原因
CloseEvent.code
: code
是错误码,是整数类型CloseEvent.reason
: reason
是断开原因,是字符串CloseEvent.wasClean
: wasClean
表示是否正常断开,是布尔值。一般异常断开时,该值为false
一般来说1006的错误码出现的情况比较常见,该错误码一般出现在断网时。
状态码 | 名称 | 描述 |
---|---|---|
0–999 | 保留段, 未使用. | |
1000 | CLOSE_NORMAL | 正常关闭; 无论为何目的而创建, 该链接都已成功完成任务. |
1001 | CLOSE_GOING_AWAY | 终端离开, 可能因为服务端错误, 也可能因为浏览器正从打开连接的页面跳转离开. |
1002 | CLOSE_PROTOCOL_ERROR | 由于协议错误而中断连接. |
1003 | CLOSE_UNSUPPORTED | 由于接收到不允许的数据类型而断开连接 (如仅接收文本数据的终端接收到了二进制数据). |
1004 | 保留. 其意义可能会在未来定义. | |
1005 | CLOSE_NO_STATUS | 保留. 表示没有收到预期的状态码. |
1006 | CLOSE_ABNORMAL | 保留. 用于期望收到状态码时连接非正常关闭 (也就是说, 没有发送关闭帧). |
1007 | Unsupported Data | 由于收到了格式不符的数据而断开连接 (如文本消息中包含了非 UTF-8 数据). |
1008 | Policy Violation | 由于收到不符合约定的数据而断开连接. 这是一个通用状态码, 用于不适合使用 1003 和 1009 状态码的场景. |
1009 | CLOSE_TOO_LARGE | 由于收到过大的数据帧而断开连接. |
1010 | Missing Extension | 客户端期望服务器商定一个或多个拓展, 但服务器没有处理, 因此客户端断开连接. |
1011 | Internal Error | 客户端由于遇到没有预料的情况阻止其完成请求, 因此服务端断开连接. |
1012 | Service Restart | 服务器由于重启而断开连接. |
1013 | Try Again Later | 服务器由于临时原因断开连接, 如服务器过载因此断开一部分客户端连接. |
1014 | 由 WebSocket标准保留以便未来使用. | |
1015 | TLS Handshake | 保留. 表示连接由于无法完成 TLS 握手而关闭 (例如无法验证服务器证书). |
1016–1999 | 由 WebSocket标准保留以便未来使用. | |
2000–2999 | 由 WebSocket拓展保留使用. | |
3000–3999 | 可以由库或框架使用.? 不应由应用使用. 可以在 IANA 注册, 先到先得. | |
4000–4999 | 可以由应用使用. |