Golang 作为广泛用于服务端和云计算领域的编程语言,tcp socket 是其中至关重要的功能。无论是 WEB 服务器还是各类中间件都离不开 tcp socket 的支持。

与早期的每个线程持有一个 socket 的 block IO 模型不同, 多路IO复用模型使用单个线程监听多个 socket, 当某个 socket 准备好数据后再进行响应。在逻辑上与使用 select 语句监听多个 channel 的模式相同。

目前主要的多路IO复用实现主要包括: SELECT, POLL 和 EPOLL。 为了提高开发效率社区也出现很多封装库, 如Netty(Java), Tornado(Python) 和 libev(C)等。

Golang Runtime 封装了各操作系统平台上的多路IO复用接口, 并允许使用 goroutine 快速开发高性能的 tcp 服务器。

作为开始,我们来实现一个简单的 Echo 服务器。它会接受客户端连接并将客户端发送的内容原样传回客户端。

  1. package main
  2. import (
  3. "fmt"
  4. "net"
  5. "io"
  6. "log"
  7. "bufio"
  8. )
  9. func ListenAndServe(address string) {
  10. // 绑定监听地址
  11. listener, err := net.Listen("tcp", address)
  12. if err != nil {
  13. log.Fatal(fmt.Sprintf("listen err: %v", err))
  14. }
  15. defer listener.Close()
  16. log.Println(fmt.Sprintf("bind: %s, start listening...", address))
  17. for {
  18. // Accept 会一直阻塞直到有新的连接建立或者listen中断才会返回
  19. conn, err := listener.Accept()
  20. if err != nil {
  21. // 通常是由于listener被关闭无法继续监听导致的错误
  22. log.Fatal(fmt.Sprintf("accept err: %v", err))
  23. }
  24. // 开启新的 goroutine 处理该连接
  25. go Handle(conn)
  26. }
  27. }
  28. func Handle(conn net.Conn) {
  29. // 使用 bufio 标准库提供的缓冲区功能
  30. reader := bufio.NewReader(conn)
  31. for {
  32. // ReadString 会一直阻塞直到遇到分隔符 '\n'
  33. // 遇到分隔符后会返回上次遇到分隔符或连接建立后收到的所有数据, 包括分隔符本身
  34. // 若在遇到分隔符之前遇到异常, ReadString 会返回已收到的数据和错误信息
  35. msg, err := reader.ReadString('\n')
  36. if err != nil {
  37. // 通常遇到的错误是连接中断或被关闭,用io.EOF表示
  38. if err == io.EOF {
  39. log.Println("connection close")
  40. } else {
  41. log.Println(err)
  42. }
  43. return
  44. }
  45. b := []byte(msg)
  46. // 将收到的信息发送给客户端
  47. conn.Write(b)
  48. }
  49. }
  50. func main() {
  51. ListenAndServe(":8000")
  52. }

使用 telnet 工具测试我们编写的 Echo 服务器:

  1. $ telnet 127.0.0.1 8000
  2. Trying 127.0.0.1...
  3. Connected to 127.0.0.1.
  4. Escape character is '^]'.
  5. > a
  6. a
  7. > b
  8. b
  9. Connection closed by foreign host.

HTTP 等应用层协议只有收到一条完整的消息后才能进行处理,而工作在传输层的TCP协议并不了解应用层消息的结构。

因此,可能遇到一条应用层消息分为两个TCP包发送或者一个TCP包中含有两条应用层消息片段的情况,前者称为拆包后者称为粘包。

在 Echo 服务器的示例中,我们定义用\n表示消息结束。我们可能遇到下列几种情况:

  1. 收到两个 tcp 包: “abc”, “def\n”, 应发出一条响应 “abcdef\n”, 这是拆包的情况
  2. 收到一个 tcp 包: “abc\ndef\n”, 应发出两条响应 “abc\n”, “def\n”, 这是粘包的情况

当我们使用 tcp socket 开发应用层程序时必须正确处理拆包和粘包。

bufio 标准库会缓存收到的数据直到遇到分隔符才会返回,它可以正确处理拆包和粘包。

上层协议通常采用下列几种思路之一来定义消息,以保证完整地进行读取:

  • 定长消息
  • 在消息尾部添加特殊分隔符,如示例中的Echo协议和FTP控制协议
  • 将消息分为header 和 body, 并在 header 提供消息总长度。这是应用最广泛的策略,如HTTP协议。

在生产环境下需要保证TCP服务器关闭前完成必要的清理工作,包括将完成正在进行的数据传输,关闭TCP连接等。这种关闭模式称为优雅关闭,可以避免资源泄露以及客户端未收到完整数据造成异常。

TCP 服务器的优雅关闭模式通常为: 先关闭listener阻止新连接进入,然后遍历所有连接逐个进行关闭。

本节完整源代码地址: https://github.com/HDT3213/godis/tree/master/src/server

首先修改一下TCP服务器:

  1. // handler 是应用层服务器的抽象
  2. type Handler interface {
  3. Handle(ctx context.Context, conn net.Conn)
  4. Close()error
  5. }
  6. func ListenAndServe(cfg *Config, handler tcp.Handler) {
  7. listener, err := net.Listen("tcp", cfg.Address)
  8. if err != nil {
  9. logger.Fatal(fmt.Sprintf("listen err: %v", err))
  10. }
  11. // 监听中断信号
  12. // atomic.AtomicBool 是作者写的封装: https://github.com/HDT3213/godis/blob/master/src/lib/sync/atomic/bool.go
  13. var closing atomic.AtomicBool
  14. sigCh := make(chan os.Signal, 1)
  15. signal.Notify(sigCh, syscall.SIGHUP, syscall.SIGQUIT, syscall.SIGTERM, syscall.SIGINT)
  16. go func() {
  17. sig := <-sigCh
  18. switch sig {
  19. case syscall.SIGHUP, syscall.SIGQUIT, syscall.SIGTERM, syscall.SIGINT:
  20. // 收到中断信号后开始关闭流程
  21. logger.Info("shuting down...")
  22. // 设置标志位为关闭中, 使用原子操作保证线程可见性
  23. closing.Set(true)
  24. // listener 关闭后 listener.Accept() 会立即返回错误
  25. listener.Close()
  26. }
  27. }()
  28. logger.Info(fmt.Sprintf("bind: %s, start listening...", cfg.Address))
  29. // 在出现未知错误或panic后保证正常关闭
  30. // 注意defer顺序,先关闭 listener 再关闭应用层服务器 handler
  31. defer handler.Close()
  32. defer listener.Close()
  33. ctx, _ := context.WithCancel(context.Background())
  34. for {
  35. conn, err := listener.Accept()
  36. if err != nil {
  37. if closing.Get() {
  38. // 收到关闭信号后进入此流程,此时listener已被监听系统信号的 goroutine 关闭
  39. // handler 会被上文的 defer 语句关闭直接返回
  40. return
  41. }
  42. logger.Error(fmt.Sprintf("accept err: %v", err))
  43. continue
  44. }
  45. // handle
  46. logger.Info("accept link")
  47. go handler.Handle(ctx, conn)
  48. }
  49. }

接下来修改应用层服务器:

  1. // 客户端连接的抽象
  2. type Client struct {
  3. // tcp 连接
  4. Conn net.Conn
  5. // 当服务端开始发送数据时进入waiting, 阻止其它goroutine关闭连接
  6. // wait.Wait是作者编写的带有最大等待时间的封装:
  7. // https://github.com/HDT3213/godis/blob/master/src/lib/sync/wait/wait.go
  8. Waiting wait.Wait
  9. }
  10. type EchoHandler struct {
  11. // 保存所有工作状态client的集合(把map当set用)
  12. // 需使用并发安全的容器
  13. activeConn sync.Map
  14. // 和 tcp server 中作用相同的关闭状态标识位
  15. closing atomic.AtomicBool
  16. }
  17. func MakeEchoHandler()(*EchoHandler) {
  18. return &EchoHandler{
  19. }
  20. }
  21. // 关闭客户端连接
  22. func (c *Client)Close()error {
  23. // 等待数据发送完成或超时
  24. c.Waiting.WaitWithTimeout(10 * time.Second)
  25. c.Conn.Close()
  26. return nil
  27. }
  28. func (h *EchoHandler)Handle(ctx context.Context, conn net.Conn) {
  29. if h.closing.Get() {
  30. // closing handler refuse new connection
  31. conn.Close()
  32. }
  33. client := &Client {
  34. Conn: conn,
  35. }
  36. h.activeConn.Store(client, 1)
  37. reader := bufio.NewReader(conn)
  38. for {
  39. msg, err := reader.ReadString('\n')
  40. if err != nil {
  41. if err == io.EOF {
  42. logger.Info("connection close")
  43. h.activeConn.Delete(conn)
  44. } else {
  45. logger.Warn(err)
  46. }
  47. return
  48. }
  49. // 发送数据前先置为waiting状态
  50. client.Waiting.Add(1)
  51. // 模拟关闭时未完成发送的情况
  52. //logger.Info("sleeping")
  53. //time.Sleep(10 * time.Second)
  54. b := []byte(msg)
  55. conn.Write(b)
  56. // 发送完毕, 结束waiting
  57. client.Waiting.Done()
  58. }
  59. }
  60. func (h *EchoHandler)Close()error {
  61. logger.Info("handler shuting down...")
  62. h.closing.Set(true)
  63. // TODO: concurrent wait
  64. h.activeConn.Range(func(key interface{}, val interface{})bool {
  65. client := key.(*Client)
  66. client.Close()
  67. return true
  68. })
  69. return nil
  70. }

版权声明:本文为Finley原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/Finley/p/11070669.html