GO 记一次TcpServer性能优化

库存文章发布

写了一个TcpServer,主要功能是做终端的保活信息,保活信息中包含一些额外数据。并转发来自后端的命令至终端。
历经数日,各项基础功能完备,准备做一些压力测试。

服务器配置:

cpu family  : 6
model       : 63
model name  : Intel(R) Xeon(R) CPU E5-2620 v3 @ 2.40GHz
stepping    : 2
microcode   : 0x38
cpu MHz     : 1523.625
cache size  : 15360 KB

内存:16G

当然,了为压力测试,独立写了客户端测试程序,客户端也简单,实现连接和心跳(10秒一次)。

第一次测试,客户端数据过千就出错了,很明显,limit需要配置一下喽。 limit这个配置,说难不难,但每次记不住。

好文不敢独享, Linux TCP/IP 协议栈调优

第二次测试,客户端20k,貌似没问题,只是CPU使用率达到200%多,领导不同意,性能堪忧,并对go产生质疑,如此性能,怎么称霸宇宙!! 改去吧。

开始一次性能优化之旅:
1,首先,我们看到了性能问题,但我们不知道哪里有问题。于是需要工具帮我们调查,哪里慢了。这里pprof 工具出场性能试工具
虽然我的程序并不提供http服务,但我依然选择了http的方式,输出debug,因为我觉得这样方便

main.go
import (
    _ "net/http/pprof"
    "net/http"
)
....
    go func() {
        if pprofPort := utils.GetConfig("pprofPort").(string); pprofPort != "" {
            log.Warningf("pprof at http, %s", pprofPort)
            http.ListenAndServe(pprofPort, nil)
        }
    }()
....

使用 go tool pprof http://192.168.1.8:2205/debug/pprof/profile开始收集,大概30秒左右,出现命令提示符:

go tool pprof  http://192.168.1.8:2205/debug/pprof/profile

Fetching profile over HTTP from http://192.168.1.8:2205/debug/pprof/profile
.....30s

主要介绍两个命令:
一个叫top,显示耗时最长的代码。默认10个。可以使用 top5,top20随意查找。
一个叫list,根据top的结果,使用list+代码名称,产出结果如下,非常明确

(pprof) list _/Users/apple/GoglandProjects/MessageServer/server
Total: 13.36s
ROUTINE ======================== _/Users/apple/GoglandProjects/MessageServer/server.Depack in /Users/apple/GoglandProjects/MessageServer/server/receiveHandler.go
      20ms      180ms (flat, cum)  1.35% of Total
         .          .     68:// 如果有,返回一个完整的命令及余下的内容
         .          .     69:// 如果没有,新旧数据拼接返回。命令为空
         .          .     70:// buffer 表示旧的数据
         .          .     71:// newData 表示刚收到的数据
         .          .     72:func Depack(buffer, read []byte) (r, data []byte) {
         .       30ms     73:   if index := bytes.Index(read, []byte{13, 10}); index > -1 {
         .          .     74:       if (len(buffer) > 0) {
      20ms       40ms     75:           data = append(buffer, read[:index]...)
         .          .     76:       } else {
         .          .     77:           data = read[:index]
         .          .     78:       }
         .          .     79:
         .          .     80:       // 余下的内容,继续粘包
         .          .     81:       buffer = read[index+1:]
         .          .     82:       // 清理空白字符
         .      110ms     83:       data = bytes.TrimFunc(data, unicode.IsSpace)
         .          .     84:   } else {
         .          .     85:       // 如果没有,直接将新旧数据相连
         .          .     86:       buffer = append(buffer, read[:]...)
         .          .     87:   }
         .          .     88:   return data, buffer

接下来就是使用这两个命令,找到最消耗时间的代码块,然后优化。


最后完成版
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 第一部分 HTML&CSS整理答案 1. 什么是HTML5? 答:HTML5是最新的HTML标准。 注意:讲述HT...
    kismetajun阅读 28,415评论 1 45
  • 程序各种指标 是指程序中己动态分配的堆内存由于某种原因程序未释放或无法释放,造成系统内存的浪费,导致程序运行速度减...
    初级赛亚人阅读 10,690评论 0 4
  • 大多数 Nginx 新手都会频繁遇到这样一个困惑,那就是当同一个location配置块使用了多个 Nginx 模块...
    SkTj阅读 12,462评论 0 12
  • 我特别尊敬贾平凹先生,他大部分的作品我都有阅览,十分的敬爱他,所以小就尊称他为贾老。 让日常生活走...
    瓜洲哈D阅读 4,451评论 0 1
  • 14年前遇到了我的高三班主任齐老师,他是教英文的,所以思维非常开放。加上我被选为英语课代表,跟他接触的机会特别多。...
    天空之城_cbc3阅读 1,508评论 0 2

友情链接更多精彩内容