golang的bufio源码分析

原本只想用用bufio,但是网上文章没有一个写清楚bufio到底怎么用,每个方法具体干了什么,搞不明白原理就不敢乱用,还好有源码,自己来分析最清楚。

Reader分析


func NewReaderSize(rd io.Reader, size int) *Reader {
    // Is it already a Reader?
    b, ok := rd.(*Reader)
    if ok && len(b.buf) >= size {
        return b
    }
    if size < minReadBufferSize { //minReadBufferSize==16
        size = minReadBufferSize
    }
    r := new(Reader)
    r.reset(make([]byte, size), rd)
    return r
}

// NewReader returns a new Reader whose buffer has the default size.
func NewReader(rd io.Reader) *Reader {
    return NewReaderSize(rd, defaultBufSize)
}

一开始传入io.Reader创建bufio.Reader,默认defaultBufSize为4096字节也就是4K字节。


// fill reads a new chunk into the buffer.
func (b *Reader) fill() {
    // Slide existing data to beginning.
    if b.r > 0 { //把buf剩余可读的数据复制到最前
        copy(b.buf, b.buf[b.r:b.w])
        b.w -= b.r
        b.r = 0
    }

    if b.w >= len(b.buf) {//缓存已经溢出了
        panic("bufio: tried to fill full buffer")
    }
    //maxConsecutiveEmptyReads == 100
    // Read new data: try a limited number of times.
    for i := maxConsecutiveEmptyReads; i > 0; i-- {
        n, err := b.rd.Read(b.buf[b.w:]) //从io中读取数据写入缓存 
        if n < 0 {
            panic(errNegativeRead)
        }
        b.w += n //更新写入缓存的长度
        if err != nil {
            b.err = err
            return
        }
        if n > 0 {
            return
        }
              // n== 0时会循环尝试从io中读取,最多100次
    }
    b.err = io.ErrNoProgress //读了100次,n都为0
}

fill()把剩余未读长度的数据复制到缓存头部并且r重置为0,相当于把未读数据移动到头部。同时尽量从io中读取数据写入缓存,有可能不能写满。


// ReadByte reads and returns a single byte.
// If no byte is available, returns an error.
func (b *Reader) ReadByte() (byte, error) {
    b.lastRuneSize = -1
    for b.r == b.w { //缓存中无数据可读
        if b.err != nil {
            return 0, b.readErr()
        }
        b.fill() // buffer is empty,从io中fill数据
    }
    c := b.buf[b.r]//此时肯定有数据了,取r位置的一个字节
    b.r++ //r游标移动一个字节
    b.lastByte = int(c)
    return c, nil
}

ReadByte()从缓存中读取一个字节,如果缓存中没有数据则尝试从io中填充数据。最后返回读取到的一个字节的内容



// Read reads data into p.
// It returns the number of bytes read into p.
// The bytes are taken from at most one Read on the underlying Reader,
// hence n may be less than len(p).
// At EOF, the count will be zero and err will be io.EOF.
func (b *Reader) Read(p []byte) (n int, err error) {
    n = len(p)
    if n == 0 {
        return 0, b.readErr()
    }
    if b.r == b.w {//缓存中无数据可读
        if b.err != nil {
            return 0, b.readErr()
        }
        if len(p) >= len(b.buf) { //p的空间大于等于缓存
            // Large read, empty buffer.
            // Read directly into p to avoid copy.
            n, b.err = b.rd.Read(p)//直接从io中把数据读取到p中
            if n < 0 {
                panic(errNegativeRead)
            }
            if n > 0 {
                b.lastByte = int(p[n-1])
                b.lastRuneSize = -1
            }
            return n, b.readErr()
        }
        // One read.
        // Do not use b.fill, which will loop.
        // 无数据可读,表示buf中数据无用了则重置r和w的游标
        b.r = 0
        b.w = 0
        n, b.err = b.rd.Read(b.buf)//从io中读取到缓存
        if n < 0 {
            panic(errNegativeRead)
        }
        if n == 0 {
            return 0, b.readErr()
        }
        b.w += n//缓存写入了多少数据
    }

    // copy as much as we can
    n = copy(p, b.buf[b.r:b.w])//缓存中数据可读数据读取到p
    b.r += n //读了多少
    b.lastByte = int(b.buf[b.r-1])
    b.lastRuneSize = -1
    return n, nil
}

Read(p []byte):
当缓存中没有可读数据时有两种情况:
情况1. 当p的空间大于等于缓存时,直接从io中把数据读取到p。
情况2. 当p的空间小于缓存时,重置缓存游标,尽量从io中读取数据到缓存 ,然后再从缓存中复制到p里。

当缓存中有可读数据时,直接从缓存中把可读数据复制到p中,此时不会去读取io。

p的空间有可能被填满,也有可能不满,返回的n说明读取了多少个字节。


// Peek returns the next n bytes without advancing the reader. The bytes stop
// being valid at the next read call. If Peek returns fewer than n bytes, it
// also returns an error explaining why the read is short. The error is
// ErrBufferFull if n is larger than b's buffer size.
func (b *Reader) Peek(n int) ([]byte, error) {
    if n < 0 {
        return nil, ErrNegativeCount
    }

    //剩余可读小于n而且小于缓存时从io里fill数据到缓存
    for b.w-b.r < n && b.w-b.r < len(b.buf) && b.err == nil {
        b.fill() // b.w-b.r < len(b.buf) => buffer is not full
    }
    //n比缓存大,返回可读的缓存切片,而且错误值为ErrBufferFull
    if n > len(b.buf) {
        return b.buf[b.r:b.w], ErrBufferFull
    }

    // 0 <= n <= len(b.buf)
    var err error
    if avail := b.w - b.r; avail < n {
        // not enough data in buffer
        //缓存的可读数据不够读,返回可以读的缓存切片及错误值ErrBufferFull
        n = avail
        err = b.readErr()
        if err == nil {
            err = ErrBufferFull
        }
    }
    //如果缓存的可读数据足够就返回可读缓存切片和空错误
    return b.buf[b.r : b.r+n], err
}

Peek(n int):
先从io中填充缓存。
如果要读的n比缓存大返回错误值ErrBufferFull。
如果n小于等于缓存,且可读数据不够读返回ErrBufferFull或者io读错误。
如果有可够读的数据返回的错误为空。

不管怎样都会返回缓存可读取的切片但是没有移动读游标,修改返回的切片会影响缓存中的数据。


// Buffered returns the number of bytes that can be read from the current buffer.
func (b *Reader) Buffered() int { return b.w - b.r }//可读长度

// Discard skips the next n bytes, returning the number of bytes discarded.
//
// If Discard skips fewer than n bytes, it also returns an error.
// If 0 <= n <= b.Buffered(), Discard is guaranteed to succeed without
// reading from the underlying io.Reader.
func (b *Reader) Discard(n int) (discarded int, err error) {
    if n < 0 {
        return 0, ErrNegativeCount
    }
    if n == 0 {
        return
    }
    remain := n
    for {
        skip := b.Buffered()
        if skip == 0 {//没可读先fill填充
            b.fill()
            skip = b.Buffered()
        }
        if skip > remain {
            skip = remain
        }
        b.r += skip //读游标直接跳过skip个字节
        remain -= skip
        if remain == 0 {//成功跳过请求的字节长度
            return n, nil
        }
        if b.err != nil {//出错了,返回剩下多少个字节没跳过和错误
            return n - remain, b.readErr()
        }
    }
}

Discard(n int) :
跳过n个字节不读取,一直循环到成功跳过或者出现错误。

Reader的其他方法我一般不用,所以也不分析了。

总结:

Peek返回错误不为空时,一种情况是你Peek的长度比缓存都大,那么数据永远不够,所以传入参数时要注意别比缓存大。
别一种情况是,从io里尝试读数据了但还是准备不够你需要的长度,比如网络tcp的数据一开始没有到达,等下一轮你再调用Peek时可能缓存就足够你读了。
其实就算有错误也会返回你可读取的切片。
如果错误为空,恭喜你,数据都准备好啦。
Peek不会移动读游标,如果直接使用Peek返回的切片可以配合Discard来跳过指定字节的数据不再读取也就是移动读游标。

Read尽量先从缓存中读取数据。当前缓存无数据可读时先从io中读取填充到缓存里,然后从缓存中复制。返回读取到的数据长度不一定,小于或者等于Read要求的长度。

想跳过n个字节不读取,使用Discard。

使用NewReader初始化时默认缓存为4096字节,在某些情况下可能太大浪费内存或者太小不够用,最好还是使用NewReaderSize根据情况自定义缓存大小。


Writer


有空再写

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,776评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,527评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,361评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,430评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,511评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,544评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,561评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,315评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,763评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,070评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,235评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,911评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,554评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,173评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,424评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,106评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,103评论 2 352