微博的兴起,带来了一个新的词语:短链。
何谓短链?如果我们在微博里发布一条带网址的信息,微博会把里面的网址转化成一个更短的网址。我们只要访问这个短网址,就相当于访问原始的网址。
那如何实现一个短链系统呢?核心包括以下两点:
1、在系统中生成全局唯一的数字。有很多方式可以实现,详情请参考我的另一篇文章:分布式系统唯一ID生成技术方案
2、如何表示该数学?如果直接显示,那么数字可能很长,比如:5632033057037877251,没有体现出短链的优势。我们可以将一个十进制的整数转换成十六进制,这么显示的范围就是0123456789ABCDEF。也可以用字母+数字来表示。
而为了得到尽可能短的内容,我们可以使用数字+大写字母+小写字母一起来表示一个十进制数。这样能显示的范围就是0-9a-zA-Z,能够极大地缩短内容的长度。
为了设计一个更一般的系统,我特地实现了十进制转换为任意进制的实现。如下所示:
/*
一个处理不同进制的工具包;用于将十进制和其它进制进行互相转换
*/
package baseUtil
import (
"fmt"
"math"
)
// 进制对象定义
type Base struct {
elementList []string
base uint64
}
// 将10进制的uint64类型数据转换为字符串形式
// source:10进制的uint64类型数据
// 返回值:
// 对应进制的字符串形式
func (this *Base) Transform(source uint64) (result string) {
quotient, remainder := uint64(0), source
for {
quotient, remainder = remainder/this.base, remainder%this.base
result = this.elementList[remainder] + result
if quotient == 0 {
break
}
remainder = quotient
}
return
}
// 将字符串解析为10进制的uint64类型
// source:对应进制的字符串形式
// 返回值:10进制的uint64类型数据
func (this *Base) Parse(source string) (result uint64) {
if source == "" {
return
}
sourceList := make([]string, 0, len(source))
for _, v := range source {
sourceList = append(sourceList, string(v))
}
for idx, exp := len(sourceList)-1, 0; idx >= 0; idx, exp = idx-1, exp+1 {
sourceItem := sourceList[idx]
// Find the source item in the elementList
for i, v := range this.elementList {
if sourceItem == v {
result += uint64(float64(i) * math.Pow(float64(this.base), float64(exp)))
}
}
}
return
}
// 以指定的任意非重复的数组,来指定基于的进制数
func New(elements string) (baseObj *Base, err error) {
if len(elements) == 0 {
err = fmt.Errorf("输入的字符数串为空")
return
}
elementList := make([]string, 0, len(elements))
elementMap := make(map[rune]struct{}, len(elements))
for _, v := range elements {
if _, exist := elementMap[v]; exist {
err = fmt.Errorf("输入的字符串中含有重复的字符:%s", string(v))
return
} else {
elementMap[v] = struct{}{}
elementList = append(elementList, string(v))
}
}
baseObj = &Base{
elementList: elementList,
base: uint64(len(elementList)),
}
return
}
// 包含01
func NewBase2() (baseObj *Base, err error) {
return New("01")
}
// 包含0-7
func NewBase8() (baseObj *Base, err error) {
return New("01234567")
}
// 包含0-9,a-x
func NewBase16() (baseObj *Base, err error) {
return New("0123456789abcdef")
}
// 包含a-z
func NewBase26() (baseObj *Base, err error) {
return New("abcdefghijklmnopqrstuvwxyz")
}
// 包含0-9,a-z
func NewBase36() (baseObj *Base, err error) {
return New("0123456789abcdefghijklmnopqrstuvwxyz")
}
// 包含0-9,a-z,A-Z
func NewBase62() (baseObj *Base, err error) {
return New("0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")
}
完整的代码,请参考:https://github.com/Jordanzuo/goutil/tree/master/baseUtil