Ruby是一种脚本语言,
Gem是基于Ruby的一些开发工具包,一个用于对 Ruby组件进行打包的 Ruby 打包系统.
编码:
1: Base64基于64个可打印字符来表示二进制数据的方法,主要用于字节流的传送。使用的字符包括大小写字母各26个,加上10个数字,和加号“+”,斜杠“/”,一共64个字符。首先将string以三个字符串为一组,转为四组的ascii码,得到后按照Base64表得到对应的string。
http://www.cnblogs.com/Bonker/p/3558849.html
问题:对于简体中文、繁体中文、日文以及韩文等都多字节来存储数据的编码格式咋办?
答:转化为单字节,再转2,预备知识:Unicode--->是一种标准。 它为每种语言中的每个字符设定了统一并且唯一的[二进制]编码,以满足跨语言、跨平台进行文本转换、处理的要求。统一码为每一个字符而非字形定义唯一的代码(即一个整数)在表示一个Unicode的字符时,通常会用“U+”然后紧接着一组十六进制的数字来表示这一个字符。Unicode编码的实现包括UTF8、UTF16、UTF32等等
Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
UTF8
UTF-8编码是变长的编码方式,占1~6个字节。通常把它看作单字节或三字节的实现。注意:汉字用UTF8编码是3个字节。
UTF16
UTF16编码使用固定的2个字节来存储。注意:汉字用UTF16编码是2个字节。
如果全部英文或英文与其他文字混合,但英文占绝大部分,用UTF-8就比UTF-16节省了很多空间.而如果全部是中文这样类似的字符或者混合字符中中文占绝大多数.UTF-16就占优势了,可以节省很多空间。
例如:“回”字,UTF8编码是“e59b9e”,长度为3;而UTF16编码为“de56”,长度为2.
文件指纹
文件签名