《Real World Haskell》笔记（8）：文件处理、正则表达式、文件名匹配

高效文件处理

默认String类型为何效率不高？

String 是元素类型为 Char 的列表，列表每个元素被单独分配内存，有一定写入开销
对需要读取文本及二进制数据的程序来说，内存消耗和执行效率会受到较大影响

ByteString库为提高效率提供作为String替代物的两个模块，

Data.ByteString 定义 ByteString 的严格类型
利用数组表示字符串、二进制数据或文本，适用于不在意内存占用而且需要随机访问的数据。
Data.ByteString.Lazy 定义 ByteString 的惰性类型
将字符串表示为由块组成的列表，每个块是大小为 64KB 的数组，适用于大体积的文件流。

限定载入

--file elf.hs
import qualified Data.ByteString.Lazy as L
hasElf::L.ByteString->Bool
hasElf content=L.take 4 content == elfMagic
    where elfMagic = L.pack [0x7f, 0x45, 0x4c, 0x46]

限定载入语法import qualified ... as ... 把模块关联到另一个选定的名字
若要使用该被限定载入模块中的函数，需要用选定的名字前缀如L.take，限定载入可以防止不同模块函数重名。
无论是否使用有限载入，始终可以使用模块全名来引用函数

Haskell正则表达式

Haskell正则表达式需要使用Text.Regex.Posix模块，通常需要stack install regex-posix安装该模块才可以使用。以中缀运算符 =~表示的正则表达式匹配函数是该模块中较重要的函数。
(=~) :: (RegexMaker Regex CompOption ExecOption source, RegexContext Regex source1 target) => source1 -> source -> target，由于其返回类型多态，

在ghci中使用该函数时，需要指定希望获取结果的类型，如"my left foot" =~ "foo" :: Bool，否则 ghci 将因无法获得足够信息对匹配结果进行类型推导而报错
在实际编码中使用该函数时，ghc通过我们如何使用匹配结果推导出它的类型
第一个参数 (=~左侧) 是要被匹配的文本，第二个参数 (=~ 右侧) 是准备匹配的正则表达式，对每个参数我们都可以使用 String 或者 ByteString，可以将模式串定义为变量 let pat = "(foo[a-z]*bar|quux)"

库内部所含类型类RegexContext，该类型类描述目标类型的行为

目标类型为 Bool ，作为该类型类的实例，描述是否取回可用的结果
目标类型为 Int ，作为该类型类的实例，描述正则表达式匹配的次数
目标类型为 String，获取第一个匹配的子串，或者表示无匹配的空字符串
目标类型为 [[String]]，获取由所有匹配的字符串组成的列表
结果类型为(String,String,String) 的三元组，三个元素分别获取字符串中首次匹配之前的部分，首次匹配的子串，和首次匹配之后的部分
结果类型为(String,String,String,[String])的四元组，元组的第四个元素是一个包含所有成功匹配子串的列表
结果类型为(Int,Int)的二元组，获取首次匹配在字符串中的偏移，以及匹配结果的长度；首个元素值为 -1 时，匹配失败。
结果类型为[(Int,Int)]的二元组列表，获取所有成功匹配子串的此类信息；当指定返回值为列表时，空表表示失败。
RegexContext 类型类内置实例的完整清单在 Text.Regex.Base.Context 模块的文档中找到。

最后编辑于：2019.02.22 16:22:57

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,470评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,393评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,577评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,176评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,189评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,155评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,041评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,903评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,319评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,539评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,703评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,417评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,013评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,664评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,818评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,711评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,601评论 2赞 353

《Real World Haskell》笔记（8）：文件处理、正则表达式、文件名匹配

高效文件处理

限定载入

Haskell正则表达式

推荐阅读更多精彩内容