Swift 中的字符串截取
发表于2016-12-14||100
Substring in Swift 3.0
Info:
macOS 10.12.2 Beta
Xcode 8.2 Beta
Swift 3.0
最近更文的频率也是越来越慢,除去已到期末的缘故,加上在忙老师的项目,自己的时间便被压缩殆尽。不过好在Swift 设计模式基本上已经更新完毕,下来就准备补齐每个模式对应的说明。
在尝试使用 Swift 实现《大话设计模式》一书中的解释器模式时,书中的 Demo 多次使用了截取字符串的方法,当然,Swift 作为一门先进的编程语言不会缺少这一常用的方法。然而在使用中,可能由于 Swift 是一门较为注重(类型)安全的语言,其字符串截取方法使用方式与 Java 等编程语言便有一些语法上的不同。在 Swift 自身的迭代过程中,这部分的语法变化也很大。所以这次就来简单研究一下 Swift 中的字符串截取。需要注意的是,虽然 Swift 也可以使用 NSString 类型的字符串,而且两者可以很容易的桥接,但考虑到个人对 Objective-C 的了解程度,便暂时不探讨。
索引与下标,即 index 和 subscript。一般来说,两者的概念是类似的,不过个人觉得索引有泛指的概念,而下标是具体的。
Swift 中字符串的索引类型并不是其他语言中的整型(int),而是 String.Index。String.Index,即标注字符串的索引类型。在 Swift 的标准库中,可以看到其本质是String.CharacterView.Index的别名。
/// The index type for subscripting a string.
publictypealiasIndex=String.CharacterView.Index
再进一步查看String.CharacterView,即创建给定字符串的字符视图类型。
publicstructCharacterView{
/// Creates a view of the given string.
publicinit(_text:String)
}
常用的"maimieng.com".characters的类型其实就是String.CharacterView类型。.characters将字符串内容转化为字符序列的视图。
字符串必然是一个字符的有限序列,Swift 为了方便开发者迅速定位,便集成了startIndex和endIndex。但是需要注意的是:startIndex是指字符串的第一个字符的下标,而endIndex是指字符串的最后一个字符之后的下标。当字符串为空时,startIndex和endIndex相同。
varstr ="maimieng.com"
print(str.characters.count)
print(str.startIndex)
print(str.endIndex)
// 12
// Index(_base: Swift.String.UnicodeScalarView.Index(_position: 0), _countUTF16: 1)
// Index(_base: Swift.String.UnicodeScalarView.Index(_position: 12), _countUTF16: 0)
从上面的 Demo 也可以看出,startIndex的位置为 0,而endIndex的位置为 12,等同于字符串的长度,而不是字符串长度减一。
除了给出了起始和结尾的下标,Swift 也提供了根据下标定位其他索引的方法:
publicfuncindex(after i: String.Index)->String.Index
publicfuncindex(before i: String.Index)->String.Index
publicfuncindex(_i: String.Index, offsetBy n: String.IndexDistance)->String.Index
publicfuncindex(_i: String.Index, offsetBy n: String.IndexDistance, limitedBy limit: String.Index)->String.Index?
这样就可以通过给出的startIndex和endIndex来定位到其他的下标了。
varstr ="maimieng.com"
// 返回传入下标之后的下标
print(str.index(after: str.startIndex))
// 返回传入下标之前的下标
print(str.index(before: str.endIndex))
// 返回传入下标偏移后的下标(偏移量可正可负可为 0)
print(str.index(str.startIndex, offsetBy:1))
// print(str.index(str.endIndex, offsetBy: 10))
// 作用同上,但如果超过传入的界限返回 nil
print(str.index(str.endIndex, offsetBy:10, limitedBy: str.endIndex) ??"越界")
下标之间的间距,也可以利用func distance(from start: String.Index, to end: String.Index) -> String.IndexDistance方法求出:
varstr ="maimieng.com"
print(str.distance(from: str.startIndex, to: str.endIndex))
// 12
print(str.distance(from: str.endIndex, to: str.startIndex))
// -12
Range 即范围,Swift 中实现了 Comparable 协议的类型都可以用 Range 来表示范围。以下的 Range 特指:Range。
Range 的构造方法是init(uncheckedBounds bounds: (lower: Bound, upper: Bound))。即传入一个元组,返回一个范围。需要注意的是:这个范围 Swift 是不会检查的,需要程序员自觉维护。
varstr ="maimieng.com"
// 前闭后开
letrangeA =Range(uncheckedBounds: (str.startIndex, str.endIndex))
print(rangeA)
// Index(_base: Swift.String.UnicodeScalarView.Index(_position: 0), _countUTF16: 1)..
print(str.substring(with: rangeA))
// maimieng.com
// 即使范围首尾颠倒,也没有报错
letrangeB =Range(uncheckedBounds: (str.endIndex, str.startIndex))
print(rangeB)
// Index(_base: Swift.String.UnicodeScalarView.Index(_position: 12), _countUTF16: 0)..
// 但在使用中会出错
// fatal error: Can't form Range with upperBound < lowerBound
// str.substring(with: rangeB)
在上面的 Demo 中,从输出中也可以看出,init(uncheckedBounds bounds: (lower: Bound, upper: Bound))构造的范围是一个前闭后开的区间。
Swift 中,字符串本身也能构造出 Range,例如:得到字符串子串的范围,若不存在则返回 nil:
varstr ="maimieng.com"
// 返回前闭后开的范围
print(str.range(of:".com") ??"不存在")
// Index(_base: Swift.String.UnicodeScalarView.Index(_position: 8), _countUTF16: 1)..
在 Range 一节的 Demo 中,已经使用了substring(with:)方法测试范围的使用。Swift 中的字符串截取与其他语言其实是相似的,都是根据索引或索引范围来截取,只是 Swift 中的索引的类型不是整型,稍有麻烦。
varstr ="maimieng.com"
// 截取传入范围(左开右闭)的子串
letrange =Range(uncheckedBounds: (str.startIndex, str.endIndex))
print(str.substring(with: range))
// 从传入的索引开始截取到末尾(含 str.startIndex 元素)
print(str.substring(from: str.startIndex))
// 从传入的索引的前一个位置开始截取到头部(不含 str.endIndex 元素)
print(str.substring(to: str.endIndex))
// maimieng.com
// maimieng.com
// maimieng.com
以上的 Demo 便是 Swift 中最基本的截取字符串使用。然而有时候条件一多,代码的重复率也会增加,那么可以利用 Swift 中的
extension 来扩展原有的 String,让 Swift 的 String 可以像 C#、Java 一样截取字符串,需要注意的是 这里的
IndexDistance 实际上是 String.CharacterView.IndexDistance 的别名,而
String.CharacterView.IndexDistance 又是 Int 类型的别名。
extensionString{
funcsubstring(from: IndexDistance)->String? {
letindex =self.index(self.startIndex, offsetBy: from)
returnstr.substring(from: index)
}
funcsubstring(to: IndexDistance)->String? {
letindex =self.index(self.startIndex, offsetBy: to +1)
returnstr.substring(to: index)
}
funcsubstring(with range: Range)->String? {
letlower =self.index(self.startIndex, offsetBy: range.lowerBound)
letupper =self.index(self.startIndex, offsetBy: range.upperBound)
letrange =Range(uncheckedBounds: (lower, upper))
returnstr.substring(with: range)
}
funcsubstring(_lower: IndexDistance,_range: IndexDistance)->String? {
letlowerIndex =self.index(self.startIndex, offsetBy: lower)
letupperIndex =self.index(lowerIndex, offsetBy: range)
letrange =Range(uncheckedBounds: (lowerIndex, upperIndex))
returnstr.substring(with: range)
}
}
print(str.substring(to:0) ??"nil")
print(str.substring(from:2) ??"nil")
print(str.substring(with:0..<1) ??"nil")
print(str.substring(1,2) ??"nil")
// m
// imieng.com
// m
// ai
Documentation & API Reference
原文出处:https://maimieng.com/2016/37/