字符串与字母
字符串的字面量
let something = "some string literal value"
空字符串的初始化的两种方式
var emptyString = "" // empty string literal
var anotherEmptyString = String() // initializer syntax
检查字符串是否为空:用 isEmpty 属性
字符串可变性
如果字符串定义的是变量,可以修改,反之,修改报错
var variableString = "Horse"
variableString += " and carriage"
// variableString is now "Horse and carriage"
let constantString = "Highlander"
constantString += " and another Highlander"
// this reports a compile-time error - a constant string cannot be modified
字符串的值类型
Swift 中的字符串是一个值类型,如果你创建一个新的字符串值,当这个字符串被传递到一个函数或者方法时,或者分配成变量常量,都是以复制的形式,也就是copy。在上述的每种情况下,已存在的String值被复制生成,然后被传递或者分配,并不是最初的初始值。
Swift这种默认的方式保证当一个函数或者方法给你传递一个字符串的值时,你是完全拥有这个值,不用考虑从哪里来。你所传递的字符串不会被修改出了你自己可以修改。
Swift 的编译器会优化字符串的使用,也就是在真正需要的时候才会发生实实在在的copy。
与�字符的使用
通过字符的characters属性,获取相应的字符
for character in "Dog!🐶".characters {
print(character)
}
单独创造一个字符
let exchamationMark:Character = "!"
字符串也可以通过传递一组字符的值作为其初始化的参数来构造
let catCharacters:[Character] = ["C", "a", "t", "!", "🐱"]
let catString = String[catCharacters]
print(catString)
// Prints "Cat!🐱"
字符串与字符的合并
1.使用+连接,创建一个新的字符串
let string1 = "hello"
let string2 = " there"
var welcome = string1 + string2
// welcome now equals "hello there"
2.通过+=改变已有字符串
var instruction = "look over"
instruction += string2
// instruction now equals "look over there"
3.通过字符串的append()方法连接一个字符
let exclamationMark:Character = "!"
welcome.append(exclamationMark)
// welcome now equals "hello there!"
note:你不能把一个字符串或者字符连接到一个已经存在的字符变量,因为字符有且只能包含一个字符。
字符串的插入
字符串插入的部分要用括号包括,前缀是\
let multiplier = 3
let message = ''\(multiplier) times 2.5 is \(Double(multiplier)*2.5)"
// message is "3 times 2.5 is 7.5"
note:括号中所包含的不能包括,回车,换行符。这部分有人翻译不能加双引号,我试了下,可以加双引号,会自动忽略。
Unicode标量
面板之下,Swift 的原生 String 类型建立于* Unicode 标量*值之上。一个 Unicode 标量是一个为字符或者修饰符创建的独一无二的21位数字,比如 LATIN SMALL LETTER A (" a")的 U+0061 ,或者 FRONT-FACING BABYCHICK ( "🐥" )的 U+1F425 。
字符串字面量中的特殊字符
1.转义(escaped)特殊字符 \0 (空字符), \ (反斜杠), \t (水平制表符), \n (换行符), \r(回车符), " (双引号) 以及 ' (单引号);
2.任意的 Unicode 标量,写作 \u{n},里边的 n是一个 1-8 个与合法 Unicode 码位相等的16进制数字。
let wiseWords = "\"Imagination is more important than knowledge\" - Einstein"
// "Imagination is more important than knowledge" - Einstein
let dollarSign = "\u{24}" // $, Unicode scalar U+0024
let blackHeart = "\u{2665}" // ♥, Unicode scalar U+2665
let sparklingHeart = "\u{1F496}" // 💖, Unicode scalar U+1F496
扩展字形集群
每一个 Swift 的 Character类型实例都表示了单一的扩展字形集群。扩展字形集群是一个或者多个有序的 Unicode 标量(当组合起来时)产生的单个人类可读字符。
let eAcute: Character = "\u{E9}" // é
let combinedEAcute: Character = "\u{65}\u{301}" // e followed by ́
// eAcute is é, combinedEAcute is é
字符统计
使用字符串字符的count属性来统计字符串中的字符
let unusualMenagerie = "Koala 🐨, Snail 🐌, Penguin 🐧, Dromedary 🐪"
print("unusualMenagerie has\(unusualMenagerie.characters.count)characters")
// Prints "unusualMenagerie has 40 characters"
注意:Swift中的扩展字符群对字符的插入或者修改并不一定总是能影响字符的个数。
var word = "cafe"
print("the number of characters in \(word) is \(word.characters.count)")
// Prints "the number of characters in cafe is 4"
word += "\u{301}" // COMBINING ACUTE ACCENT, U+0301
print("the number of characters in \(word) is \(word.characters.count)")
// Prints "the number of characters in café is 4"
注意:扩展字形集群能够组合一个或者多个 Unicode 标量。这意味着不同的字符——以及相同字符的不同表示——能够获得不同大小的内存来储存。因此,Swift 中的字符并不会在字符串中获得相同的内存空间。所以说,字符串中字符的数量如果不遍历它的扩展字形集群边界的话,是不能被计算出来的。如果你在操作特殊的长字符串值,要注意 characters属性为了确定字符串中的字符要遍历整个字符串的 Unicode 标量。
通过 characters属性返回的字符统计并不会总是与包含相同字符的 NSString中 length属性相同。 NSString中的长度是基于在字符串的 UTF-16 表示中16位码元的数量来表示的,而不是字符串中 Unicode 扩展字形集群的数量。
访问和修改字符串
通过下标脚本语法或者它自身的属性和方法来访问和修改字符串。
字符串索引
每一个字符串都有关联的指数类型,string.Index,用来对应每一个字符所在的位置。
正如上述提到的,不同的字符会占据不同的内存。为了决定哪个字符在特殊的位置,你必须从 String的开头或结尾遍历每一个 Unicode 标量。因此,Swift 的字符串不能通过整数值索引。
使用 startIndex属性来访问 String中第一个 Character的位置。 endIndex属性就是 String中最后一个字符后的位置。所以说, endIndex属性并不是字符串下标脚本的合法实际参数。如果 String为空,则startIndex与 endIndex相等。
使用 index(before:) 和 index(after:) 方法来访问给定索引的前后。要访问给定索引更远的索引,你可以使用 index(_:offsetBy:) 方法而不是多次调用这两个方法。
你可以使用下标脚本语法来访问 String索引中的特定 Character。
let greeting = "Guten Tag!"
greeting[greeting.startIndex]// G
greeting[greeting.index(before: greeting.endIndex)]// !
greeting[greeting.index(after: greeting.startIndex)]// u
let index = greeting.index(greeting.startIndex, offsetBy: 7)
greeting[index]// a
超出字符串范围之外会报触发一个运行时的错误
greeting[greeting.endIndex] // error
greeting.index(after: endIndex) // error
使用indices属性可以访问字符串中每个单独的字符的索引
for index in greeting.characters.indices {
print("\(greeting[index]) ", terminator: "")
}
// Prints "G u t e n T a g ! "
任何类型只要遵循Indexable协议,字符串,同样包括集合类型
你可以使用startIndex 和endIndex属性以及index(before:),index(after:),index(_:offsetBy:)methods 这些方法。
插入及移除
1.insert(_:at:), insert(contentsOf:at:)method
var welcome = "hello"
welcome.insert("!", at: welcome.endIndex)
// welcome now equals "hello!"
welcome.insert(contentsOf:" there".characters, at: welcome.index(before: welcome.endIndex))
// welcome now equals "hello there!"
2.remove(at:) removeSubrange(_:)
welcome.remove(at: welcome.index(before: welcome.endIndex))
// welcome now equals "hello there"
let range = welcome.index(welcome.endIndex, offsetBy: -6)..<welcome.endIndex
welcome.removeSubrange(range)
// welcome now equals "hello"
字符串比较
1.使用 == 或者 !=
2.两个 String值(或者两个 Character值)如果它们的扩展字形集群是规范化相等,则被认为是相等的。如果扩展字形集群拥有相同的语言意义和外形,我们就说它规范化相等,就算它们实际上是由不同的 Unicode 标量组合而成。(感觉这部分偏少,未举例)
前缀后缀相等性
调用 hasPrefix(:) 和hasSuffic(:),返回Bool值
字符串的 Unicode 表示法
当一个 Unicode 字符串写入文本文档或者其他储存里边的时候,这个字符串的 Unicode 标量会被编码为一个或者一系列 Unicode 定义的编码格式。每一种格式都把字符串编码成所谓码元的小块。这些包括 UTF-8 编码格式(它把字符串以8 码元编码),UTF-16 编码格式(它把字符串按照 16位 码元 编码),以及 UTF-32 编码格式(它把字符串以32位码元编码)。
Swift 提供了几种不同的方法来访问字符串的 Unicode 表示。你可以使用 for-in语句来遍历整个字符串,来访以 Unicode 扩展字形集群的方式访问单独的 Character值。这个过程在操作字符章节有着详细的描述。
或者,你也可以用以下三者之一的其他 Unicode 兼容表示法来访问 String值:
UTF-8 码元的集合(关联于字符串的 utf8 属性)
UTF-16 码元的集合(关联于字符串的 utf16 属性)
21位 Unicode 标量值的集合,等同于字符串的 UTF-32 编码格式(关联于字符串的 unicodeScalars 属性)