简介
- 接上回
- 了解Rust 字符串首先要区分两个概念,一个是字符串字面值,另外一个是字符串本身,这个在参数传递时是有用的防止弄错。
- Rust 选择将正确处理String 数据作为所有Rust 程序的默认行为,可以防止在开发后期粗粒涉及非ASCII字符的错误。
字符串是什么
- Rust 的核心语言层面只有一个字符串类型,也就是字符串切片 str (或者 &str)
- 字符串切片,对存储在其他地方、UTF-8编码的字符串的引用,字符串字面值,存储在二进制文件中,也是字符串切片。
- String 类型来自标准库,它不是Rust 的核心语言,它是可增长、可修改、可拥有所有权的同样使用UTF-8编码。
- String 实际上是对Vec<u8>的包装。
- 其他字符串类型,Rust 的标准库中还包含其他很多字符串类型,例如:OsString、OsStr、CString、CStr。
- 创建一个新的字符串(String)举例:
fn main() {
let data1 = String::from("Hello");
let data2 = "world.".to_string();
println!("Say: {} {}", data1,data2);
}
String 的常用函数
-
push_str()
把一个字符串切片,附加到String 注意这个是字符串切片的方法 -
push()
把,单个字符附加到String (例子)
fn main() {
// 注意使用 push 或者 push_str 的时候需要将变量声明为 mut
let mut data = String::from("LinHai");
data.push_str(" is stronger");
data.push('!');
// Output: Word: LinHai is stronger!
println!("Word: {}", data);
}
-
+
运算符,链接字符串,需要注意的是,+
运算符左侧是字符串的所有权,右侧是字符串切片。 - 看如下的代码测试,及测试结果:
fn main() {
let data1 = String::from("Hello");
let data2 = "world.".to_string();
let data3 = data1 + " " + &data2;
// 需要注意,因为data1被借用了,所以被注释的行编译时会报错。
// println!("data2 value is : {}", data1); // value borrowed here after move
println!("data3 value is : {}", data3);
}
- String 实际上是对 Vec<u8> 的包装,所以可以通过 len() 方法测量长度,但是注意Len() 获取方式不是按字符的,所以中文的“林海很强壮!”返回的长度是16,为什么是16,因为一个中文占3个字符,最后的!占一个字符,所以:
16=5*3+1
fn main() {
// 注意使用 push 或者 push_str 的时候需要将变量声明为 mut
let mut data = String::from("林海");
data.push_str("很强壮");
data.push('!');
// Output ~ Word: 林海很强壮! Len: 16
println!("Word: {} Len: {}", data, data.len());
}
按索引方式访问
- Rust 是不支持索引类型表示字符串的,主要的原因是为了字符串边界安全,
切割String
- 切割是允许的,但是必须沿着字符的边界进行切割,可以使用[]和一个范围来创建字符串的切片,使用时需要谨慎,因为切割如果跨越了字符边界程序就会
panic
- 另外需要切割需要对字符串的字面值做操作,不是所有权。
- 看看这个例子,必须沿着边界,每个中文站3个字符所以,切割
[0..6]
,切[0..4]
、[0..5]
肯定会报错,可以自己试试,当然!
是英文叹号,占一个字符,要切这个值可以&data[15..16]
,或者let selstr = &data[data.len()-1..data.len()];
:
fn main() {
// 注意使用 push 或者 push_str 的时候需要将变量声明为 mut
let mut data = String::from("林海");
data.push_str("很强壮");
data.push('!');
let selstr = &data[0..6];
// Output ~ Select cut word: 林海, Len: 6
println!("Select cut word: {}, Len: {}", selstr, selstr.len());
}
遍历String
首先需要了解Rust 看待字符串有三种方式,字节、标量值、字形簇(最接近字母)
所有对于字符串的遍历也就存在对
字节bytes()
、对标量值chars()
、对字形簇
三种方式进行遍历。字节方式遍历字符串举例:
fn main() {
// 注意使用 push 或者 push_str 的时候需要将变量声明为 mut
let mut data = String::from("林海");
data.push_str("很强壮");
data.push('!');
for i in data.bytes() {
println!("byte : {}", i);
}
}
- Unicode 标量值方式遍历举例,输出的时候我故意输出了字符的字节占用数,这样可以看到len() 方法是如何计算字符串长度的:
fn main() {
// 注意使用 push 或者 push_str 的时候需要将变量声明为 mut
let mut data = String::from("林海");
data.push_str("很强壮");
data.push('!');
for i in data.chars() {
// 输出是故意输出字符的占用字节数len_utf8
println!("byte : {}, Len : {}", i, i.len_utf8());
}
}
- 字形簇,看了一会觉得还是比较恶心的,比较复杂,稍后举例
# 举例空缺中
结束
- 通过字符串的学习可以了解Rust 语言设计的特点,效率+安全。
- 感谢阅读。