rust入门
后端
简介
rust 可以编写安全且高效的软件;
使用场景:
- 需要运行时速度
- 需要保证内存安全
- 需要充分利用多处理器
与其他语言的比较:
- c/c++拥有较高的性能,存在内存安全问题;
- java/c# 通过GC来处理内存安全问题,但是性能差;
擅长领域;
- 高性能web service
- WebAssembly
- 命令行
- 网络编程
- 嵌入式设备
通用概念
变量与可变性
变量
使用 let
声明变量。变量右边通过 :
连接类型;
编译器可以根据使用情况推断类型时可以省略类型;
变量使用前必须初始化;
变量默认不可变,在 let
后面 加 mut
关键字声明可变。
上面代码编译会报错:
声明可变:
可以声明一个与第一个同名的变量,此时第一个变量被第二个变量遮蔽,使用的是第二个变量。
常量
通过 const
关键字声明,必须标明类型;
永远不可变,不可以使用 mut
关键字;
必须初始化,初始值必须是常量或常量表达式,不能是函数或运行时确定的值;
常量可以声明在任何作用域,变量不能声明在全局作用域;
变量可以被遮蔽,常量不能被遮蔽,即不能有相同的常量名;
常量命名规范,使用大写字母和下划线;
数据类型
标量类型
整数类型
有符号的以 i
开头,无符号的以 u
开头;
长度 | 有符号 | 无符号 |
---|---|---|
8bit | i8 | u8 |
16bit | i16 | u16 |
32bit | i32 | u32 |
64bit | i64 | u64 |
128bit | i128 | u128 |
word | isize | usize |
word 表示机器字长,64位机器64bit,32位机器32bit 整数字面值
字面值 | 示例 |
---|---|
十进制 | 76_87 |
十六进制 | 0xef |
二进制 | 0b100101 |
字节 | b’A’ |
除了字节外,其他的后面都可以跟类型 整数溢出
在调试模式下,编译期遇到整数溢出,会报错;
在发布模式下,编译期遇到整数溢出,会发生“环绕”:如果值设置为MAX+i,则会变成MIN+i;
浮点类型
f32
32位,单精度;
f64
64位,双精度;
布尔类型
bool
,一个字节
字符类型
char
,4个字节,存储 Unicode
复合类型
元组
元组可以将多种类型的多个值放在一个类型里;
元组长度固定,每个成员的类型固定;
可以通过模式匹配解构元组;
可以通过点标记法和索引号访问元组成员;
数组
数组元素类型必须相同;
数组长度固定;
数组得声明方式如下:
输出:
数组通过索引访问元素,超过范围会抛异常;
函数
函数由 fn
关键字、函数名、参数及其类型、返回值类型组成的函数签名定义。
函数没有返回值,则不声明返回值
函数可以声明在函数内,内部函数只能在外部函数内使用
函数返回值,有两种方式:
- 使用
return
语句; - 返回最后执行的计算表达式结果;
语句
执行操作而不返回值,表达式
计算并产生一个值;表达式末尾加 ;
转换成语句。
流程控制
流程控制结构
if
结构loop
循环while
循环for
..in
迭代
这些结构都是表达式,if
和 loop
可以指定返回值
if
结构
if
结构可以有返回值,赋值给其他变量;需要遵循一定原则:
- 分支最后一行代码必须是表达式,结尾不能有分号;
- 每个分支的返回值类型相同;
- 必须要有
else
分支。
loop
循环
loop
循环中,break
可以指定返回值,所以 loop
可以赋值给变量,其他循环不具备这个特性;
label
标签
可以为 loop
、while
、for
指定标签,在 break
、continue
语句中指定标签来确定要跳出哪一层循环。
所有权
其他语言管理内存的是程序员手动管理或者通过垃圾收集机制在运行时不断寻找不再使用得内存;
rust
通过所有权系统管理内存,在编译时检查内存使用规则,运行时不会增加额外得开销。
stack 与heap
stack 压入数据比heap上分配快:
- stack中压入数据始终在栈顶
- heap分配首先需要寻找足够的空间,还要进行记录使用情况;
heap中的数据访问比stack访问慢得多:
- heap中的数据需要通过stack中得指针,再寻址到heap中得数据;
- heap中数据存放比较分散;
所有权规则
- 每个值都会绑定到一个变量,该变量是该值的所有者;
- 每个值只能有一个所有者;
- 当所有者超出作用域时,对应的值会被释放;
移动(move) stack上分配的数据,在变量赋值给另一个变量时,会复制一份副本; heap上分配的数据,在变量赋值给另一个变量时,会发生所有权的移动,源变量会失效;
a赋值给b时,复制了一份副本,所以a,b都有效;x赋值给y时,发生了移动,只有y绑定到String,x失效,所以报错;离开作用域时,x失效了,不会有释放对应内存的操作,y对应的heap数据会被释放, 函数的传参和返回值,跟变量赋值遵循一样的规则发生复制和移动。
引用和借用
在函数传参时,heap数据会发生移动,主调函数在调用后还想使用该数据的话,就需要在被调函数结束时返回所有权,这种情况可以向被调函数传递引用,而不获得所有权,从而避免归还所有权的操作。通过引用传参的形式称为借用。
通过 &
取得a的引用传递给函数ln a变量的所有权没有发生转移,输出如下
引用默认不可变,如果需要在函数ln中修改a对应的数据,需要传入可变引用;
通过添加mut关键字创建可变引用,输出如下:
对引用的一些限制:
- 同一个作用域,不能存在多个可变引用;
- 同一个作用域,不能存在可变引用和不可变引用;
- 同一个作用域,可以存在多个都是不可变的引用;
切片
切片就是指向某个数据中一部分内容的引用;
结构体(struct)
定义
用 struct
关键字定义结构体
struct实例默认不可变,所有字段也是不可变的;
如果用 mut
将struct实例变成可变的,则所有的字段也变成可变的;
如果赋值给字段的变量名和字段名一样,可以简写;
可以通过更新语法,用同类型的一个实例初始化另一个实例的部分字段;
元组结构体
想给元组起名,不同于其他元组,或者不关注结构体中字段名,可以用元组结构体;
结构体方法
结构体方法和函数类似,不同之处在于:
- 方法在结构体上下文
impl
快中定义; - 第一个参数是self,表示调用的结构体实例,它可以是变量、引用、可变引用;
输出
关联函数
定义在 impl
块里面,但是不把self作为第一个参数;
方法和关联函数都可以定义在不同的 impl
块中,输出:
枚举
枚举用 enum
关键字定义
枚举值可以绑定数据,枚举也可以定义方法
在 java 语言中,变量有可能是空值,很容易产生空指针异常,rust中,要求每个变量都要有值,并且提供 Option 枚举来处理空值的情况,明确表示有可能为空值的情况。
模式匹配
模式匹配,允许一个值与多个模式匹配,并执行匹配的模式对应得代码;
通过 match
关键字进行模式匹配时,需要穷举所有可能;
可以用下划线代替余下的所有可能,放在最后;
如果只关注其中一种情况,可以使用 if let
;
代码组织
rust的模块系统
- Package(包),cargo特性,包含多个单元包
- Crate(单元包),可以生成一个libary或可执行文件
- Module(模块),组织和控制代码的作用域
- Path(路径),结构体、函数、模块等的命令方式
单元包
cargo 是rust 的包管理系统,遵循如下惯例:
可以有一个libary crate 对应 src/lib.rs,名字与package 名字相同。
可以有多个binary crate ,默认的对应src/main.rs,名字与package 名字相同;其余的在src/bin目录下,每个文件对应一个crate;
模块
一个crate内,通过模块将代码分组,增加可读性和复用性,控制代码的私有性,可以嵌套。
src/lib.rs 文件内容:
模块中代码默认私有,使用 pub
关键字公开;
子模块可以访问父模块的私有代码,父模块无法访问子模块私有代码。
src/main.rs 文件内容:
src/lib.rs 对应的crate 名字和项目包名相同,引用时以crate开始,::
分割形成路径;
同一个包中,crate名可以省略;
可以用 use
关键字 导入命名空间,在多次引用同一个模块代码时,避免重复写前缀。
集合
Vector
Vec,叫做Vector
- 可以存储多个值
- 连续存储在堆上
- 只能存储相同类型的值
String
String是Byte 集合
HashMap
错误处理
错误包括:
- 可恢复的错误,Result
- 不可恢复的错误,panic!宏
不可恢复的错误panic发生时:
- 打印错误信息
- 展开、清理调用栈
- 退出程序
为了减小panic时的工作量和执行文件的大小,可以设置程序直接终止而不清理调用栈,留给OS清理,可以在 cargo.toml
中设置:
panic=“abort” 可恢复错误Result
- 成功时返回 Ok
- 失败返回Err
?
表达式,如果返回的是Ok,则将Ok中的数据赋值给变量,如果是Err则当前函数返回Err,需要当前函数声明为返回Result类型。
Result.unwrap(),当Ok时,返回Ok中的数据,当Err时panic。
泛型
函数中得泛型
结构体和枚举中的泛型
如 Option<T>
方法中的泛型
trait
trait定义抽象的行为;
生命周期
下面代码中变量的x从第2行到第9行有效,变量y从第4行到第7行有效,第6行打印x没有问题,但是第8行会报错,因为第5行x指向了y的引用,第6行y有效,第7行以后y就失效了,x变成了垂悬引用,这是不允许的。
在函数内部编译器可以分析变量的生命周期,针对函数返回的引用,可以用生命周期标注 避免垂悬引用。
如果函数返回得是有所有权的变量,则无需生命周期标注; 返回的是引用,则需要用生命周期标注,约束返回值的生命周期要小于s1和s2的声明周期交集。
测试
单元测试,给函数添加 #[test]
标注,就将其声明为测试函数
cargo test 可以运行单元测试
可以用 assert!
、assert_eq!
、assert_ne!
宏进行断言。
可以用 #[should_panic]
声明测试函数预期应该panic。
可以将测试函数放到模块中,用 #[cfg(test)]
标注该模块是测试模块,只在测试时进行编译。
函数式语言特性
闭包
闭包,是可以捕获其所在环境的匿名函数。
闭包:
- 是匿名函数
- 可以保存为变量,作为参数
- 可以从定义它的作用域捕获值
示例中,sq为一个闭包,传入i32返回i32
闭包参数和返回值的类型可以由编译器推断出来,此时可以省略类型。
构建发布
cargo 中发布有两个配置:
- dev 用于开发构建,
cargo build
- release用于生产环境,
cargo build --release
可以在cargo的配置文件 cargo.toml
覆盖默认的配置:
rust 代码中用 ///
开始文档注释,支持markdown,可以通过 cargo doc
在 target/doc
生成html 文档;
使用 cargo test
命令时,可以对文档中得示例代码执行测试。
发布包到 cartes.io
,需要先在 cartes.io
网站注册用户,获得token,然后执行命令;
发布之后,可以用 cargo yank --vers 1.1.0 --undo
撤销发布,使得已经依赖此包的项目可用,新项目不可以下载此包。
智能指针
智能指针通常是struct,并且实现了Deref Trait 和 Drop Trait;Deref Trait 使智能指针可以像引用一样解引用,Drop Trait 允许智能指针走出作用域时执行自定义的代码。
Box<T>
智能指针:
- 将数据存储在Heap上 Rc引用计数智能指针,使一份数据可以被多个所有者持有;在没有所有者持有时,自动清理内存;所有者持有的是不可变引用。
通常的借用规则在编译期进行检查,rust 提供了 RefCell<T>
智能指针,延迟到了运行时检查借用规则。
借用规则:一份数据,在一个作用域,要么只能拥有一个可变引用,要么多个不可变引用。 不同时期检查借用规则的比较:
编译期 | 运行期 |
---|---|
没有运行时开销 | 借用计数,产生性能损耗 |
rust默认行为,严格保守 | 特定场景,灵活 |
并发
创建线程,可以通过 std::thread::spawn()
函数,传入闭包创建并运行线程,返回 JoinHandle
,通过JoinHandle.join()阻塞主调线程,等待持有的线程运行完成,再继续主调线程。
当在子线程中使用主线程的数据时,子线程的生命周期可能比数据的生命周期更长,所以要用move 闭包将数据的所有权转移到子线程内,此时主线程中的变量就失效了。
线程间传递数据
rust中通过Channel 来进行线程中得消息传递,Channel 包含多个发送端、一个接收端,其中一端关闭Channel就关闭。
mpsc::channel()
创建管道,返回发送端和接收端;
发送端的send()方法发送数据,返回Result,如果接收端关闭就会返回错误,该方法会转移参数的所有权;
接收端的recv() 方法阻塞当前线程直到有数据传过来返回Result,如果发送端关闭就会返回错误。
接收端的try_recv()方法不会阻塞当前线程,有数据就返回Ok包裹的数据,否则返回错误。
线程间共享状态
Rust中通过 Mutex
保证多线程对共享数据的互斥访问, Mutex.lock()
阻塞当前线程直到获得锁。
例子中,有多个线程需要获得共享数据的所有权,所有就需要多重所有权的智能指针 Arc
,其API和 Rc
一样,不同的是 Arc
是线程安全的。
面向对象特性
泛型中Trait约束,编译器会进行单态化,限定为具体的类型,用 Trait
对象可以存储不同类型的对象。
高级特性
关联类型
关联类型,在Trait 中使用类型占位符,由实现者去确定具体的类型。
与泛型不同的是,在一个实现者中,泛型可以实现多次,而关联类型只能实现一次。
运算符重载
std::ops
下面定义的运算符,可以被重载,只要实现对应得Trait。
泛型默认值
泛型可以指定默认值,见 std::ops::Add
源码,Rhs 默认为Self