接受命令行参数
让我们像往常一样,使用 cargo new
创建一个新项目。我们将项目命名为 minigrep
,以区别于您系统上可能已有的 grep
工具。
$ cargo new minigrep
Created binary (application) `minigrep` project
$ cd minigrep
首要任务是使 minigrep
接受它的两个命令行参数:文件路径和要搜索的字符串。也就是说,我们希望能够使用 cargo run
运行我们的程序,使用两个连字符来指示以下参数是给我们的程序而不是给 cargo
的,然后是要搜索的字符串,以及要搜索的文件路径,就像这样
$ cargo run -- searchstring example-filename.txt
目前,cargo new
生成的程序无法处理我们给它的参数。 crates.io 上的一些现有库可以帮助编写接受命令行参数的程序,但因为您只是在学习这个概念,所以让我们自己实现这个功能。
读取参数值
为了使 minigrep
能够读取我们传递给它的命令行参数的值,我们需要 Rust 标准库中提供的 std::env::args
函数。此函数返回传递给 minigrep
的命令行参数的迭代器。我们将在第 13 章中全面介绍迭代器。。现在,您只需要了解关于迭代器的两个细节:迭代器产生一系列值,并且我们可以在迭代器上调用 collect
方法,将其转换为一个集合,例如一个 vector,其中包含迭代器产生的所有元素。
列表 12-1 中的代码允许您的 minigrep
程序读取传递给它的任何命令行参数,然后将这些值收集到一个 vector 中。
use std::env; fn main() { let args: Vec<String> = env::args().collect(); dbg!(args); }
首先,我们使用 use
语句将 std::env
模块引入作用域,以便我们可以使用它的 args
函数。请注意,std::env::args
函数嵌套在两个模块级别中。正如我们在第 7 章中讨论的那样,在所需函数嵌套在多个模块中的情况下,我们选择将父模块引入作用域,而不是函数本身。这样做,我们可以轻松地使用 std::env
中的其他函数。这也比添加 use std::env::args
然后仅使用 args
调用函数更清晰,因为 args
很容易被误认为是当前模块中定义的函数。
args
函数和无效 Unicode
请注意,如果任何参数包含无效的 Unicode,std::env::args
将会 panic。如果您的程序需要接受包含无效 Unicode 的参数,请改用 std::env::args_os
。该函数返回一个迭代器,该迭代器生成 OsString
值而不是 String
值。我们选择在此处使用 std::env::args
是为了简单起见,因为 OsString
值因平台而异,并且比 String
值更难处理。
在 main
函数的第一行,我们调用 env::args
,并立即使用 collect
将迭代器转换为一个 vector,其中包含迭代器产生的所有值。我们可以使用 collect
函数创建多种类型的集合,因此我们显式地注释 args
的类型,以指定我们想要一个字符串 vector。虽然在 Rust 中您很少需要注释类型,但 collect
是您经常需要注释的函数之一,因为 Rust 无法推断您想要的集合类型。
最后,我们使用 debug 宏打印 vector。 让我们尝试首先不带参数运行代码,然后再带两个参数运行
$ cargo run
Compiling minigrep v0.1.0 (file:///projects/minigrep)
Finished `dev` profile [unoptimized + debuginfo] target(s) in 0.61s
Running `target/debug/minigrep`
[src/main.rs:5:5] args = [
"target/debug/minigrep",
]
$ cargo run -- needle haystack
Compiling minigrep v0.1.0 (file:///projects/minigrep)
Finished `dev` profile [unoptimized + debuginfo] target(s) in 1.57s
Running `target/debug/minigrep needle haystack`
[src/main.rs:5:5] args = [
"target/debug/minigrep",
"needle",
"haystack",
]
请注意,vector 中的第一个值是 "target/debug/minigrep"
,这是我们二进制文件的名称。这与 C 语言中参数列表的行为相匹配,允许程序使用它们在执行中被调用的名称。在您想在消息中打印程序名称或根据用于调用程序的命令行别名更改程序的行为时,访问程序名称通常很方便。但出于本章的目的,我们将忽略它,只保存我们需要的两个参数。
将参数值保存在变量中
程序目前能够访问指定为命令行参数的值。现在我们需要将这两个参数的值保存在变量中,以便我们可以在程序的其余部分使用这些值。我们在列表 12-2 中这样做。
use std::env;
fn main() {
let args: Vec<String> = env::args().collect();
let query = &args[1];
let file_path = &args[2];
println!("Searching for {query}");
println!("In file {file_path}");
}
正如我们在打印 vector 时看到的那样,程序的名称占据了 vector 中索引为 args[0]
的第一个值,所以我们从索引 1 开始处理参数。minigrep
接受的第一个参数是我们要搜索的字符串,因此我们将对第一个参数的引用放入变量 query
中。第二个参数将是文件路径,因此我们将对第二个参数的引用放入变量 file_path
中。
我们暂时打印这些变量的值,以证明代码正如我们预期的那样工作。 让我们再次使用参数 test
和 sample.txt
运行此程序
$ cargo run -- test sample.txt
Compiling minigrep v0.1.0 (file:///projects/minigrep)
Finished `dev` profile [unoptimized + debuginfo] target(s) in 0.0s
Running `target/debug/minigrep test sample.txt`
Searching for test
In file sample.txt
太棒了,程序正在工作! 我们需要的参数值已保存到正确的变量中。 稍后我们将添加一些错误处理来处理某些潜在的错误情况,例如当用户未提供任何参数时; 目前,我们将忽略这种情况,转而添加文件读取功能。