Hello! 欢迎来到小浪云!


第三节:Bash编程易犯的错误


avatar
小浪云 2024-12-15 18

第三节:Bash编程易犯的错误

上一篇文章参见 第二节:bash编程易犯的错误。

24. for arg in $*

和大多数 Shell 一样,Bash 支持依次读取单个命令行参数的语法。不过这并是$*或者$@,这两种写法都不正确,它们只能得到完整的参数列表,并非单独的一个个参数。

正确的语法是(没错要加上引号):

 for arg in "$@" 

# 或者更简单的写法

 for arg 

在脚本中遍历所有参数是一个再普遍不过的需求,所以 for arg 默认等价于 for arg in “$@”。$@使用双引号后就有特殊的魔力,每个参数展开后成为一个独立的单词。(”$@”等价于”$1” “$2” “$3” …)

下面是一个错误的例子:

 for x in $*; do    echo "parameter: '$x'" done  执行的结果为:  $ ./myscript 'arg 1' arg2 arg3 parameter: 'arg' parameter: '1' parameter: 'arg2' parameter: 'arg3' 

正确的写法:

 for x in "$@"; do    echo "parameter: '$x'" done  执行的结果为:  $ ./myscript 'arg 1' arg2 arg3 parameter: 'arg 1' parameter: 'arg2' parameter: 'arg3' 

上面正确的例子中,第一个参数’arg 1’在展开后依然是一个独立的单词,而不会被拆分成两个。

25. function foo()

这种写法不一定能够兼容所有 shell,兼容的写法是:

 foo() {   ... } 

26. echo “~”

波浪号展开(Tilde expansion)仅当~没有引号的时候发生,在上面的例子中,只会向标准输出打印~符号,而不是当前用户的家目录路径。

当用引号将路径参数引起来时,如果要用引号将相对于家目录的路径引起来时,推荐使用 $HOME 而不是 ~, 假如 $HOME 目录是”/home/my photos”,路径中包含空格。

下面是几组例子:

 "~/dir with spaces" # expands to "~/dir with spaces" ~"/dir with spaces" # expands to "~/dir with spaces" ~/"dir with spaces" # expands to "/home/my photos/dir with spaces" "$HOME/dir with spaces" # expands to "/home/my photos/dir with spaces" 

27. local varname=$(command)

当在函数中声明局部变量时,local作为一个独立的命令,这种奇特的行为有时候可能会导致困扰。比如,当你想要捕获命令替换的返回码时,你就不能这样做。local命令的返回码会覆盖它。

这种情况下,你只能分成两行写:

 local varname varname=$(command) rc=$? 

28. export foo=~/bar

export 与 local 命令一样,并不是赋值语句的一部分。因此,在有些 Shell 下(比如Bash),export foo=~/bar会展开,但是有些(比如 dash)却不行。

下面是两种比较健壮的写法:

 foo=~/bar; export foo    # Right! export foo="$HOME/bar"   # Right! 

29. sed ‘s/$foo/good bye/’

单引号内部不会展开 $foo变量,在这里可以换成双引号:

 foo="hello"; sed "s/$foo/good bye/" 

但是要注意,如果你使用了双引号,就需要考虑更多转义的事情,具体可以看Quotes这一页。.

30. tr [A-Z] [a-z]

这里至少有三个问题。第一个问题是, [A-Z] 和 [a-z] 会被 shell 认为是通配符。如果在当前目录下没用文件名为单个字母的文件,这个命令似乎能正确执行,否则会错误地执行,也许你会在周末耗费许多小时来修复这个问题。

第二个问题是,这不是 tr 命令正确的写法,实际上,上面的命令会把[转换成[,将任意大写字符转换成对应的小写字符,将]转换成],所以你根本不需要加上括号,这样第一个问题就可以解决了。

第三个问题是,上面的命令执行结果依赖于当前的 locale,A-Z 或者 a-z 不一定会代表26个 ASCII 字母。实际上,在一些语言环境下,z 位于字母表的中间位置。这个问题的解法,取决于你希望发生的行为是哪一种。

如果你仅希望改变26个英文字母的大小写(强制 locale为 C):

 LC_COLLATE=C tr A-Z a-z  如果你希望根据实际的语言环境来转换:  tr '[:upper:]' '[:lower:]' 

31. ps ax | grep gedit

这里的根本问题是正在运行的进程名称,本质上是不可靠的。可能会有多个合法的gedit进程,也有可能是别的东西伪装成gedit进程(改变执行命令名称是一件简单的事情 ),更多细节可以看ProcessManagement这一篇文章。

执行以上命令,往往会在结果中包含 grep 进程:

 # ps ax | grep gedit 10530 ?        S      6:23 gedit 32118 pts/0    R+     0:00 grep gedit  这个时候,需要过滤多余的结果:  # ps ax | grep -v grep | grep gedit  上面的写法比较丑陋,另外一种方法是:  # ps ax | grep [g]edit 

32. printf “$foo”

如果$foo 变量的值中包括或者%符号,上面命令的执行结果可能会出乎你的意料之外。

下面是正确的写法:

 printf %s "$foo" printf '%s ' "$foo" 

33. for i in {1..$n}

Bash的命令解释器会优先展开大括号,所以这时大括号{}表达式里面看到的是文字上的$n(没有展开)。$n 不是一个数值,所以这里的大括号{}并不会展开成数字列表。可见,这导致很难使用大括号来展开大小只能在运行时才知道的列表。

可以用下面的方法:

 for ((i=1; i< =n; i++)); do ... done 

注:之前我也有写过一篇文章来介绍这个问题:Shell生成数字序列。

34. if [[ $foo = $bar ]]

在[[内部,当=号右边的值没有用引号引起来,bash 会将它当作模式来匹配,而不是一个简单的字符串。所以,在上面的例子中 ,如果 bar 的值是一个*号,执行的结果永远是 true。

所以,如果你想检查两侧的字符串是否相同,等号右侧的值一定要用引号引起来。

 if [[ $foo = "$bar" ]] 

如果你确实要执行模式匹配,聪明的做法是取一个更加有意义的变量名(例如$patt),或者加上注释说明。

35. if [[ $foo =~ ‘some RE’ ]]

同上,如果=~号右侧的值加上引号,它会散失特殊的正则表达式含义,而变成一个普通的字符串。

如果你想使用一个长的或者复杂的正则表达式,避免大量的反斜杠转义,建议把它放在一个变量中:

 re='some RE' if [[ $foo =~ $re ]] 

由于篇幅限制,本系列文章会分成多篇文章,最后一篇参见 第四节:Bash编程易犯的错误。

相关阅读