awk 命令
文章目录
格式
- awk -F ‘分隔符正则’ -v 变量名=值 ‘BEGIN{动作} 条件{动作} END{动作}’ 文件1 文件2 …
- awk -F ‘分隔符正则’ -f awk脚本文件名 文件1 文件2 …
常用内置变量
变量 | 说明 |
---|---|
$0 | 当前记录 |
$1~$n | 当前记录的第n个字段,字段间由FS分隔 |
FS | 输入字段分隔符 默认是空格 |
NF | 当前记录中的字段个数,就是有多少列 |
NR | awk 开始执行程序后所读取的数据行数,就是行号,从1开始 |
RS | 输入的记录他隔符默 认为换行符 |
OFS | 输出字段分隔符 默认也是空格 |
ORS | 输出的记录分隔符,默认为换行符 |
FNR | 当前记录数,awk每打开一个新文件,FNR便从0重新累计 |
ARGC | 命令行参数个数 |
ARGV | 命令行参数字典,ARGV[0] 是 ‘awk’,ARGV[1] 是 FILENAME |
FILENAME | 当前输入文件的名字 |
IGNORECASE | 如果为真,则进行忽略大小写的匹配 |
ENVIRON | UNIX环境变量,如 ENVIRON[“PATH”] |
FIELDWIDTHS | 输入字段宽度的空白分隔字符串 |
OFMT | 数字的输出格式(默认值是%.6g) |
RSTART | 被 match 匹配函数匹配的字符串位置 |
RLENGTH | 被 match 匹配函数匹配的字符串长度 |
函数
常用内置函数
函数 | 说明 |
---|---|
int(x) | 返回 x 的整数部分 |
rand() | 返回 0 到 1 之间的浮点数 |
gsub(Ere, “dest”, str) | 把 str 中匹配扩展正则 Ere 的全部子串换成字符串 “dest” |
sub(Ere, “dest”, str) | 把 str 中匹配扩展正则 Ere 的第一个子串换成字符串 “dest” |
substr(str, start, len) | 返回 str 中从 start 开始(长度为 len )的子串 |
index(str1, str2) | 返回 str1 中出现 str2 的位置,如果未找到,返回 0 |
length(str) | 返回 str 的字符个数,如果未指定 str,返回 $0 包含字符个数 |
blength(str) | 返回 str 的字节个数,如果未指定 str,返回 $0 包含字节个数 |
match(str, Ere) | 返回 str 中匹配扩展正则 Ere 的位置,如果未找到,返回 0 |
split(str, arr, Ere) | 把 str 按照扩展正则 Ere 切分成字典,存储到 arr 中,返回字典长度 |
tolower(str) | 把 str 换成小写 |
toupper(str) | 把 str 换成大写 |
sprintf("%s-%d", “abcd”, 1234) | 返回 abcd-1234 |
strtonum(str) | 返回十进制数字 |
delete arr[n] | 删除字典/字典的对应元素 |
getline | 读入当前行的下一行,重写变量 0 |
next | 停止处理当前记录,开始处理下一行 |
nextfile | 停止处理当前文件,开始处理下一个文件 |
system(shell-command) | 返回命令退出状态 |
exit n | 终止 awk,返回 n |
自定义函数
- 格式
1 2 3 4
function fun_name(arg1, arg2, ...){ #函数体 return }
判断语句
- if
1 2 3 4 5 6 7
if(条件){ # 语句 }else if(条件){ # 语句 }else{ # 语句 }
循环语句
- for
1 2 3 4 5 6
for(初始化;条件;变化){ # 语句 } for(变量 in 字典){ # 语句 }
- while
1 2 3
while(条件){ # 语句 }
- do while
1 2 3
do{ # 语句 }while(条件)
- break 退出当前循环体
- continue 退出本次循环,继续下一次循环
脚本
|
|
其他说明
- 变量在使用时直接赋值即可,无需提前声明或定义
- 个人认为,awk 没有数组只有字典,数组是键为整数的字典
- 运算符(+, -, *, /, ++, – 等)和关系符操作(>, >=, <, <=, ~, !~ 等)与 C 基本一致,也支持三目运算符(条件?值1:值2)
- shell 中 awk 执行显式命令时,加载 shell 中的变量
1 2 3 4
#!/bin/bash shell_value='abcd' echo | awk '{print "'$shell_value'"}' # 输出 abcd
参考
- man awk
- 其他内置函数
- gnu awk 手册
文章作者 Colben
上次更新 2019-10-30