sort
sort 命令
先介绍下-d 参数忽略一些特殊字符,比如说%
-f参数忽略大小写
-u忽略重复行
cat test.txt
ORANGE
Persimmon
apple
apple
%%banana
banana
orange
先看下-u参数
sort -u test.txt
apple
banana
%%banana
orange
ORANGE
Persimmon
可以看见apple已经忽略
在来看下加了-f选项的,忽略大小
sort -u -f test.txt
apple
banana
%%banana
ORANGE
Persimmon
可以看见orange和ORANGE已经去除其中一个
在来看下-d选项,
sort -u -f -d test.txt
apple
%%banana
ORANGE
Persimmon
可以看见%%banana和banana已经去除一个了
在来看下按照某个字段的排序
[root@secode-test ~]# sort -t: +1 test.txt
carrots:104
yams:104
lettuce:15
potatoes:15
green beans:32
radishes:5
turnips:8
[root@secode-test ~]# sort -t: +1 -n test.txt
radishes:5
turnips:8
lettuce:15
potatoes:15
green beans:32
carrots:104
yams:104
此命令序列对第二字段(+1 -2 -n)进行数字排序。在这个顺序中,它以逆字母顺序(+0 -1 -r)对第一字段排序
[root@secode-test ~]# sort -t: +1 -2 -n +0 -1 -r test.txt
yams:104
carrots:104
green beans:32
potatoes:15
lettuce:15
turnips:8
radishes:5
要使用排序的文本替换原始文件,请输入:
sort -o
注:在任何排序关键字定义前出现的 -b、-d、-f、-i、-n 或 -r 标志应用于所有排序关键字。-b、-d、-f、-i、-n 或 -r 标志都不能单独出现在 -k KeyDefinition 之后;如果它们作为修饰符连接 KeyDefinition 变量,那么就只应用于连接排序关键字。如果这些标志之一跟随在 +Fskip.Cskip 或 -Fskip.Cskip 排序关键字定义后,那么该标志只能用于此排序关键字。
-A 使用 ASCII 整理顺序代替当前语言环境的整理顺序在逐字节的基础上排序。
-b 忽略前导空格和制表符,找出字段的第一或最后列。
-c 检查输入是否已按照标志中指定的排序规则进行排序。如果输入文件排序不正确,就返回一个非零值。
-d 使用字典顺序排序。比较中仅考虑字母、数字和空格。
-f 比较前将所有小写字母改成大写字母。
-i 比较中忽略所有非打印字符。
-k KeyDefinition 指定排序关键字。KeyDefinition 选项的格式为:
[ FStart [ .CStart ] ] [ Modifier ] [ , [ FEnd [ .CEnd ] ][ Modifier ] ]
排序关键字包括所有以 FStart 变量指定的字段和 CStart 变量指定的列开头的字符及以 FEnd 变量指定的字段和 CEnd 变量指定的列结束的字符。Modifier 变量的值可以是 b、d、f、i、n 或 r。 修饰符与同一字母的标志等价。
-m 只合并多个输入文件;假设输入文件已经排序。
-n 按算术值对数字字段排序。数字字段可包含前导空格、可选减号、十进制数字、千分位分隔符和可选基数符。对包含任何非数字字符的字段进行数字排序会出现无法预知的结果。
-o OutFile 将输出指向 OutFile 参数指定的文件,而不是标准输出。OutFile 参数值可以与 File 参数值相同。
-r 颠倒指定排序的顺序。
-t Character 指定 Character 为单一的字段分隔符。
-u 禁止按照排序关键字和选项的所有等同排序(每一组行中一行除外)。
-T Directory 将创建的所有临时文件放入 Directory 参数指定的目录中。
-y[Kilobytes] 用 Kilobytes 参数指定的主存储的千字节数启动 sort 命令,并根据需要增加存储量。(如果 Kilobytes 参数指定的值小于最小存储站点或大于最大存储站点,就以这个最小存储站点或最大存储站点取代)。如果省略 -y 标志,sort 命令以缺省的存储大小启动。-y0 标志用最小存储启动,而 -y 标志(不带 Kilobytes 值)用最大存储启动。sort 命令使用的存储量显著地影响性能。以大存储量对小文件排序将很浪费。
-z RecordSize 如果正在排序的任一行大于缺省的缓冲区大小,要防止出现异常终止。指定 -c 或 -m 标志时,省略排序阶段,使用系统的缺省缓冲大小。如果已排序行超出这一大小,排序异常终止。-z 选项指定排序阶段最长行的记录,因而可在合并阶段分配足够的缓冲区。RecordSize 必须指明等于或大于要合并的最长行的字节值。
退出状态
该命令返回以下出口值:
0 所有输入文件成功输出,或指定了 -c 且正确排序了输入文件。
1 在 -c 选项下,文件没有按指定排序,或如果指定 -c 和 -u 选项,找到了两个具有相同关键字的输入行。
>1 发生错误。
