外刊IT评论

Linux命令行里的“瑞士军刀”

这里说的“瑞士军刀”是指那些简单的一句命令就能完成其它高级语言一大片代码才能完成的工作。

下面的这些内容是Quora网站上Joshua Levy网友的总结：

通过sort/uniq获取文件内容的交集、合集和不同之处：假设有a、b两个文本文件，文件本身已经去除了重复内容。下面是效率最高的方法，可以处理任何体积的文件，甚至几个G的文件。(Sort对内存没有要求，但也许你需要用 -T 参数。)可以试着比较一下，你可以看看如果用Java来处理磁盘上文件的合并，需要用多少行代码。

cat a b | sort | uniq > c # c 是a和b的合集

cat a b | sort | uniq -d > c # c 是a和b的交集

cat a b b | sort | uniq -u > c # c 是a和b的不同

汇总一个文本内容里第三列数字的和(这个方法要比用Python来做快3倍并只需1/3的代码量)：

awk ‘{ x += $3 } END { print x }’ myfile

如果你想查看一个目录树里的文件的体积和修改日期，用下面的方法，相当于你挨个目录做”ls -l”，而且输出的形式比你用”ls -lR”更可读：

find . -type f -ls

使用xargs命令。这个命令非常的强大。注意每行上你可以控制多少个东西的执行。如果你不确定它是正确的执行，先使用xargs echo。同样，-I{} 也非常有用。例子：

find . -name \*.py | xargs grep some_function

cat hosts | xargs -I{} ssh root@{} hostname

假设你有一个文本文件，比如一个web服务器日志，在某些行上有一些值，比如URL中的acct_id参数。如果你想统计每个acct_id的所有请求记录：

cat access.log | egrep -o ‘acct_id=[0-9]+’ | cut -d= -f2 | sort | uniq -c | sort -rn

[英文原文：What are the most useful "Swiss army knife" one-liners on Unix? ]

linux| 2013年06月7日

你也许会喜欢这些文章：

4 Responses to Linux命令行里的“瑞士军刀”

mga says:

2013年06月8日 at 12:12 下午

很少用find | xargs | grep这种组合，因为要对每个每个文件都要新开个grep。
用grep some_func `find . -name \*.py`就简单很多，而且可以利用shell的alias功能。

回复
- mga says:
  
  2013年06月8日 at 12:25 下午
  
  查了才发现xargs可以不用对每行输入都新开个进程的。
  
  回复
- 依云 says:
  
  2013年06月8日 at 8:39 下午
  
  我习惯 grep xxx **/*.py，因为不用管文件名中有空格等特殊字符。
  不过，bash 似乎无法支持 ** 这个。
  
  那，用 find -exec 也好啊，少个 xargs，也不用担心文件名字符的问题。
  
  回复
- xnnyygn says:
  
  2013年06月8日 at 11:28 下午
  
  xargs grep find 做目录文件搜索的话可以用ack
  
  回复

发表回复取消回复

外刊IT评论

网站导航

特色栏目

编程视频

You had mail. Paul read it, so ask him what it said.

本作品采用知识共享署名-非商业性使用-相同方式共享 3.0 Unported许可协议进行许可。
备案信息：京ICP备12002735号京公网安备11010802009600号

×

感谢你的参与互动。

只需要最后一个步骤！