Linux内核代码中的脏话统计

按脏话数/版本号统计

graph

按脏话密度/版本号统计

relgraph

上图显示的是对Linux内核里的c,h和S源代码里的脏话统计结果,我会每月更新一次这些数据,当有新版本发布时也会更新一次。我是受the linux kernel fuck count的启发,但遗憾的是它里面的数据已经过期了。

从图中可以很明显的看出,自从2.4版开始,脏话的数量有大量的增加。然而,总的代码量也增加了很多,所以,总的来看,平均每行的诅咒密度是减少的。

介绍一下统计方法:不论任何地方出现的脏话词汇都会计入总数——出现在另一个词内也算。本来可以做的更合理些,但结果发现FreeBSD的正则表达式引擎有严重的内存泄漏问题,我也就没有再改进了。一行里对一个脏词可能会统计出多次,因为有时候一个程序员会遇到非常非常懊恼的一天。

你可以在找到这个脚本,但它写的实在是太乱了,不推荐。

[英文原文:Linux kernel swear counts ]

分享这篇文章:

3 Responses to Linux内核代码中的脏话统计

  1. myhyperion says:

    为什么“企鹅”是“贱货”呢?

  2. Kevin says:

    哈哈,偶也贡献过几句。。。

发表评论

电子邮件地址不会被公开。 必填项已用*标注