Python语言的创始人解释为什么Python数组的索引从0开始

最近有人在Twitter是问我为什么Python使用以0为第一位的数组索引方式(以下简称0-based),并让我看一篇关于这个主题的文章(很有趣)。这引起了我不少的回忆。ABC语言——Python的祖先之一,使用的是以1为第一位的索引方式(以下简称1-based),而C语言——另一种对Python有影响巨大的语言,使用0-based方式。我最早学习的几种语言(Algol, Fortran, Pascal),有的是1-based的,有的是不固定的。我认为,之所以让我决定让Python使用0-based索引方式的原因之一是Python的切片(slice)语法。

让我们来先看看切片的用法。可能最常见的用法就是“从数组中切出前n位”或“从数值这第i位起切出n位”(前一种实际上是i==起始位的特殊用法)。如果使用这种语法时不需要表达成难看的+1-1补充方式,那将是非常的优雅。

使用0-based的索引方式,Python的半开区间切片和缺省匹配区间切片语法变得非常漂亮: a[:n]a[i:i+n],前者的标准写法就是a[0:n]

如果是1-base的索引方式,那么,想让a[:n]表达成“取前n个元素”,(这是不行的),你要么使用一个闭合区间切片语法,要么在切片语法中使用切片起始位和切片长度2个参数的形式。使用1-based索引方式,半开区间切片语法变得不优雅。这种方式下使用闭合区间切片语法,为了表达从第i位取n个元素时你必须写出a[i:i+n-1]。这样看来,如果使用1-based的索引,使用切片起始位+长度的形式更合适。这样你可以写成a[i:n]。事实上ABC语言就是这样做的——它使用了一个独特的表达方式,写成a@i|n。(参看http://homepages.cwi.nl/~steven/abc/qr.html#EXPRESSIONS

但是,index:length这种方式在其它情况下适用吗?说实话,这点我有些记不清了,但我想我是被半开区间语法的优雅迷住了。特别是当两个切片操作位置邻接时,第一个切片操作的终点索引值是第二个切片的起点索引值时,太漂亮了,无法舍弃。例如,你想将一个数组以i,j两个点切成三部分——这三部分将会是a[:i]a[i:j]a[j:]

这就是为什么我要让Python使用0-based的索引方式的原因。

[英文原文:why Python uses 0-based indexing ]
分享这篇文章:

8 Responses to Python语言的创始人解释为什么Python数组的索引从0开始

  1. Jian Xu says:

    倒数第二段末句
    “这三部分将会是a[:i],a[i:j]和a[:i]”
    应该是和a[j:]

  2. camelwoo says:

    “使用的是以1为第一为的索引方式(以下简称1-based)”拼音输入法……

  3. docblue says:

    只能说任何细节的背后都有故事,有大有小,

  4. 美女优优 says:

    如果我创作一个语言,我也会更多的根据我的理解和喜好,来决定一些细节。

  5. CipherChen says:

    python语言很优雅,我试图影响周边的朋友都使用python编程。

    但python依旧没有成为替代java的语言,目前现有许多优秀的框架都是用java实现,如apache系列。在MapReduce编程中,若要使用python只能利用streaming或者jython,这是让人苦恼的一点。

    回到原文来,python的slice也许是字符串处理中最吸引人的特性!

  6. haitao says:

    从0开始,计算a[x,y]的地址方便很多:&a +x+y*m
    否则要:&a + (x-1)+(y-1)*m +1

发表评论

邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据