1、_Python入门原著 Guido van Rossum翻译 李东风 第一章 介绍 第二章 解释程序的使用 第三章 基本使用 第四章 流程控制 第五章 Python数据结构 第六章 模块 第七章 输入输出 第八章 错误与例外 第九章 类 第十章 进一步学习 第一章 介绍脚本语言是类似DOS批处理、UNIX shell程序的语言。脚本语言不需要每次编译再执行,并且在执行中可以很容易地访问正在运行的程序,甚至可以动态地修改正在运行的程序,适用于快速地开发以及完成一些简单的任务。在使用脚本语言时常常需要增的新的功能,但有时因为脚本语言本来就已经很慢、很大、很复杂了而不能实现;或者,所需的功能涉及只能
2、用C语言提供的系统调用或其他函数通常所要解决的问题没有重要到必须用C语言重写的程度;或者,解决问题需要诸如可变长度字符串等数据类型(如文件名的有序列表),这样的数据类型在脚本语言中十分容易而C语言则需要很多工作才能实现;或者,编程者不熟悉C语言:这些情况下还是可以使用脚本语言的。在这样的情况下,Python可能正好适合你的需要。Python使用简单,但它是一个真正的程序语言,而且比shell提供了更多结构和对大型程序的支持。另一方面,它比C提供更多的错误检查,它是一个非常高级的语言,内置了各种高级数据结构,如灵活的数组和字典,这些数据结构要用C高效实现的话可能要花费你几天的时间。由于Pytho
3、n具有更一般的数据结构,它比Awk甚至Perl适用的范围都广,而许多东西在Python内至少和在这些语言内一样容易。Python允许你把程序分解为模块,模块可以在其他Python程序中重用。它带有一大批标准模块可以作为你自己的程序的基础或作为学习Python编程的例子。系统还提供了关于文件输入输出、系统调用、插座(sockets)的东西,甚至提供了窗口系统(STDWIN)的通用接口。Python是一个解释性语言,因为不需要编译和连接所以能节省大量的程序开发时间。解释程序可以交互使用,这样可以可以很容易地试验语言的各种特色,写只用一次的程序,或在从底向上程序开发中测试函数。它也是一个方便的计算器
4、。Python允许你写出非常严谨而且可读的程序。用Python写的程序通常都比相应的C程序要短,因为如下几个理由: 高级的数据结构允许你用一个语句表达复杂的操作; 复合语句是靠缩进而不是用表示开始和结束的括号; 不需要变量声明或参量声明。 Python是可扩充的:如果你会用C语言编程就很容易为解释程序增加新的内置函数或模块,这样可以以最快速度执行关键操作,或把Python程序和只能以二进制码提供的库(如不同厂商提供的图形库)连接起来。当你变得确实很在行时你可以把Python解释器与用C写的应用相连接,把它作为该应用的扩展或命令语言。 Python的命名是由BBC的“Monty Pythons
5、Flying Circus”节目而得,与蟒蛇没有什么关系。第二章 解释程序的使用在命令行键入 python或在Windows环境下双击相应的图标可以进入Python的解释程序。如果要运行储存在文件中的Python程序,可以用 python 文件名的形式。 进入解释程序的环境后,解释程序称为处于交互状态。在这种状态下系统用 主提示提示输入下一个命令,这一般是三个大于号(),如果需要续行系统用 次提示提示输入,缺省为三个小数点(.)。在主提示下键入文件尾符号(在UNIX中为Control-D,在DOS或Windows中为Control-Z)可以正常退出解释程序。 Python解释程序的有些版本支持
6、命令行编辑和命令历史,使用用Emacs或vi的键组合。 第三章 基本使用下面我们用例子来介绍Python的基本用法。在例子中,用户输入和系统输出靠有没有提示(和.)来分别。如果要试这些例子的话,需要键入提示后的所有命令,例子中没有提示的行是系统的输出。注意只有次提示的行意味着需要键入一个空行,这用于结束多行命令。3.1 用Python作计算器使用启动解释程序,等待主提示出现。解释程序可以作为计算器使用。键入一个表达式,解释程序就可以输出结果。表达式的写法很直观:+,-,*,/, %, *等算符的作用和其它大多数语言(如Pascal或C)没什么差别,括号可以用来组合。例如: 2+24 # 这是一
7、个注释. 2+24 2+2 # 和代码在同一行的注释4 (50-5*6)/45 # 整数除法得下面的整数. 7/32 7/-3-3和C中一样,等于号用来给变量赋值,赋值的结果不显示: width = 20 height = 5*9 width * height900可以同时给几个变量赋同一个值: x = y = z = 0 # 把 x, y 和 z赋零 x0 y0 z0Python完全支持浮点数,混合类型的运算会把整数先转换成浮点数: 4 * 2.5 / 3.33.0303030303 7.0 / 23.5Python也提供了复数,方法是用j和J作为虚数单位,如1+1j,3.14e-10j,等
8、等。 3.2. 字符串 Python除处理数字外还可以处理字符串,字符串用单撇号或双撇号包裹: spam eggsspam eggs doesntdoesnt doesntdoesnt Yes, he said.Yes, he said. Yes, he said.Yes, he said. Isnt, she said.Isnt, she said.字符串输出格式与输入的样子相同,都是用撇号包裹,撇号和其它特殊字符用用反斜杠转义。如果字符串中有单撇号而没有双撇号则用双撇号包裹,否则应该用单撇号包裹。后面要介绍的print语句可以不带撇号或转义输出字符串。字符串可以用+号连接起来,用*号重复:
9、 word = Help + A wordHelpA 字符串可以象在C中那样用下标索引,字符串的第一个字符下标为0。 Python没有单独的字符数据类型,一个字符就是长度为一的字符串。象在Icon语言中那样,可以用片段(slice)记号来指定子串,片段即用冒号隔开的两个下标。 word4A word0:2He word2:4lp片段有很好的缺省值:第一下标省略时缺省为零,第二下标省略时缺省为字符串的长度。 word:2 # 前两个字符He word2: # 除前两个字符串外的部分lpA注意s:i + si: 等于 s 是片段运算的一个有用的恒等式。 word:2 + word2:HelpA w
10、ord:3 + word3:HelpA不合理的片段下标可以很好地得到解释:过大的下标被换成字符串长度,上界小于下界时返回空串。 word1:100elpA word10: word2:1下标允许为负数,这时从右向左数。例如: word-1 # 最后一个字符A word-2 # 倒数第二个字符p word-2: # 最后两个字符pA word:-2 # 除最后两个字符外的部分Hel但要注意的是 -0 实际还是 0,所以它不会从右向左数! word-0 # (因为 -0 等于 0)H超出范围的片段下标被截断,但在非片段的情况下不要这样: word-100:HelpA word-10 # 错误Tra
11、ceback (innermost last): File , line 1IndexError: string index out of range记住片段意义的最好方法是把下标看成是字符 之间的点,第一个字符的左边界号码为0。有n个字符的字符串的最后一个字符的右边界下标为n,例如: +-+-+-+-+-+ | H | e | l | p | A | +-+-+-+-+-+ 0 1 2 3 4 5 -5 -4 -3 -2 -1第一行数字给出字符串中下标0到5的位置,第二行给出相应的负下标。从i到j的片段由在边界i和j之间的字符组成。对于非负下标,如果下标都在界内,则片段的长度为下标的差。例如
12、,word1:3 的长度为 2。内置函数len()返回字符串的长度: s = supercalifragilisticexpialidocious len(s)34多行的长字符串也可以用行尾反斜杠续行,续行的行首空白不被忽略,如 hello = This is a rather long string containingn several lines of text just as you would do in C.n Note that whitespace at the beginning of the line is significant.n print hello结果为 This
13、 is a rather long string containing several lines of text just as you would do in C. Note that whitespace at the beginning of the line is significant.对于特别长的字符串(比如包含说明的几段文字),如果用上面的方式每行都用n结尾是很麻烦的,特别是这样无法用象Emacs这样的功能强大的编辑器重新编排。对这种情况,可以使用三重撇号,例如 hello = This string is bounded by triple double quotes (3
14、times ). Unescaped newlines in the string are retained, though it is still possiblento use all normal escape sequences. Whitespace at the beginning of a line is significant. If you need to include three opening quotes you have to escape at least one of them, e.g. . This string ends in a newline. 三重撇
15、号字符串也可以用三个单撇号,没有任何语义差别。 多行的字符串常量可以直接连接起来,字符串常量之间用空格分隔则在编译时可以自动连接起来,这样可以把一个长字符串连接起来而不需要牺牲缩进对齐或性能,不象用加号连接需要运算,也不象字符串串内的换行其行首空格需要保持。3.3 列表Python中有几种复合数据类型,用来把其它值组合到一起。其中最灵活的是列表,可以写成在方括号之间用逗号隔开的若干值(项)。列表的项不必取同一类型。 a = spam, eggs, 100, 1234 aspam, eggs, 100, 1234象字符串下标那样,列表下标从0开始,列表可以取片段,可以连接,等等: a0spam
16、a31234 a-2100 a1:-1eggs, 100 a:2 + bacon, 2*2spam, eggs, bacon, 4 3*a:3 + Boe!spam, eggs, 100, spam, eggs, 100, spam, eggs, 100, Boe!与字符串不同的是列表是可变的,可以修改列表的每个元素: aspam, eggs, 100, 1234 a2 = a2 + 23 aspam, eggs, 123, 1234也可以给一个片段重新赋值,这甚至可以改变表的大小: # 替换若干项:. a0:2 = 1, 12 a1, 12, 123, 1234 # 去掉若干项:. a0:2
17、 = a123, 1234 # 插入若干项:. a1:1 = bletch, xyzzy a123, bletch, xyzzy, 1234 a:0 = a # 在开头插入自身 a123, bletch, xyzzy, 1234, 123, bletch, xyzzy, 1234内置函数也使用于列表: len(a)8可以建立嵌套列表(表的元素也是列表),如: q = 2, 3 p = 1, q, 4 len(p)3 p12, 3 p102 p1.append(xtra) # 列表方法 p1, 2, 3, xtra, 4 q2, 3, xtra注意这个例子中p1和q实际是同一个对象!也就是说它们
18、只不过是同一个东西的两个名字(引用)而已。3.4 编程初步Python当然不是只能用来把两个数加到一起,它可以完成很复杂的工作。例如,我们可以写出Fibonacci序列的开始几个: # Fibonacci 序列:. # 两个元素的和定义下一个. a, b = 0, 1 while b 这个例子介绍了几个新特色。 第一行包含一个多重赋值: 变量a和b同时得到新值0和1。在最后一行又用了多重赋值,我们可以看出赋值时先把右边都算出后再进行赋值。while循环当循环条件(这里即: b 10)成立时不断执行。在Python中和C中一样,非零整数值为真值,零为假值。条件也可以是字符串或列表或任何序列,长度
19、为非零的为真,空序列为假。例子中所用的是一个简单比较。标准的比较算符和C一样:, =, = 和 !=。循环体是缩进的:缩进是Python用来组合语句的方式。Python目前还不能提供智能自动缩进,所以你需要自己为每个缩进行键入制表符或空格。实际使用中你可以用文本编辑程序为Python 准备复杂的输入,多数文本编辑程序都有自动缩进的功能。在交互输入复合语句时必修附加一个空行以指示复合语句的完成(因为解释程序无法猜到哪是语句的最后一行)。print语句显示后面的表达式值。这和直接写出表达式不同,它可以显示多个表达式和字符串,而且可以用于程序文件中。显示时字符串没有撇号,各项目之间插入一个空格,所以
20、你可以以精美的格式显示,如: i = 256*256 print The value of i is, iThe value of i is 65536在尾部写一个逗号可以避免最后换行: a, b = 0, 1 while b 注意如果前一行没有结束的话系统在显示提示之前先换行。 Python还提供了和C语言一样的printf格式的输出方式,这是用%实现的,左边是格式,如: print The value of 1/7 is approximately %5.3f. % 0.142857 The value of 1/7 is approximately 0.143. 如果有多个需要输出的项百
21、分号右边的项可以是一个序组,如 print Name: %-10s Age: %3d % (White, 31) Name: White Age: 31第四章 流程控制前面我们已经见到了如何由用while结构控制流程运行。这一章我们介绍更多的控制结构。Python具有和其它语言类似的控制结构但略有差别。4.1 If 语句If 语句可能是最基本的程序分支语句了。例如: if x # 计算字符串长:. a = cat, window, defenestrate for x in a:. print x, len(x). cat 3window 6defenestrate 12尽量不要在循环体内修改
22、用来控制循环的序列(当然,只有可变的序列类型如列表才有可能被修改),这样程序可能会出问题。如果需要这样,比如说要复制某些项,可以用序列的副本来控制循环。片段记号让你很容易生成副本: for x in a: # 生成整个列表的片段副本. if len(x) 6: a.insert(0, x). adefenestrate, cat, window, defenestrate结果是把列表中长度超过6个字符的字符串插入到列表开头。 4.3 range() 函数如果确实需要对一列数字进行循环的话,可以使用内置函数range()。它生成包含数字序列的列表,如: range(10)0, 1, 2, 3,
23、4, 5, 6, 7, 8, 9注意给出的终点永远不出现在生成的列表中,range(10)生成一个十个数的列表,恰好是长度为10的序列的合法下标的各个值。也可以指定不同的起始点,或者指定不同的间隔(甚至负数): range(5, 10)5, 6, 7, 8, 9 range(0, 10, 3)0, 3, 6, 9 range(-10, -100, -30)-10, -40, -70为了对序列的下标进行循环,如下联合使用range() 和 len(): a = Mary, had, a, little, lamb for i in range(len(a):. print i, ai. 0 Ma
24、ry1 had2 a3 little4 lamb4.4 break语句,continue语句和循环中的else子句如同C语言一样,break语句跳出其所处的最内层的for 或 while循环,continue语句继续下一循环步。循环语句还可以带一个 else 子句,当循环正常结束时执行其内容,但如果循环是用break 语句跳出的则不执行其内容。下例说明了这种用法,此例求素数: for n in range(2, 10):. for x in range(2, n):. if n % x = 0:. print n, equals, x, *, n/x. break. else:. print
25、n, is a prime number. 2 is a prime number3 is a prime number4 equals 2 * 25 is a prime number6 equals 2 * 37 is a prime number8 equals 2 * 49 equals 3 * 34.5 pass 语句pass语句不执行任何操作,当语法要求一个语句而程序不需要执行操作时就用此语句。例如: while 1:. pass # 等待键盘中断.4.6 函数定义我们可以定义一个函数用来计算某一界限以下的所有Fibonacci序列值: def fib(n): # 写出 n 以下的
26、所有Fibonacci序列值. a, b = 0, 1. while b # 调用刚刚定义的函数:. fib(2000)1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597其中关键字 def 开始一个函数定义,其后应该是函数名,括号内的形参表,以冒号结束。构成函数体的各语句从下一行开始,用一个制表符缩进。函数的第一个语句可以是一个字符串,如果是的话,这个字符串就是函数的文档字符串,简称为docstring。有一些工具可以利用文档字符串自动生成可打印的文档,或者让用户交互地浏览代码,所以在自己编程时加入文档字符串是一个好习惯,应该养成这样的习惯。
27、函数在执行时对局部变量引入一个新的符号表。函数中的变量赋值都存入局部符号表;引用变量时变量名先从局部符号表中查找,然后在全局符号表中查找,最后从内置的名字中查找。因此,在函数中不能直接对全局变量赋值(除非用了global语句来说明),但可以引用全局变量的值。函数调用的实参被引入函数的局部符号表,即函数的参数是按值调用的。函数再调用其它函数时为该函数生成一个新的符号表。但是严格地说,函数的调用是按引用调用的,因为如果参数是一个可变类型如列表的话在函数中改变形参的内容将导致实参的内容被改变(不改变的是实参名字的绑定关系)。函数定义把函数名放入当前符号表。函数名的值类型为用户自定义函数,这个值可以赋
28、给另一个名字,从而这个名字也代表相同的函数。这可以作为一般的改名方法: fib f = fib f(100)1 1 2 3 5 8 13 21 34 55 89你可能会说 fib 不是函数而是过程。Python和C一样,过程只是不返回值的函数。实际上,严格地说,过程也返回一个值,只不过是一个很没意思的值。这个值叫做 None(这是一个内置的名字)。解释程序交互运行时如果只需要显示这个值的话就会忽略不显示。如果希望显示的话可以用 print 语句: print fib(0)None也可以写一个函数返回Fibonacci 序列的数值列表而不是显示这些值: def fib2(n): # 返回直到n的
29、Fibonacci 序列值. result = . a, b = 0, 1. while b f100 = fib2(100) # 调用 f100 # 输出结果1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89这个例子也演示了新的Python特色:return语句从函数中退出并返回一个值。不带返回值的return可以从过程中间退出,运行到过程的末尾也可以退出,这两种情况下返回None。语句result.append(b)调用列表对象result的一个方法。方法是“属于”一个对象的函数,引用格式为obj.methodname,其中obj是某个对象(也允许是一个表达式), m
30、ethodname 是由该对象的类型定义的一个方法的名字。不同的不同的方法。不同类型的方法可以使用相同的名字而不致引起误解。(可以定义自己的对象类型和方法,使用类,本文后面会讨论这个话题)。例子中的append()方法时列表对象的方法,它在列表末尾增加一个新元素。在本例中这等价于“result = result + b”,只是更有效。4.7 函数参数可以定义使用可变个数参数的函数。这样的定义方法有三种,可以联合使用。 4.7.1 参数缺省值可以为一个参数或几个参数指定缺省值。这样定义的函数在调用时实参个数可以比定义时少。例如:def ask_ok(prompt, retries=4, comp
31、laint=Yes or no, please!): while 1: ok = raw_input(prompt) if ok in (y, ye, yes): return 1 if ok in (n, no, nop, nope): return 0 retries = retries - 1 if retries 0: raise IOError, refusenik user print complaint这个函数在调用时既可以这样调用:ask_ok(Do you really want to quit?),或者可以这样调用:ask_ok(OK to overwrite the fi
32、le?, 2)。缺省值是在函数定义时的定义作用域中计算的,所以例如:i = 5def f(arg = i): print argi = 6f()将显示5。 注意:缺省值只计算一次。当缺省值是可变对象如列表或字典时这一点是要注意的。例如,以下函数会在以后的调用中累加它的值:def f(a, l = ): l.append(a) return lprint f(1)print f(2)print f(3)This will print 11, 21, 2, 3如果你不希望缺省值在连续的调用中被保留,可以象下面这样改写函数:def f(a, l = None): if l is None: l =
33、l.append(a) return l4.7.2 关键字参数函数调用时也可以象“关键字 = 值”这样指定实参,其中关键字是定义时使用的形参的名字。例如:def parrot(voltage, state=a stiff, action=voom, type=Norwegian Blue): print - This parrot wouldnt, action, print if you put, voltage, Volts through it. print - Lovely plumage, the, type print - Its, state, !可以用如下几种方式调用:parr
34、ot(1000)# 缺省值parrot(action = VOOOOOM, voltage = 1000000)# 关键字,缺省值,次序可变parrot(a thousand, state = pushing up the daisies)# 位置参数,缺省值,关键字parrot(a million, bereft of life, jump)# 位置参数,缺省值但以下几种调用方式是错误的:parrot() # 非缺省的参数没有提供parrot(voltage=5.0, dead) # 关键字参数后面又出现了非关键字参数parrot(110, voltage=220) # 参数值重复提供par
35、rot(actor=John Cleese) # 未知关键字一般说来,实参表中位置参数在前,关键字参数在后,关键字名字必须是形参名字。形参有没有缺省值都可以用关键字参数的形式调用。每一形参至多只能对应一个实参,因此,已经由位置参数传入值的形参就不能在同一调用中再作为关键字参数。如果形参表中有一个形为*name的形参,在调用时这个形参可以接收一个字典,字典中包含所有不与任何形参匹配的关键字参数。形参表中还可以使用一个特殊的如*name的形参,它将接受所有不能匹配的位置参数组成的一个序表。*name只能在*name之前出现。例如,如果定义了下面的函数:def cheeseshop(kind, *a
36、rguments, *keywords): print - Do you have any, kind, ? print - Im sorry, were all out of, kind for arg in arguments: print arg print -*40 for kw in keywords.keys(): print kw, :, keywordskw就可以象下面这样调用:cheeseshop(Limburger, Its very runny, sir., Its really very, VERY runny, sir., client=John Cleese, sh
37、opkeeper=Michael Palin, sketch=Cheese Shop Sketch)结果显示:- Do you have any Limburger ?- Im sorry, were all out of LimburgerIts very runny, sir.Its really very, VERY runny, sir.-client : John Cleeseshopkeeper : Michael Palinsketch : Cheese Shop Sketch4.7.3 任意个数参数在所有有名的形参的后面可以有两个特殊的形参,一个以*args的形式命名,一个以*kw 的形式命名。有了*args形式的形参后函数在调用时就可以在正常的能匹配的实参表后面输入任意个数的参数,这些参数组成一个序表赋给args形参,不能匹配的关键字参数组成一个字典赋给kw形参。在任意个数形参之前可以有0到多个正常的参数。例如:def fprintf(file, format, *args): file.write(format