资源描述
基础
一、 中数据类型
在中,能够直接处理的数据类型有以下几种:
一、整数
可以处理任意大小的整数,当然包括负整数,在程序中,整数的表示方法和数学上的写法一模一样,例如:1,100,-8080,0,等等。
计算机由于使用二进制,所以,有时候用十六进制表示整数比较方便,十六进制用0x前缀和0-9,表示,例如:000,05b4c3d2,等等。
二、浮点数
浮点数也就是小数,之所以称为浮点数,是因为按照科学记数法表示时,一个浮点数的小数点位置是可变的,比如,1.23x10^9和12.3x10^8是相等的。浮点数可以用数学写法,如1.23,3.14,-9.01,等等。但是对于很大或很小的浮点数,就必须用科学计数法表示,把10用e替代,1.23x10^9就是1.23e9,或者12.3e8,0.000012可以写成1.25,等等。
整数和浮点数在计算机内部存储的方式是不同的,整数运算永远是精确的(除法难道也是精确的?是的!),而浮点数运算则可能会有四舍五入的误差。
三、字符串
字符串是以''或""括起来的任意文本,比如'',""等等。请注意,''或""本身只是一种表示方式,不是字符串的一部分,因此,字符串''只有a,b,c这3个字符。
四、布尔值
布尔值和布尔代数的表示完全一致,一个布尔值只有、两种值,要么是,要么是,在中,可以直接用、表示布尔值(请注意大小写),也可以通过布尔运算计算出来。
布尔值可以用、和运算。
运算是和运算,只有所有都为 ,运算结果才是 。
运算是或运算,只要其中有一个为 , 运算结果就是 。
运算是非运算,它是一个单目运算符,把 变成 , 变成 。
五、空值
空值是里一个特殊的值,用表示。不能理解为0,因为0是有意义的,而是一个特殊的空值。
此外,还提供了列表、字典等多种数据类型,还允许创建自定义数据类型,我们后面会继续讲到
打印输出
语句可以向屏幕上输出指定的文字。比如输出', ',用代码实现如下:
>>> ', '
二、 中的注释
的注释以 # 开头,后面的文字直到行尾都算注释
三、 的变量
在程序中,变量是用一个变量名表示,变量名必须是大小写英文、数字和下划线(_)的组合,且不能用数字开头,比如:
a = 1
变量a是一个整数。
007 = 'T007'
变量007是一个字符串。
在中,等号=是赋值语句,可以把任意数据类型赋值给变量,同一个变量可以反复赋值,而且可以是不同类型的变量,例如:
a = 123 # a是整数
a
a = '' # a变为字符串
a
这种变量本身类型不固定的语言称之为动态语言,和之对应的是静态语言。
静态语言在定义变量时必须指定变量类型,如果赋值的时候类型不匹配,就会报错。例如是静态语言,赋值语句如下( 表示注释):
a = 123; a是整数类型变量
a = ""; 错误:不能把字符串赋给整型变量
和静态语言相比,动态语言更灵活,就是这个原因。
请不要把赋值语句的等号等同于数学的等号。比如下面的代码:
x = 10
x = x + 2
如果从数学上理解x = x + 2那无论如何是不成立的,在程序中,赋值语句先计算右侧的表达式x + 2,得到结果12,再赋给变量x。由于x之前的值是10,重新赋值后,x的值变成12。
最后,理解变量在计算机内存中的表示也非常重要。当我们写:a = ''时,解释器干了两件事情:
1. 在内存中创建了一个''的字符串;
2. 在内存中创建了一个名为a的变量,并把它指向''。
也可以把一个变量a赋值给另一个变量b,这个操作实际上是把变量b指向变量a所指向的数据,例如下面的代码:
a = ''
b = a
a = ''
b
最后一行打印出变量b的内容到底是''呢还是''?如果从数学意义上理解,就会错误地得出b和a相同,也应该是'',但实际上b的值是'',让我们一行一行地执行代码,就可以看到到底发生了什么事:
执行a = '',解释器创建了字符串 ''和变量 a,并把a指向 '':
执行b = a,解释器创建了变量 b,并把b指向 a 指向的字符串'':
执行a = '',解释器创建了字符串'',并把a的指向改为'',但b并没有更改:
所以,最后打印变量b的结果自然是''了。
四、 数据类型
1. 中定义字符串。
字符串可以用''或者""括起来表示。
如果字符串本身包含'怎么办?比如我们要表示字符串 I'm ,这时,可以用" "括起来表示:
"I'm "
类似的,如果字符串包含",我们就可以用' '括起来表示:
' "" '
如果字符串既包含'又包含"怎么办?
这个时候,就需要对字符串的某些特殊字符进行“转义”,字符串用\进行转义。
要表示字符串 "I'm ".
由于 ' 和 " 会引起歧义,因此,我们在它前面插入一个\表示这是一个普通字符,不代表字符串的起始,因此,这个字符串又可以表示为:
' \"I\'m \".'
注意:转义字符 \ 不计入字符串的内容中。
常用的转义字符还有:
\n 表示换行
\t 表示一个制表符
\\ 表示 \ 字符本身
2. 中字符串和多行字符串
如果一个字符串包含很多需要转义的字符,对每一个字符都进行转义会很麻烦。为了避免这种情况,我们可以在字符串前面加个前缀 r ,表示这是一个 字符串,里面的字符就不需要转义了。例如:
r'\()/ \()/'
但是r'...'表示法不能表示多行字符串,也不能表示包含'和 "的字符串(为什么?)
如果要表示多行字符串,可以用'''...'''表示:
''' 1
2
3'''
上面这个字符串的表示方法和下面的是完全一样的:
' 1\ 2\ 3'
还可以在多行字符串前面添加 r ,把这个多行字符串也变成一个字符串:
r''' "".
.
's !'''
3. 中字符串
字符串还有一个编码问题。
因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特()作为一个字节(),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),0 - 255被用来表示大小写英文字母、数字和一些符号,这个编码表被称为编码,比如大写字母 A 的编码是65,小写字母 z 的编码是122。
如果要表示中文,显然一个字节是不够的,至少需要两个字节,而且还不能和编码冲突,所以,中国制定了2312编码,用来把中文编进去。
类似的,日文和韩文等其他语言也有这个问题。为了统一所有文字的编码,应运而生。把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
通常用两个字节表示一个字符,原有的英文编码从单字节变成双字节,只需要把高字节全部填为0就可以。
因为的诞生比标准发布的时间还要早,所以最早的只支持编码,普通的字符串''在内部都是编码的。
在后来添加了对的支持,以表示的字符串用u'...'表示,比如:
u'中文'
中文
注意: 不加 u ,中文就不能正常显示。
字符串除了多了一个 u 之外,和普通字符串没啥区别,转义字符和多行表示法仍然有效:
转义:
u'中文\n日文\n韩文'
多行:
u'''第一行
第二行'''
多行:
'''的字符串支持"中文",
"日文",
"韩文"等多种语言'''
如果中文字符串在环境下遇到 ,这是因为文件保存的格式有问题。可以在第一行添加注释
# -*- : 8 -*-
目的是告诉解释器,用8编码读取源代码。然后用 另存为... 并选择8格式保存。
4. 中整数和浮点数的运算
支持对整数和浮点数直接进行四则混合运算,运算规则和数学上的四则运算规则完全一致。
基本的运算:
1 + 2 + 3 # > 6
4 * 5 - 6 # > 14
7.5 / 8 + 2.1 # > 3.0375
使用括号可以提升优先级,这和数学运算完全一致,注意只能使用小括号,但是括号可以嵌套很多层:
(1 + 2) * 3 # > 9
(2.2 + 3.3) / (1.5 * (9 - 0.3)) # > 0.421807
和数学运算不同的地方是,的整数运算结果仍然是整数,浮点数运算结果仍然是浮点数:
1 + 2 # > 整数 3
1.0 + 2.0 # > 浮点数 3.0
但是整数和浮点数混合运算的结果就变成浮点数了:
1 + 2.0 # > 浮点数 3.0
为什么要区分整数运算和浮点数运算呢?这是因为整数运算的结果永远是精确的,而浮点数运算的结果不一定精确,因为计算机内存再大,也无法精确表示出无限循环小数,比如 0.1 换成二进制表示就是无限循环小数。
那整数的除法运算遇到除不尽的时候,结果难道不是浮点数吗?我们来试一下:
11 / 4 # > 2
令很多初学者惊讶的是,的整数除法,即使除不尽,结果仍然是整数,余数直接被扔掉。不过,提供了一个求余的运算 % 可以计算余数:
11 % 4 # > 3
如果我们要计算 11 / 4 的精确结果,按照“整数和浮点数混合运算的结果是浮点数”的法则,把两个数中的一个变成浮点数再运算就没问题了:
11.0 / 4 # > 2.75
5. 中布尔类型
我们已经了解了支持布尔类型的数据,布尔类型只有和两种值,但是布尔类型有以下几种运算:
和运算:只有两个布尔值都为 时,计算结果才为 。
# >
# >
# >
# >
或运算:只要有一个布尔值为 ,计算结果就是 。
# >
# >
# >
# >
非运算:把变为,或者把变为:
# >
# >
布尔运算在计算机中用来做条件判断,根据计算结果为或者,计算机可以自动执行不同的后续代码。
在中,布尔类型还可以和其他数据类型做 、和运算,请看下面的代码:
a =
a '' ''
计算结果不是布尔类型,而是字符串 '',这是为什么呢?
因为把0、空字符串''和看成 ,其他数值和非空字符串都看成 ,所以:
'' 计算结果是 ''
继续计算 '' '' 计算结果还是 ''
要解释上述结果,又涉及到 和 运算的一条重要法则:短路计算。
1. 在计算 a b 时,如果 a 是 ,则根据和运算法则,整个结果必定为 ,因此返回 a;如果 a 是 ,则整个计算结果必定取决和 b,因此返回 b。
2. 在计算 a b 时,如果 a 是 ,则根据或运算法则,整个计算结果必定为 ,因此返回 a;如果 a 是 ,则整个计算结果必定取决于 b,因此返回 b。
所以解释器在做布尔运算时,只要能提前确定计算结果,它就不会往后算了,直接返回结果。
五、 —
1. 创建
内置的一种数据类型是列表:。是一种有序的集合,可以随时添加和删除其中的元素。
比如,列出班里所有同学的名字,就可以用一个表示:
>>> ['', '', '']
是数学意义上的有序集合,也就是说,中的元素是按照顺序排列的。
2. 按照索引访问
由于是一个有序集合,所以,我们可以用一个按分数从高到低表示出班里的3个同学:
>>> L = ['', '', '']
那我们如何从中获取指定第 N 名的同学呢
需要特别注意的是,索引从 0 开始,也就是说,第一个元素的索引是0,第二个元素的索引是1,以此类推。
因此,要打印第一名同学的名字,用 L[0]:
>>> L[0]
要打印第二名同学的名字,用 L[1]:
>>> L[1]
要打印第四名同学的名字,用 L[3]:
>>> L[3]
4 ( ):
"<>", 1, <>
:
报错了!意思就是索引超出了范围,因为上面的只有3个元素,有效的索引是 0,1,2。
所以,使用索引时,千万注意不要越界。
3. 之倒序访问
的倒序检索:最后一个为L[-1],倒数第二个为 L[-2] …..
注意倒序检索也不能越界!!
4. 之添加新元素
(); 在集合最后边添加新的元素;
(0, ''); 把元素插入到定义的位置。
现在,班里有3名同学:
>>> L = ['', '', '']
今天,班里转来一名新同学 ,如何把新同学添加到现有的 中呢?
第一个办法是用 的 () 方法,把新同学追加到 的末尾:
>>> L = ['', '', '']
>>> ('')
>>> L
['', '', '', '']
()总是把新的元素添加到 的尾部。
如果 同学表示自己总是考满分,要求添加到第一的位置,怎么办?
方法是用的 ()方法,它接受两个参数,第一个参数是索引号,第二个参数是待添加的新元素:
>>> L = ['', '', '']
>>> (0, '')
>>> L
['', '', '', '']
(0, '') 的意思是,''将被添加到索引为 0 的位置上(也就是第一个),而原来索引为 0 的同学,以及后面的所有同学,都自动向后移动一位。
5. 从删除元素
() 删除集合的最后一个元素
(元素下标) 删除指定下标的元素
6. 中替换元素
L[要替换的下标]=要替换的元素(也可用倒序索引)。
7. 之创建
是另一种有序的列表,中文翻译为“ 元组 ”。 和 非常类似,但是,一旦创建完毕,就不能修改了。
同样是表示班里同学的名称,用表示如下:
>>> t = ('', '', '')
创建和创建唯一不同之处是用( )替代了[ ]。
8. 之创建单元素
和一样,可以包含 0 个、1个和任意多个元素。
包含多个元素的 ,前面我们已经创建过了。
包含 0 个元素的 ,也就是空,直接用 ()表示:
创建包含1个元素的 呢?来试试:
>>> t = (1)
>>> t
1
好像哪里不对!t 不是 ,而是整数1。为什么呢?
因为()既可以表示,又可以作为括号表示运算时的优先级,结果 (1) 被解释器计算出结果 1,导致我们得到的不是,而是整数 1。
正是因为用()定义单元素的有歧义,所以 规定,单元素 要多加一个逗号“,”,这样就避免了歧义:
>>> t = (1,) #单个需在元素后加逗号
>>> t
(1,)
在打印单元素时,也自动添加了一个“,”,为了更明确地告诉你这是一个。
多元素 加不加这个额外的“,”效果是一样的:
>>> t = (1, 2, 3,)
>>> t
(1, 2, 3)
9. 之“可变”的
前面我们看到了一旦创建就不能修改。现在,我们来看一个“可变”的:
>>> t = ('a', 'b', ['A', 'B'])
注意到 t 有 3 个元素:'a','b'和一个:['A', 'B']。作为一个整体是的第3个元素。对象可以通过 t[2] 拿到:
>>> L = t[2]
然后,我们把的两个元素改一改:
>>> L[0] = 'X'
>>> L[1] = 'Y'
再看看的内容:
>>> t
('a', 'b', ['X', 'Y'])
包含的3个元素存储分析:
当我们把的元素'A'和'B'修改为'X'和'Y'后,变为:
所谓的“不变”是说,的每个元素,指向永远不变。即指向'a',就不能改成指向'b',指向一个,就不能改成指向其他对象,但指向的这个本身是可变的!
理解了“指向不变”后,要创建一个内容也不变的就必须保证的每一个元素本身也不能变。
六、 —判断、循环
1. 之语句
示例,注意缩进
= 20
>= 18:
' ',
''
:
' 18'
'
'
注意: 代码的缩进规则。具有相同缩进的代码被视为代码块,上面的3,4行 语句就构成一个代码块(但不包括第5行的)。如果 语句判断为 ,就会执行这个代码块。
缩进请严格按照的习惯写法:4个空格,不要使用,更不要混合和空格,否则很容易造成因为缩进引起的语法错误。
注意: 语句后接表达式,然后用:表示代码块开始。
如果你在交互环境下敲代码,还要特别留意缩进,并且退出缩进需要多敲一行回车:
2. 之
要避免嵌套结构的 ... ...,我们可以用 ... 多个 ... ... 的结构,一次写完所有的规则:
>= 18:
''
>= 6:
''
>= 3:
''
:
''
意思就是 。这样一来,我们就写出了结构非常清晰的一系列条件判断。
特别注意: 这一系列条件判断会从上到下依次判断,如果某个判断为 ,执行完对应的代码块,后面的条件判断就直接忽略,不再执行了。
3. 之 循环
或可以表示一个有序集合。如果我们想依次访问一个中的每一个元素呢?比如 :
的 循环就可以依次把或的每个元素迭代出来:
L = ['', '', '']
L:
注意: 这个变量是在 循环中定义的,意思是,依次取出中的每一个元素,并把元素赋值给 ,然后执行循环体(就是缩进的代码块)。
4. 之 循环
和 循环不同的另一种循环是 循环, 循环不会迭代 或 的元素,而是根据表达式判断循环是否结束。
比如要从 0 开始打印不大于 N 的整数:
N = 10
x = 0
x < N:
x
x = x + 1
循环每次先判断 x < N,如果为,则执行循环体的代码块,否则,退出循环。
在循环体内,x = x + 1 会让 x 不断增加,最终因为 x < N 不成立而退出循环。
如果没有这一个语句,循环在判断 x < N 时总是为,就会无限循环下去,变成死循环,所以要特别留意循环的退出条件。
5. 之 退出循环
用 循环或者 循环时,如果要在循环体内直接退出循环,可以使用 语句。
比如计算1至100的整数和,我们用来实现:
= 0
x = 1
:
= + x
x = x + 1
x > 100:
在循环体内,判断了 x > 100 条件成立时,用语句退出循环,这样也可以实现循环的结束。
6. 之 继续循环
在循环过程中,可以用退出当前循环,还可以用跳过后续循环代码,继续下一次循环。
计算平均分:
L = [75, 98, 59, 81, 66, 43, 69, 85]
想要统计及格分数的平均分,就要把 x < 60 的分数剔除掉,这时,利用 ,可以做到当 x < 60的时候,不继续执行循环体的后续代码,直接进入下一次循环:
x L:
x < 60:
= + x
n = n + 1
7. 之 多重循环
在循环内部,还可以嵌套循环,我们来看一个例子:
x ['A', 'B', 'C']:
y ['1', '2', '3']:
x + y
x 每循环一次,y 就会循环 3 次
七、 —
1. 基本用法
用法类似于的,写法为—的写法
d = {
'': 95,
'': 85,
'': 59
}
u 可以简单地使用 d[] 的形式来查找对应的
u (d) #函数返回的长度
u 判断 是否存在,用 操作符:
'' d:
d['']
u 供的一个 方法,获取值,在不存在的时候,返回:
>>> ('')
59
>>> ('')
u 更新
是可变的,也就是说,我们可以随时往中添加新的 。比如已有:
d = {
'': 95,
'': 85,
'': 59
}
要把新同学''的成绩 72 加进去,用赋值语句:
>>> d[''] = 72
如果 已经存在,则赋值会用新的 替换掉原来的 :
2. 中的特点
u 的第一个特点是查找速度快,无论有10个元素还是10万个元素,查找速度都一样。而的查找速度随着元素增加而逐渐下降。
不过的缺点是占用内存大,还会浪费很多内容,正好相反,占用内存小,但是查找速度慢。
u 的第二个特点就是存储的序对是没有顺序的!这和不一样:
内部是无序的,不能用存储有序的集合。
u 的第三个特点是作为 的元素必须不可变,的基本类型如字符串、整数、浮点数都是不可变的,都可以作为 。但是是可变的,就不能作为 。由于是按 查找,所以,在一个中,不能重复。
3. 之 遍历
由于也是一个集合,所以,遍历和遍历类似,都可以通过 循环实现。
直接使用循环可以遍历 的 :
>>> d = { '': 95, '': 85, '': 59 }
>>> d:
...
...
由于通过 可以获取对应的 ,因此,在循环体内,可以获取到的值。
4.
u 持有一系列元素,这一点和 很像,但是的元素没有重复,而且是无序的,这点和 的 很像。
创建 的方式是调用 () 并传入一个 ,的元素将作为的元素:
>>> s = (['A', 'B', 'C'])
u 由于存储的是无序集合,所以我们没法通过索引来访问。
访问 中的某个元素实际上就是判断一个元素是否在中。
>>> 'B' s #此方法严格区分大小写,如果是小写b,则返回
>>> s = ([1, 2, 3])
>>> (4) 添加元素
>>> s
([1, 2, 3, 4])
删除中的元素时,用的()方法:
>>> s = ([1, 2, 3, 4])
>>> (4) #删除中的已有元素,删之前需判断元素是否存在,不存在的话会报错
>>> s
([1, 2, 3])
5. 之 的特点的应用
的内部结构和很像,唯一区别是不存储,因此,判断一个元素是否在中速度很快。
存储的元素和的类似,必须是不变对象,因此,任何可变对象是不能放入中的。
最后,存储的元素也是没有顺序的。
常用来判断对象是否包含在里。
6. 之 遍历
由于 也是一个集合,所以,遍历 和遍历 类似,都可以通过 循环实现。
直接使用 循环可以遍历 的元素:
>>> s = (['', '', ''])
>>> s:
...
...
注意: 观察 循环在遍历时,元素的顺序和的顺序很可能是不同的,而且不同的机器上运行的结果也可能不同。
八、 之函数
1. 单返回参数函数
在中,定义一个函数要使用 语句,依次写出函数名、括号、括号中的参数和冒号:,然后,在缩进块中编写函数体,函数的返回值用 语句返回。
我们以自定义一个求绝对值的 函数为例:
(x):
x >= 0:
x
:
请注意,函数体内部的语句在执行时,一旦执行到时,函数就执行完毕,并将结果返回。因此,函数内部通过条件判断和循环可以实现非常复杂的逻辑。
可以简写为。
如果没有语句,函数执行完毕后也会返回结果,只是结果为 。
2. 多个返回参数函数
比如在游戏中经常需要从一个点移动到另一个点,给出坐标、位移和角度,就可以计算出新的坐标:
# 包提供了()和 ()函数,我们先用引用它:
(x, y, , ):
= x + * ()
= y - * ()
,
这样我们就可以同时获得返回值:
>>> x, y = (100, 100, 60, / 6)
>>> x, y
151.961524227 70.0
但其实这只是一种假象,函数返回的仍然是单一值:
>>> r = (100, 100, 60, / 6)
>>> r
(151.962, 70.0)
用打印返回结果,原来返回值是一个!
但是,在语法上,返回一个可以省略括号,而多个变量可以同时接收一个,按位置赋给对应的值,所以,的函数返回多值其实就是返回一个,但写起来更方便。
3. 之递归函数
在函数内部,可以调用其他函数。如果一个函数在内部调用自身本身,这个函数就是递归函数。
举个例子,我们来计算阶乘 n! = 1 * 2 * 3 * ... * n,用函数 (n)表示,可以看出:
(n) = n! = 1 * 2 * 3 * ... * (1) * n = (1)! * n = (1) * n
所以,(n)可以表示为 n * (1),只有1时需要特殊处理。
于是,(n)用递归的方式写出来就是:
(n):
1:
1
n * (n - 1)
>>> (5)
120
>>> (100)
9332621544394485929638952175999932299976369792000000000L
使用递归函数需要注意防止栈溢出。在计算机中,函数调用是通过栈()这种数据结构实现的,每当进入一个函数调用,栈就会加一层栈帧,每当函数返回,栈就会减一层栈帧。由于栈的大小不是无限的,所以,递归调用的次数过多,会导致栈溢出。可以试试计算 (10000)。
4. 之定义默认参数
定义函数的时候,还可以有默认参数。
例如自带的 () 函数,其实就有两个参数,我们既可以传一个参数,又可以传两个参数:
>>> ('123')
123
>>> ('123', 8)
83
()函数的第二个参数是转换进制,如果不传,默认是十进制 (10),如果传了,就用传入的参数。
可见,函数的默认参数的作用是简化调用,你只需要把必须的参数传进去。但是在需要的时候,又可以传入额外的参数来覆盖默认参数值。
我们来定义一个计算 x 的N次方的函数:
(x, n):
s = 1
n > 0:
n = n - 1
s = s * x
s
假设计算平方的次数最多,我们就可以把 n 的默认值设定为 2:
(x, 2):
s = 1
n > 0:
n = n - 1
s = s * x
s
这样一来,计算平方就不需要传入两个参数了:
>>> (5)
25
由于函数的参数按从左到右的顺序匹配,所以默认参数只能定义在必需参数的后面:
# :
1(a, 1, 2):
# :
2(1, b):
5. 之定义可变参数
如果想让一个函数能接受任意个参数,我们就可以定义一个可变参数:
(*):
可变参数的名字前面有个 * 号,我们可以传入0个、1个或多个参数给可变参数:
>>> ()
>>> ('a')
('a',)
>>> ('a', 'b')
('a', 'b')
可变参数也不是很神秘,解释器会把传入的一组参数组装成一个传递给可变参数,因此,在函数内部,直接把变量 看成一个 就好了。
定义可变参数的目的也是为了简化调用。假设我们要计算任意个数的平均值,就可以定义一个可变参数:
(*):
...
这样,在调用的时候,可以这样写:
>>> ()
0
>>> (1, 2)
1.5
九、 —切片
1. 对进行切片
取一个的部分元素是非常常见的操作。比如,一个如下:
>>> L = ['', '', '', '']
取前3个元素,应该怎么做?
笨办法:
>>> [L[0], L[1], L[2]]
['', '', '']
之所以是笨办法是因为扩展一下,取前N个元素就没辙了。
取前N个元素,也就是索引为0-(1)的元素,可以用循环:
>>> r = []
>>> n = 3
>>> i (n):
... (L[i])
...
>>> r
['', '', '']
对这种经常取指定索引范围的操作,用循环十分繁琐,因此,提供了切片()操作符,能大大简化这种操作。
对应上面的问题,取前3个元素,用一行代码就可以完成切片:
>>> L[0:3]
['', '', '']
L[0:3]表示,从索引0开始取,直到索引3为止,但不包括索引3。即索引0,1,2,正好是3个元素。
如果第一个索引是0,还可以省略:
>>> L[:3]
['', '', '']
也可以从索引1开始,取出2个元素出来:
>>> L[1:3]
['', '']
只用一个 : ,表示从头到尾:
>>> L[:]
['', '', '', '']
因此,L[:]实际上复制出了一个新。
切片操作还可以指定第三个参数:
>>> L[::2]
['', '']
第三个参数表示每N个取一个,上面的 L[::2] 会每两个元素取出一个来,也就是隔一个取一个。
把换成,切片操作完全相同,只是切片的结果也变成了。
2. 倒序切片
对于,支持L[-1]取倒数第一个元素,它同样支持倒数切片
>>> L = ['', '', '', '']
>>> L[-2:]
['', '']
>>> L[2]
['', '']
>>> L[-31]
['', '']
>>> L[-41:2]
['', '']
倒数第一个元素的索引是-1。倒序切片包含起始索引,不包含结束索引。
3. 对字符串切片
字符串 ''和 字符串 u''也可以看成是一种,每个元素就是一个字符。因此,字符串也可以用切片操作,只是操作结果仍是字符串:
>>> ''[:3]
''
>>> ''[-3:]
''
>>> ''[::2]
''
在很多编程语言中,针对字符串提供了很多各种截取函数,其实目的就是对字符串切片。没有针对字符串的截取函数,只需要切片一个操作就可以完成,非常简单。
十、 —迭代
1. 什么是迭代
在中,如果给定一个或,我们可以通过循环来遍历这个或,这种遍历我们成为迭代()。
在中,迭代是通过 ... 来完成的,而很多语言比如C或者,迭代是通过下标完成的,比如代码:
(0; i<; ) {
n = [i];
}
可以看出,的循环抽象程度要高于的循环。
因为 的 循环不仅可以用在或上,还可以作用在其他任何可迭代对象上。
因此,迭代操作就是对于一个集合,无论该集合是有序还是无序,我们用 循环总是可以依次取出集合的每一个元素。
注意: 集合是指包含一组元素的数据结构,我们已经介绍的包括:
1. 有序集合:,,和;
2. 无序集合:
3. 无序集合并且具有 对:
而迭代是一个动词,它指的是一种操作,在中,就是 循环。
迭代和按下标访问数组最大的不同是,后者是一种具体的迭代实现方式,而前者只关心迭代结果,根本不关心迭代内部是如何实现的。
请用循环迭代数列 1-100 并打印出7的倍数。
用(1, 101)可以创建数组。
参考代码:
i (1, 101):
i % 7 0:
i
2. 索引迭代
中,迭代永远是取出元素本身,而非元素的索引。
对于有序集合,元素确实是有索引的。有的时候,我们确实想在 循环中拿到索引,怎么办?
方法是使用 () 函数:
>>> L = ['', '', '', '']
>>> , (L):
... , '-',
...
0 -
1 -
2 -
3 -
使用 () 函数,我们可以在循环中同时绑定索引和元素。但是,这不是 () 的特殊语法。实际上,() 函数把:
['', '', '', '']
变成了类似:
[(0, ''), (1, ''), (2, ''), (3, '')]
因此,迭代的每一个元素实际上是一个:
t (L):
= t[0]
= t[1]
, '-',
如果我们知道每个元素都包含两个元素,循环又可以进一步简写为:
, (L):
, '-',
这样不但代码更简单,而且还少了两条赋值语句。
可见,索引迭代也不是真的按索引访问,而是由 () 函数自动把每个元素变成 (, ) 这样的,再迭代,就同时获得了索引和元素本身。
3. 迭代的
我们已经了解了对象本身就是可迭代对象,用 循环直接迭代 ,可以每次拿到的一个。
如果我们希望迭代 对象的,应该怎么做?
对象有一个 () 方法,这个方法把转换成一个包含所有的,这样,我们迭代的就是 的每一个 :
d = { '': 95, '': 85, '': 59 }
()
# [85, 95, 59]
v ():
v
# 85
# 95
# 59
如果仔细阅读的文档,还可以发现,除了()方法外,还有一个 () 方法,用 () 方法替代 () 方法,迭代效果完全一样:
d = { '': 95, '': 85, '': 59 }
()
# < 0x10650>
v ():
v
# 85
# 95
# 59
那这两个方法有何不同之处呢?
1. () 方法实际上把一个 转换成了包含 的。
2. 但是 () 方法不会转换,它会在迭代过程中依次从 中取出 ,所以 () 方法比 () 方法节省了生成 所需的内存。
3. 打印 () 发现它返回一个 <> 对象,这说明在中, 循环可作用的迭代对象远不止 ,,,,等,任何可迭代对象都可以作用于循环,而内部如何迭代我们通常并不用关心。
如果一个对象说自己可迭代,那我们就直接用 循环去迭代它,可见,迭代是一种抽象的数据操作,它不对迭代对象内部的数据有任何要求。
4. 迭代的和
我们了解了如何迭代 的和,那么,在一个 循环中,能否同时迭代 和?答案是肯定的。
首先,我们看看 对象的 () 方法返回的值:
>>> d = { '': 95, '': 85, '': 59 }
>>> ()
[('', 85), ('', 95), ('', 59)]
可以看到,() 方法把对象转换成了包含的,我们对这个进行迭代,可以同时获得和:
>>> , ():
... , ':',
...
: 85
: 95
: 59
和 () 有一个 () 类似, () 也有一个对应的 (),() 不把转换成,而是在迭代过程中不断给出 ,所以, () 不占用额外的内存。
十一、 列表
1. 生成列表
要生成 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],我们可以用(1, 11):
>>> (1, 11)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
但如果要生成[1x1, 2x2, 3x3, ..., 10x10]怎么做?方法一是循环:
>>> L = []
>>> x
展开阅读全文