3. Python 的非正式介绍 — Python 文档
3. Python 的非正式介绍
在下面的例子中,输入和输出是通过有无提示来区分的(>>> and …):要重复这个例子,你必须在提示后输入所有内容,出现提示时; 不以提示开头的行是解释器的输出。 请注意,示例中一行的辅助提示意味着您必须键入一个空行; 这用于结束多行命令。
本手册中的许多示例,即使是在交互式提示下输入的示例,也包含注释。 Python 中的注释以散列字符 #
开头,并延伸到物理行的末尾。 注释可能出现在行首或空格或代码之后,但不会出现在字符串文字中。 字符串文字中的散列字符只是散列字符。 由于注释是为了澄清代码而不是由 Python 解释,因此在输入示例时可能会省略它们。
一些例子:
# this is the first comment
spam = 1 # and this is the second comment
# ... and now a third!
text = "# This is not a comment because it's inside quotes."
3.1. 使用 Python 作为计算器
让我们尝试一些简单的 Python 命令。 启动解释器并等待主要提示,>>>
。 (应该不会花很长时间。)
3.1.1. 数字
解释器就像一个简单的计算器:你可以在它上面输入一个表达式,它会写出值。 表达式语法很简单:运算符 +
、-
、*
和 /
与大多数其他语言(例如,Pascal 或 C)一样工作; 括号 (()
) 可用于分组。 例如:
>>> 2 + 2
4
>>> 50 - 5*6
20
>>> (50 - 5.0*6) / 4
5.0
>>> 8 / 5.0
1.6
整数(例如 2
, 4
, 20
) 具有类型 int,带有小数部分的那些(例如 5.0
, 1.6
) 的类型为 float。 我们将在本教程后面看到更多关于数字类型的信息。
除法 (/
) 运算的返回类型取决于其操作数。 如果两个操作数都是 int 类型,则执行 floor Division 并返回 int。 如果任一操作数是 float,则执行经典除法并返回 float。 //
运算符也用于进行楼层划分,无论操作数是什么。 余数可以用 %
运算符计算:
>>> 17 / 3 # int / int -> int
5
>>> 17 / 3.0 # int / float -> float
5.666666666666667
>>> 17 // 3.0 # explicit floor division discards the fractional part
5.0
>>> 17 % 3 # the % operator returns the remainder of the division
2
>>> 5 * 3 + 2 # result * divisor + remainder
17
使用 Python,可以使用 **
运算符来计算幂 1:
>>> 5 ** 2 # 5 squared
25
>>> 2 ** 7 # 2 to the power of 7
128
等号 (=
) 用于为变量赋值。 之后,在下一个交互提示之前不会显示任何结果:
>>> width = 20
>>> height = 5 * 9
>>> width * height
900
如果一个变量没有“定义”(赋值),尝试使用它会给你一个错误:
>>> n # try to access an undefined variable
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'n' is not defined
完全支持浮点; 具有混合类型操作数的运算符将整数操作数转换为浮点数:
>>> 3 * 3.75 / 1.5
7.5
>>> 7.0 / 2
3.5
在交互模式下,最后打印的表达式被分配给变量 _
。 这意味着当你使用 Python 作为桌面计算器时,继续计算会更容易一些,例如:
>>> tax = 12.5 / 100
>>> price = 100.50
>>> price * tax
12.5625
>>> price + _
113.0625
>>> round(_, 2)
113.06
用户应将此变量视为只读。 不要显式地给它赋值——你会创建一个同名的独立局部变量,用它的魔法行为屏蔽内置变量。
除了 int 和 float,Python 还支持其他类型的数字,例如 Decimal 和 Fraction。 Python 还内置了对 复数 的支持,并使用 j
或 J
后缀来表示虚部(例如 3+5j
)。
3.1.2. 字符串
除了数字,Python 还可以操作字符串,字符串可以用多种方式表示。 它们可以用单引号 ('...'
) 或双引号 ("..."
) 括起来,结果相同 2。 \
可用于转义引号:
>>> 'spam eggs' # single quotes
'spam eggs'
>>> 'doesn\'t' # use \' to escape the single quote...
"doesn't"
>>> "doesn't" # ...or use double quotes instead
"doesn't"
>>> '"Yes," they said.'
'"Yes," they said.'
>>> "\"Yes,\" they said."
'"Yes," they said.'
>>> '"Isn\'t," they said.'
'"Isn\'t," they said.'
在交互式解释器中,输出字符串用引号括起来,特殊字符用反斜杠转义。 虽然这有时看起来与输入不同(括起来的引号可能会改变),但这两个字符串是等效的。 如果字符串包含单引号且不包含双引号,则字符串用双引号括起来,否则用单引号括起来。 print 语句通过省略封闭引号并打印转义字符和特殊字符来产生更具可读性的输出:
>>> '"Isn\'t," they said.'
'"Isn\'t," they said.'
>>> print '"Isn\'t," they said.'
"Isn't," they said.
>>> s = 'First line.\nSecond line.' # \n means newline
>>> s # without print, \n is included in the output
'First line.\nSecond line.'
>>> print s # with print, \n produces a new line
First line.
Second line.
如果您不希望以 \
开头的字符被解释为特殊字符,您可以通过在第一个引号前添加 r
来使用 原始字符串 :
>>> print 'C:\some\name' # here \n means newline!
C:\some
ame
>>> print r'C:\some\name' # note the r before the quote
C:\some\name
字符串文字可以跨越多行。 一种方法是使用三引号:"""..."""
或 ...
。 行尾会自动包含在字符串中,但可以通过在行尾添加 \
来防止出现这种情况。 下面的例子:
print """\
Usage: thingy [OPTIONS]
-h Display this usage message
-H hostname Hostname to connect to
"""
产生以下输出(注意不包括初始换行符):
Usage: thingy [OPTIONS]
-h Display this usage message
-H hostname Hostname to connect to
字符串可以用 +
运算符连接(粘合在一起),并用 *
重复:
>>> # 3 times 'un', followed by 'ium'
>>> 3 * 'un' + 'ium'
'unununium'
两个或多个 字符串文字 (即 括在引号之间的那些)彼此相邻会自动连接。
>>> 'Py' 'thon'
'Python'
当您想断开长字符串时,此功能特别有用:
>>> text = ('Put several strings within parentheses '
... 'to have them joined together.')
>>> text
'Put several strings within parentheses to have them joined together.'
但这仅适用于两个文字,不适用于变量或表达式:
>>> prefix = 'Py'
>>> prefix 'thon' # can't concatenate a variable and a string literal
...
SyntaxError: invalid syntax
>>> ('un' * 3) 'ium'
...
SyntaxError: invalid syntax
如果要连接变量或变量和文字,请使用 +
:
>>> prefix + 'thon'
'Python'
字符串可以是 indexed(下标),第一个字符的索引为 0。 没有单独的字符类型; 一个字符只是一个大小为 1 的字符串:
>>> word = 'Python'
>>> word[0] # character in position 0
'P'
>>> word[5] # character in position 5
'n'
指数也可能是负数,从右边开始计数:
>>> word[-1] # last character
'n'
>>> word[-2] # second-last character
'o'
>>> word[-6]
'P'
请注意,由于 -0 与 0 相同,因此负索引从 -1 开始。
除了索引,还支持 切片 。 虽然索引用于获取单个字符,但 slicing 允许您获取子字符串:
>>> word[0:2] # characters from position 0 (included) to 2 (excluded)
'Py'
>>> word[2:5] # characters from position 2 (included) to 5 (excluded)
'tho'
请注意如何始终包括开始,而始终排除结束。 这确保 s[:i] + s[i:]
始终等于 s
:
>>> word[:2] + word[2:]
'Python'
>>> word[:4] + word[4:]
'Python'
切片索引具有有用的默认值; 省略的第一个索引默认为零,省略的第二个索引默认为被切片的字符串的大小。
>>> word[:2] # character from the beginning to position 2 (excluded)
'Py'
>>> word[4:] # characters from position 4 (included) to the end
'on'
>>> word[-2:] # characters from the second-last (included) to the end
'on'
记住切片如何工作的一种方法是将索引视为指向 个字符之间的 ,第一个字符的左边缘编号为 0。 那么一串 n 个字符的最后一个字符的右边缘有索引 n,例如:
+---+---+---+---+---+---+
| P | y | t | h | o | n |
+---+---+---+---+---+---+
0 1 2 3 4 5 6
-6 -5 -4 -3 -2 -1
第一行数字给出了字符串中索引 0…6 的位置; 第二行给出了相应的负指数。 从 i 到 j 的切片由分别标记为 i 和 j 的边之间的所有字符组成。
对于非负索引,切片的长度是索引的差值,如果两者都在界限内。 例如word[1:3]
的长度为2。
尝试使用太大的索引会导致错误:
>>> word[42] # the word only has 6 characters
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: string index out of range
但是,当用于切片时,超出范围的切片索引会得到妥善处理:
>>> word[4:42]
'on'
>>> word[42:]
''
Python 字符串无法更改——它们是 不可变的 。 因此,分配给字符串中的索引位置会导致错误:
>>> word[0] = 'J'
...
TypeError: 'str' object does not support item assignment
>>> word[2:] = 'py'
...
TypeError: 'str' object does not support item assignment
如果你需要一个不同的字符串,你应该创建一个新的:
>>> 'J' + word[1:]
'Jython'
>>> word[:2] + 'py'
'Pypy'
内置函数 len() 返回字符串的长度:
>>> s = 'supercalifragilisticexpialidocious'
>>> len(s)
34
也可以看看
- 序列类型——str、unicode、list、tuple、bytearray、buffer、xrange
- 字符串和下一节描述的 Unicode 字符串是 序列类型 的示例,并支持此类类型支持的常见操作。
- 字符串方法
- 字符串和 Unicode 字符串都支持大量的基本转换和搜索方法。
- 格式化字符串语法
- 有关使用 str.format() 格式化字符串的信息。
- 字符串格式化操作
- 此处更详细地描述了当字符串和 Unicode 字符串是
%
运算符的左操作数时调用的旧格式化操作。
3.1.3. Unicode 字符串
从 Python 2.0 开始,程序员可以使用一种用于存储文本数据的新数据类型:Unicode 对象。 它可用于存储和操作 Unicode 数据(参见 http://www.unicode.org/)并与现有字符串对象很好地集成,在必要时提供自动转换。
Unicode 的优点是为现代和古代文本中使用的每个脚本中的每个字符提供一个序数。 以前,脚本字符只有 256 个可能的序数。 文本通常绑定到将序数映射到脚本字符的代码页。 这会导致非常混乱,尤其是在软件的国际化(通常写为 i18n
— 'i'
+ 18 个字符 + 'n'
)方面。 Unicode 通过为所有脚本定义一个代码页来解决这些问题。
在 Python 中创建 Unicode 字符串就像创建普通字符串一样简单:
>>> u'Hello World !'
u'Hello World !'
引号前面的小 'u'
表示应该创建一个 Unicode 字符串。 如果要在字符串中包含特殊字符,可以使用 Python Unicode-Escape 编码来实现。 以下示例显示了如何:
>>> u'Hello\u0020World !'
u'Hello World !'
转义序列 \u0020
表示在给定位置插入序号值为 0x0020(空格字符)的 Unicode 字符。
其他字符通过将它们各自的序数值直接用作 Unicode 序数来解释。 如果您有许多西方国家使用的标准 Latin-1 编码的文字字符串,您会发现 Unicode 的低 256 个字符与 Latin-1 的 256 个字符相同很方便。
对于专家来说,还有一种原始模式,就像普通字符串的模式一样。 您必须在开头的引号前加上 'ur' 才能让 Python 使用 Raw-Unicode-Escape 编码。 如果小“u”前面的反斜杠数量奇数,它只会应用上述 \uXXXX
转换。
>>> ur'Hello\u0020World !'
u'Hello World !'
>>> ur'Hello\\u0020World !'
u'Hello\\\\u0020World !'
当您必须输入大量反斜杠时,原始模式最有用,这在正则表达式中可能是必需的。
除了这些标准编码之外,Python 还提供了一整套其他基于已知编码创建 Unicode 字符串的方法。
内置函数 unicode() 提供对所有注册的 Unicode 编解码器(编码器和解码器)的访问。 这些编解码器可以转换的一些比较知名的编码是 Latin-1、ASCII、UTF-8 和 UTF-16 ]。 后两种是可变长度编码,将每个 Unicode 字符存储在一个或多个字节中。 默认编码通常设置为 ASCII,它通过 0 到 127 范围内的字符并拒绝任何其他带有错误的字符。 当打印 Unicode 字符串、写入文件或使用 str() 进行转换时,将使用此默认编码进行转换。
>>> u"abc"
u'abc'
>>> str(u"abc")
'abc'
>>> u"äöü"
u'\xe4\xf6\xfc'
>>> str(u"äöü")
Traceback (most recent call last):
File "<stdin>", line 1, in ?
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
为了使用特定编码将 Unicode 字符串转换为 8 位字符串,Unicode 对象提供了一个 encode()
方法,该方法接受一个参数,即编码名称。 编码的小写名称是首选。
>>> u"äöü".encode('utf-8')
'\xc3\xa4\xc3\xb6\xc3\xbc'
如果您有特定编码的数据并希望从中生成相应的 Unicode 字符串,您可以使用 unicode() 函数,将编码名称作为第二个参数。
>>> unicode('\xc3\xa4\xc3\xb6\xc3\xbc', 'utf-8')
u'\xe4\xf6\xfc'
3.1.4. 列表
Python 知道许多 复合 数据类型,用于将其他值组合在一起。 最通用的是list,它可以写成方括号之间以逗号分隔的值(项)的列表。 列表可能包含不同类型的项目,但通常这些项目都具有相同的类型。
>>> squares = [1, 4, 9, 16, 25]
>>> squares
[1, 4, 9, 16, 25]
与字符串(以及所有其他内置 序列 类型)一样,列表可以被索引和切片:
>>> squares[0] # indexing returns the item
1
>>> squares[-1]
25
>>> squares[-3:] # slicing returns a new list
[9, 16, 25]
所有切片操作都会返回一个包含所请求元素的新列表。 这意味着以下切片返回列表的新(浅)副本:
>>> squares[:]
[1, 4, 9, 16, 25]
列表还支持连接等操作:
>>> squares + [36, 49, 64, 81, 100]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
与 immutable 的字符串不同,列表是 mutable 类型,即 可以更改它们的内容:
>>> cubes = [1, 8, 27, 65, 125] # something's wrong here
>>> 4 ** 3 # the cube of 4 is 64, not 65!
64
>>> cubes[3] = 64 # replace the wrong value
>>> cubes
[1, 8, 27, 64, 125]
您还可以使用 append()
方法 在列表末尾添加新项目(稍后我们将看到更多关于方法的信息):
>>> cubes.append(216) # add the cube of 6
>>> cubes.append(7 ** 3) # and the cube of 7
>>> cubes
[1, 8, 27, 64, 125, 216, 343]
分配给切片也是可能的,这甚至可以改变列表的大小或完全清除它:
>>> letters = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> letters
['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> # replace some values
>>> letters[2:5] = ['C', 'D', 'E']
>>> letters
['a', 'b', 'C', 'D', 'E', 'f', 'g']
>>> # now remove them
>>> letters[2:5] = []
>>> letters
['a', 'b', 'f', 'g']
>>> # clear the list by replacing all the elements with an empty list
>>> letters[:] = []
>>> letters
[]
内置函数 len() 也适用于列表:
>>> letters = ['a', 'b', 'c', 'd']
>>> len(letters)
4
可以嵌套列表(创建包含其他列表的列表),例如:
>>> a = ['a', 'b', 'c']
>>> n = [1, 2, 3]
>>> x = [a, n]
>>> x
[['a', 'b', 'c'], [1, 2, 3]]
>>> x[0]
['a', 'b', 'c']
>>> x[0][1]
'b'
3.2. 编程的第一步
当然,我们可以将 Python 用于比将两个和两个加在一起更复杂的任务。 例如,我们可以写出 Fibonacci 系列的初始子序列,如下所示:
>>> # Fibonacci series:
... # the sum of two elements defines the next
... a, b = 0, 1
>>> while b < 10:
... print b
... a, b = b, a+b
...
1
1
2
3
5
8
此示例介绍了几个新功能。
第一行包含 多重赋值 :变量
a
和b
同时获得新值 0 和 1。 在最后一行再次使用它,证明右侧的表达式在任何赋值发生之前都首先被评估。 右边的表达式是从左到右计算的。只要条件(此处:
b < 10
)保持为真,while 循环就会执行。 在 Python 中,就像在 C 中一样,任何非零整数值都为真; 零是假的。 条件也可以是字符串或列表值,实际上是任何序列; 任何具有非零长度的都是真的,空序列是假的。 示例中使用的测试是一个简单的比较。 标准比较运算符的书写方式与 C 中相同:<
(小于)、>
(大于)、==
(等于)、<=
](小于或等于)、>=
(大于或等于)和!=
(不等于)。循环的 body 是 indented:缩进是 Python 对语句进行分组的方式。 在交互式提示下,您必须为每个缩进的行键入一个制表符或空格。 在实践中,您将使用文本编辑器为 Python 准备更复杂的输入; 所有体面的文本编辑器都有自动缩进功能。 当以交互方式输入复合语句时,它后面必须跟一个空行以表示完成(因为解析器无法猜测您何时输入了最后一行)。 请注意,基本块中的每一行都必须缩进相同的数量。
print 语句写入给定的表达式的值。 它在处理多个表达式和字符串的方式上不同于仅编写您想要编写的表达式(正如我们之前在计算器示例中所做的那样)。 字符串打印时不带引号,并在项目之间插入一个空格,因此您可以很好地格式化内容,如下所示:
>>> i = 256*256 >>> print 'The value of i is', i The value of i is 65536
尾随逗号避免输出后的换行符:
>>> a, b = 0, 1 >>> while b < 1000: ... print b, ... a, b = b, a+b ... 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987
请注意,如果最后一行未完成,解释器会在打印下一个提示之前插入换行符。
脚注
- 1
- 由于
**
的优先级高于-
,因此-3**2
将被解释为-(3**2)
,从而导致-9
。 为了避免这种情况并获得9
,您可以使用(-3)**2
。 - 2
- 与其他语言不同,
\n
等特殊字符与单引号 ('...'
) 和双引号 ("..."
) 具有相同的含义。 两者之间的唯一区别是在单引号内不需要转义"
(但必须转义\'
),反之亦然。