3. Python 的非正式介绍 — Python 文档
3. Python 的非正式介绍
在下面的例子中,输入和输出是通过有无提示来区分的(>>> and …):要重复这个例子,你必须在提示后输入所有内容,出现提示时; 不以提示开头的行是解释器的输出。 请注意,示例中一行的辅助提示意味着您必须键入一个空行; 这用于结束多行命令。
您可以通过单击示例框右上角的 >>>
来切换提示和输出的显示。 如果隐藏示例的提示和输出,则可以轻松地将输入行复制并粘贴到解释器中。
本手册中的许多示例,即使是在交互式提示下输入的示例,也包含注释。 Python 中的注释以散列字符 #
开头,并延伸到物理行的末尾。 注释可能出现在行首或空格或代码之后,但不会出现在字符串文字中。 字符串文字中的散列字符只是散列字符。 由于注释是为了澄清代码而不是由 Python 解释,因此在输入示例时可能会省略它们。
一些例子:
# this is the first comment
spam = 1 # and this is the second comment
# ... and now a third!
text = "# This is not a comment because it's inside quotes."
3.1. 使用 Python 作为计算器
让我们尝试一些简单的 Python 命令。 启动解释器并等待主要提示,>>>
。 (应该不会花很长时间。)
3.1.1. 数字
解释器就像一个简单的计算器:你可以在它上面输入一个表达式,它会写出值。 表达式语法很简单:运算符 +
、-
、*
和 /
与大多数其他语言(例如,Pascal 或 C)一样工作; 括号 (()
) 可用于分组。 例如:
>>> 2 + 2
4
>>> 50 - 5*6
20
>>> (50 - 5*6) / 4
5.0
>>> 8 / 5 # division always returns a floating point number
1.6
整数(例如 2
, 4
, 20
) 具有类型 int,带有小数部分的那些(例如 5.0
, 1.6
) 的类型为 float。 我们将在本教程后面看到更多关于数字类型的信息。
除法 (/
) 总是返回一个浮点数。 要进行 floor Division 并获得整数结果(丢弃任何小数结果),您可以使用 //
运算符; 要计算余数,您可以使用 %
:
>>> 17 / 3 # classic division returns a float
5.666666666666667
>>>
>>> 17 // 3 # floor division discards the fractional part
5
>>> 17 % 3 # the % operator returns the remainder of the division
2
>>> 5 * 3 + 2 # floored quotient * divisor + remainder
17
使用 Python,可以使用 **
运算符来计算幂 1:
>>> 5 ** 2 # 5 squared
25
>>> 2 ** 7 # 2 to the power of 7
128
等号 (=
) 用于为变量赋值。 之后,在下一个交互提示之前不会显示任何结果:
>>> width = 20
>>> height = 5 * 9
>>> width * height
900
如果一个变量没有“定义”(赋值),尝试使用它会给你一个错误:
>>> n # try to access an undefined variable
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'n' is not defined
完全支持浮点; 具有混合类型操作数的运算符将整数操作数转换为浮点数:
>>> 4 * 3.75 - 1
14.0
在交互模式下,最后打印的表达式被分配给变量 _
。 这意味着当你使用 Python 作为桌面计算器时,继续计算会更容易一些,例如:
>>> tax = 12.5 / 100
>>> price = 100.50
>>> price * tax
12.5625
>>> price + _
113.0625
>>> round(_, 2)
113.06
用户应将此变量视为只读。 不要显式地给它赋值——你会创建一个同名的独立局部变量,用它的魔法行为屏蔽内置变量。
除了 int 和 float,Python 还支持其他类型的数字,例如 Decimal 和 Fraction。 Python 还内置了对 复数 的支持,并使用 j
或 J
后缀来表示虚部(例如 3+5j
)。
3.1.2. 字符串
除了数字,Python 还可以操作字符串,字符串可以用多种方式表示。 它们可以用单引号 ('...'
) 或双引号 ("..."
) 括起来,结果相同 2。 \
可用于转义引号:
>>> 'spam eggs' # single quotes
'spam eggs'
>>> 'doesn\'t' # use \' to escape the single quote...
"doesn't"
>>> "doesn't" # ...or use double quotes instead
"doesn't"
>>> '"Yes," they said.'
'"Yes," they said.'
>>> "\"Yes,\" they said."
'"Yes," they said.'
>>> '"Isn\'t," they said.'
'"Isn\'t," they said.'
在交互式解释器中,输出字符串用引号括起来,特殊字符用反斜杠转义。 虽然这有时看起来与输入不同(括起来的引号可能会改变),但这两个字符串是等效的。 如果字符串包含单引号且不包含双引号,则字符串用双引号括起来,否则用单引号括起来。 print() 函数通过省略封闭引号并打印转义字符和特殊字符来产生更具可读性的输出:
>>> '"Isn\'t," they said.'
'"Isn\'t," they said.'
>>> print('"Isn\'t," they said.')
"Isn't," they said.
>>> s = 'First line.\nSecond line.' # \n means newline
>>> s # without print(), \n is included in the output
'First line.\nSecond line.'
>>> print(s) # with print(), \n produces a new line
First line.
Second line.
如果您不希望以 \
开头的字符被解释为特殊字符,您可以通过在第一个引号前添加 r
来使用 原始字符串 :
>>> print('C:\some\name') # here \n means newline!
C:\some
ame
>>> print(r'C:\some\name') # note the r before the quote
C:\some\name
字符串文字可以跨越多行。 一种方法是使用三引号:"""..."""
或 ...
。 行尾会自动包含在字符串中,但可以通过在行尾添加 \
来防止出现这种情况。 下面的例子:
print("""\
Usage: thingy [OPTIONS]
-h Display this usage message
-H hostname Hostname to connect to
""")
产生以下输出(注意不包括初始换行符):
Usage: thingy [OPTIONS]
-h Display this usage message
-H hostname Hostname to connect to
字符串可以用 +
运算符连接(粘合在一起),并用 *
重复:
>>> # 3 times 'un', followed by 'ium'
>>> 3 * 'un' + 'ium'
'unununium'
两个或多个 字符串文字 (即 括在引号之间的那些)彼此相邻会自动连接。
>>> 'Py' 'thon'
'Python'
当您想断开长字符串时,此功能特别有用:
>>> text = ('Put several strings within parentheses '
... 'to have them joined together.')
>>> text
'Put several strings within parentheses to have them joined together.'
但这仅适用于两个文字,不适用于变量或表达式:
>>> prefix = 'Py'
>>> prefix 'thon' # can't concatenate a variable and a string literal
File "<stdin>", line 1
prefix 'thon'
^
SyntaxError: invalid syntax
>>> ('un' * 3) 'ium'
File "<stdin>", line 1
('un' * 3) 'ium'
^
SyntaxError: invalid syntax
如果要连接变量或变量和文字,请使用 +
:
>>> prefix + 'thon'
'Python'
字符串可以是 indexed(下标),第一个字符的索引为 0。 没有单独的字符类型; 一个字符只是一个大小为 1 的字符串:
>>> word = 'Python'
>>> word[0] # character in position 0
'P'
>>> word[5] # character in position 5
'n'
指数也可能是负数,从右边开始计数:
>>> word[-1] # last character
'n'
>>> word[-2] # second-last character
'o'
>>> word[-6]
'P'
请注意,由于 -0 与 0 相同,因此负索引从 -1 开始。
除了索引,还支持 切片 。 索引用于获取单个字符,而 slicing 允许您获取子字符串:
>>> word[0:2] # characters from position 0 (included) to 2 (excluded)
'Py'
>>> word[2:5] # characters from position 2 (included) to 5 (excluded)
'tho'
切片索引具有有用的默认值; 省略的第一个索引默认为零,省略的第二个索引默认为被切片的字符串的大小。
>>> word[:2] # character from the beginning to position 2 (excluded)
'Py'
>>> word[4:] # characters from position 4 (included) to the end
'on'
>>> word[-2:] # characters from the second-last (included) to the end
'on'
请注意如何始终包括开始,而始终排除结束。 这确保 s[:i] + s[i:]
始终等于 s
:
>>> word[:2] + word[2:]
'Python'
>>> word[:4] + word[4:]
'Python'
记住切片如何工作的一种方法是将索引视为指向 个字符之间的 ,第一个字符的左边缘编号为 0。 那么一串 n 个字符的最后一个字符的右边缘有索引 n,例如:
+---+---+---+---+---+---+
| P | y | t | h | o | n |
+---+---+---+---+---+---+
0 1 2 3 4 5 6
-6 -5 -4 -3 -2 -1
第一行数字给出了字符串中索引 0…6 的位置; 第二行给出了相应的负指数。 从 i 到 j 的切片由分别标记为 i 和 j 的边之间的所有字符组成。
对于非负索引,切片的长度是索引的差值,如果两者都在界限内。 例如word[1:3]
的长度为2。
尝试使用太大的索引会导致错误:
>>> word[42] # the word only has 6 characters
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: string index out of range
但是,当用于切片时,超出范围的切片索引会得到妥善处理:
>>> word[4:42]
'on'
>>> word[42:]
''
Python 字符串无法更改——它们是 不可变的 。 因此,分配给字符串中的索引位置会导致错误:
>>> word[0] = 'J'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'str' object does not support item assignment
>>> word[2:] = 'py'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'str' object does not support item assignment
如果你需要一个不同的字符串,你应该创建一个新的:
>>> 'J' + word[1:]
'Jython'
>>> word[:2] + 'py'
'Pypy'
内置函数 len() 返回字符串的长度:
>>> s = 'supercalifragilisticexpialidocious'
>>> len(s)
34
也可以看看
- 文本序列类型 — str
- 字符串是 序列类型 的示例,并支持此类类型支持的常见操作。
- 字符串方法
- 字符串支持大量的基本转换和搜索方法。
- 格式化字符串文字
- 具有嵌入表达式的字符串文字。
- 格式化字符串语法
- 有关使用 str.format() 格式化字符串的信息。
- printf 风格的字符串格式
- 此处更详细地描述了当字符串是
%
运算符的左操作数时调用的旧格式化操作。
3.1.3. 列表
Python 知道许多 复合 数据类型,用于将其他值组合在一起。 最通用的是list,它可以写成方括号之间以逗号分隔的值(项)的列表。 列表可能包含不同类型的项目,但通常这些项目都具有相同的类型。
>>> squares = [1, 4, 9, 16, 25]
>>> squares
[1, 4, 9, 16, 25]
与字符串(以及所有其他内置 sequence 类型)一样,列表可以被索引和切片:
>>> squares[0] # indexing returns the item
1
>>> squares[-1]
25
>>> squares[-3:] # slicing returns a new list
[9, 16, 25]
所有切片操作都会返回一个包含所请求元素的新列表。 这意味着以下切片返回列表的 浅拷贝 :
>>> squares[:]
[1, 4, 9, 16, 25]
列表还支持连接等操作:
>>> squares + [36, 49, 64, 81, 100]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
与 immutable 的字符串不同,列表是 mutable 类型,即 可以更改它们的内容:
>>> cubes = [1, 8, 27, 65, 125] # something's wrong here
>>> 4 ** 3 # the cube of 4 is 64, not 65!
64
>>> cubes[3] = 64 # replace the wrong value
>>> cubes
[1, 8, 27, 64, 125]
您还可以使用 append()
方法 在列表末尾添加新项目(稍后我们将看到更多关于方法的信息):
>>> cubes.append(216) # add the cube of 6
>>> cubes.append(7 ** 3) # and the cube of 7
>>> cubes
[1, 8, 27, 64, 125, 216, 343]
分配给切片也是可能的,这甚至可以改变列表的大小或完全清除它:
>>> letters = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> letters
['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> # replace some values
>>> letters[2:5] = ['C', 'D', 'E']
>>> letters
['a', 'b', 'C', 'D', 'E', 'f', 'g']
>>> # now remove them
>>> letters[2:5] = []
>>> letters
['a', 'b', 'f', 'g']
>>> # clear the list by replacing all the elements with an empty list
>>> letters[:] = []
>>> letters
[]
内置函数 len() 也适用于列表:
>>> letters = ['a', 'b', 'c', 'd']
>>> len(letters)
4
可以嵌套列表(创建包含其他列表的列表),例如:
>>> a = ['a', 'b', 'c']
>>> n = [1, 2, 3]
>>> x = [a, n]
>>> x
[['a', 'b', 'c'], [1, 2, 3]]
>>> x[0]
['a', 'b', 'c']
>>> x[0][1]
'b'
3.2. 编程的第一步
当然,我们可以将 Python 用于比将两个和两个加在一起更复杂的任务。 例如,我们可以编写 斐波那契数列 的初始子序列,如下所示:
>>> # Fibonacci series:
... # the sum of two elements defines the next
... a, b = 0, 1
>>> while a < 10:
... print(a)
... a, b = b, a+b
...
0
1
1
2
3
5
8
此示例介绍了几个新功能。
第一行包含 多重赋值 :变量
a
和b
同时获得新值 0 和 1。 在最后一行再次使用它,证明右侧的表达式在任何赋值发生之前都首先被评估。 右边的表达式是从左到右计算的。只要条件(此处:
a < 10
)保持为真,while 循环就会执行。 在 Python 中,就像在 C 中一样,任何非零整数值都为真; 零是假的。 条件也可以是字符串或列表值,实际上是任何序列; 任何具有非零长度的都是真的,空序列是假的。 示例中使用的测试是一个简单的比较。 标准比较运算符的书写方式与 C 中相同:<
(小于)、>
(大于)、==
(等于)、<=
](小于或等于)、>=
(大于或等于)和!=
(不等于)。循环的 body 是 indented:缩进是 Python 对语句进行分组的方式。 在交互式提示下,您必须为每个缩进的行键入一个制表符或空格。 在实践中,您将使用文本编辑器为 Python 准备更复杂的输入; 所有体面的文本编辑器都有自动缩进功能。 当以交互方式输入复合语句时,它后面必须跟一个空行以表示完成(因为解析器无法猜测您何时输入了最后一行)。 请注意,基本块中的每一行都必须缩进相同的数量。
print() 函数写入给定的参数值。 它与仅编写您想要编写的表达式(正如我们之前在计算器示例中所做的那样)的不同之处在于它处理多个参数、浮点量和字符串的方式。 字符串打印时不带引号,并在项目之间插入一个空格,因此您可以很好地格式化内容,如下所示:
>>> i = 256*256 >>> print('The value of i is', i) The value of i is 65536
关键字参数 end 可用于避免输出后的换行符,或以不同的字符串结束输出:
>>> a, b = 0, 1 >>> while a < 1000: ... print(a, end=',') ... a, b = b, a+b ... 0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,
脚注
- 1
- 由于
**
的优先级高于-
,因此-3**2
将被解释为-(3**2)
,从而导致-9
。 为了避免这种情况并获得9
,您可以使用(-3)**2
。 - 2
- 与其他语言不同,
\n
等特殊字符与单引号 ('...'
) 和双引号 ("..."
) 具有相同的含义。 两者之间的唯一区别是在单引号内不需要转义"
(但必须转义\'
),反之亦然。