Python编程快速入门

2023-05-05 电脑爱好者

Python/ target=_blank class=infotextkey>Python是当前最流行的编程语言之一，可应用于Web开发、数据分析、人工智能、科学计算、桌面应用、游戏开发等等多个领域。Python的一大特色就是它具有丰富的程序库（包括内置的库及第三方开发的库），我们不必从头开始编写代码，就可以实现功能强大的应用程序。Python不但功能强大，而且和其他编程语言相比它相对简单，不需要任何先前的编程经验即可学习、使用，对初学者极为友好。下面就让我们一起走进丰富多彩的Python编程世界。

文|梦飞

Python编程环境设置

Python是一种解释性语言，它使用解释器来解释和执行代码，这对用户来说省去了C或C++之类语言的编译步骤，直接从源代码即可运行，因此更容易编写和调试。工欲善其事，必先利其器。在学习Python编程之前，先让我们安装好相应的工具并对编程环境进行设置。

首先进入Python官方下载频道https://www.python.org/downloads，点击“Download Python 3.11.2”按钮进入下载页面（此数字会随着版本的升级而改变）。找到适合自己系统的下载链接，比如笔者为windows的64位系统，所以选择下载了“Windows installer (64-bit)”。双击下载所得的EXE可执行文件启动Python安装向导（图1）。

图1 Python安装向导

勾选“Add python.exe to PATH”项，这样就不用后期手动将Python程序添加到系统路径中了。点击“Install Now”即可自动安装。如果不希望安装到默认的C盘，可以点击“Customize installation”自定义安装项，根据向导提示一步步安装（图2）。

图2 Python自定义安装

作为初学者选择默认安装选项即可。安装成功后，对于Windows系统将会有一个“Disable path length limit（禁用路径长度限制）”的提示，这是因为Windows系统能够处理的文件路径长度有一定的限制（图3）。点击禁用这一限制可以避免处理长文件路径时出现的调试问题，不过这也可能导致与旧版本Windows 10的兼容性问题。对于我们初学者来说可以暂时跳过此选项，因为以后有需要时还可以修改注册表来解决。

图3 Python安装成功的界面

点击“Close”按钮关闭安装向导。现在我们测试Python是否安装成功。按Win+R键调出运行对话框，输入“cmd”后按回车键打开命令提示符窗口，然后输入“python”并按回车，如果能够显示出Python版本等信息内容，并且提示符变成了“>>>”，则表示安装成功了。此时可输入一行测试代码：

print("嗨，欢迎来到Python世界！")

按回车键执行，即可得到“嗨，欢迎来到Python世界！”的显示信息。几乎每种编程语言教程中都会展示一下“hello, world!”程序，虽然很俗套，但不得不说Python的实现是如此的简单。紧接着执行代码“exit”退出Python环境，完成此一阶段的测试（图4）。

图4 Python的“hello, world!”程序示例

命令提示符的界面过于简陋，我们可以试试Python自带的IDLE交互式开发环境。点击系统“开始”按钮，在开始菜单顶部的最近添加中就可以看到“IDLE(Pyton 3.11 64-bit)”程序了，点击即可打开。

IDLE通过不同的颜色区分代码及执行结果，清晰明了。尤其方便的是，当我们输入某个函数时，它会智能显示参数提示，辅助我们输入代码，非常方便（图5）。

图5 Python的IDLE交互式开发环境

除了一行一行的交互式执行，IDLE还可以执行扩展名为“py”的Python程序文件，下面就来做个测试。首先点击菜单命令“File→New File”打开IDLE的代码编辑器，输入以下代码：

# Python 3: 显示n个数以内的斐波纳契（Fibonacci）序列

def fib(n):

a, b = 0, 1

while a < n:

print(a, end=' ')

a, b = b, a+b

fib(1000)

代码解释：“#”后面的文字表示注释，是程序员对代码的说明，这是给阅读代码的人看的，Python解释器会自动忽略这一行。接下来的“def fib(n):”定义了一个名为“fib”的函数，其后缩进的几行代码就是该函数的内容，其主体是一个“while”循环，通过斐波纳契数列公式反复运算，运算结果通过“print”函数显示出来，其参数“end=' '”表示每个数字后面加几个空格，是为了将数字隔开（用来显示的print函数在后面的示例中将频繁出现）。当然，函数定义只是表明此函数能做什么，真正运行还得对它进行调用，这就是最后一行代码“fib(1000)”的作用，在调用该函数时，传递了一个参数“1000”，表示要计算1000以内的斐波纳契数列（图6）。

图6 斐波纳契数列计算

对于初学者来说可能还理解不了这段代码，没有关系，这正是后文要介绍的内容。现在按Ctrl+S键保存，在打开的保存对话框中输入文件名（本例取名为“Fibonacci”），这里无需手动添加“py”后缀，它会自动添加（图7）。

图7 保存Python程序文件

保存完毕，点击代码编辑器的菜单命令“Run→Run Module”，或者直接按F5键，即可运行这段代码了。下次在IDLE中，随时可以执行菜单命令“File→Open”打开“Fibonacci.py”文件，并按F5键运行（图8）。

图8 斐波纳契数列计算程序的输出结果

PyCharm——Python开发好伴侣

IDE是Integrated Development Environment的缩写，意为集成开发环境，主要用来辅助程序开发。Python并不一定需要IDE，因为它可以在任何文本编辑器中编写并从命令行运行。但是IDE可以提供许多辅助功能，例如代码调试、智能完成和语法高亮显示等。另外，IDE还可以提供重构、代码导航和项目管理等工具，这些工具可以帮助我们更快、更轻松地编写Python代码，并且可以更轻松地调试和维护代码。

Python开发人员有多种IDE可用，相对来说PyCharm是个非常不错的选择，它可以让Python开发过程变得更加轻松和高效。值得称道的是，PyCharm提供一个强大的社区版本，可以免费使用，并且可以在网上获得免费支持。

首先进入PyCharm主页https://www.jetbrains.com/pycharm，点击“DOWNLOAD”按钮进入下载频道，在“Windows”选项卡下可以看到“Professional（专业版）”和“Community（社区版）”两种版本，其中社区版是免费的，点击其下的“Download”按钮下载即可。比较而言，社区版缺少对科学工具、网站开发、Web框架、远程开发、数据库等的支持，不过对于一个初学者来说，这些影响不大（图9）。

图9 PyCharm专业版和社区版功能比较

双击下载所得的EXE文件启动安装向导，点击“Next”按钮进入下一步，根据向导提示选择安装位置，创建快捷方式以及关联py文件等，最后点击“Install”进行安装即可。安装完成，需要重新启动系统（图10）。

图10 PyCharm社区版安装向导

重启系统后，点击“开始”按钮，在开始菜单顶部的最近添加项中点击“PyCharm Community Edition 2022.3.2 ”启动PyCharm。第一次使用PyCharm需要进行一些设置，首先显示用户协议，只有勾选“I confirm that I have read and accept the terms of this User Agreement”（同意该协议）才可以继续。单击“Continue”按钮进入数据共享页面，如果不希望自己的数据被搜集，可以点击“Don't Send（不发送）”按钮继续，进入PyCharm的欢迎界面（图11）。

图11 PyCharm欢迎界面

在“Projects”选项卡下点击“New Project”按钮新建一个项目，接下来设置新项目的保存位置和名称（Location）。另外我们还得给PyCharm选定一个Python解释器，本例中笔者勾选了“New environment using”项，选择“Virtualenv”，可以看到其所用的解释器正是前文所安装的Python.exe（图12）。

图12 PyCharm新建项目窗口

设置完毕，点击“Create”按钮即可进入PyCharm主界面，可以看到新项目中已经自动生成了一个包含多行代码的Python文件“main.py”，这是因为本例在新建项目窗口中笔者勾选了“Create a main.py welcome ”项。点击菜单命令“Run→Run 'main.py'”，或者按Shift+F10快捷键，主界面下方即可实时运行该程序（图13）。

图13 包含了预置文件的PyCharm文档

我们可以在此项目中添加新的文件。点击菜单命令“File→New”打开新建对话框，可以选择多种文件类型，如网页文件、资源文件等，这里笔者选择创建Python文件（图14）。

图14 PyCharm可以创建多种类型的文件

接下来为新文件取一个名称，我们继续以上文中的斐波纳契数列为例，所以将文件名设置为“Fibonacci”，按回车键回到主界面，输入上文中斐波纳契数列的示例代码，然后点击菜单命令“Run→Run”，在弹出的窗口中单击刚刚创建的“Fibonacci.py”即可运行它并在主界面下方显示出运行结果了。在手动输入代码时，能够明显感受到PyCharm的智能提示、自动补全、代码检查、快速修复等功能的强大，可以大大提高工作效率（图15）。

图15 PyCharm的智能提示和自动补全功能

PyCharm功能丰富，很难在一遍短文中讲清楚，本文我们只需了解它的基本使用方法就够了。下面我们将着重分析Python的语法和程序结构。

Python的数据类型和数据结构

计算机科学领域有一个著名的公式：计算机程序=数据结构+算法。这一公式表明，数据结构是程序的核心，而算法是解决问题的步骤。所以我们在学习某一编程语言的时候，很有必要先了解一下它的数据类型和数据结构。

Python支持各种数据类型和数据结构，它们具有不同的属性和特性，可以用于不同的任务。下面是Python中常用的数据类型和数据结构的介绍。

Python简单数据类型常见的有以下几种（图16）：

1、整数类型（int）

整数类型是Python中最基本的数据类型之一。它代表整数值，可以是正数、负数或零。在Python中，整数没有大小限制。

2、浮点数类型（float）

浮点数类型代表实数值，即包含小数点的数字。在Python中，浮点数也没有大小限制。

3、布尔类型（bool）

布尔类型代表真和假两个值，分别用True和False表示。布尔类型通常用于条件判断和循环控制中。

4、字符串类型（str）

字符串类型代表文本，即一系列字符的序列。字符串用单引号、双引号或三引号表示。三引号可以将多行文本括起来。Python中的字符串是不可变的，也就是说，一旦创建了字符串，就不能修改它的值。

图16 Python中常见的数据类型示例

Python常见的数据结构有以下几种（图17）：

1、列表（list）

列表是Python中最常用的数据结构之一，它是一个有序、可变的集合。列表中的元素可以是不同的数据类型。可以使用索引等操作来访问和修改列表中的元素。列表用中括号“[]”表示。

2、元组（tuple）

元组是另一个有序的集合，它是不可变的。元组中的元素可以是不同的数据类型。与列表不同，元组不能修改。元组用小括号“”表示。

3、集合（set）

集合可以包含不同的元素，它是无序的，没有重复的值。集合可以用于集合运算，例如并集、交集和差集。集合用大括号“{}”表示。

4、字典（dict）

字典是Python中的映射类型，它是无序的键值对集合，没有重复的值。每个键都必须是唯一的，但值可以重复。可以使用键来访问和修改字典中的值。字典也用中括号“{}”表示，只是其中的数据都是键值对形式。

图17 Python常见的数据结构示例

以上只是Python中最基本和最常用的数据类型及数据结构。除此之外，Python还有其他一些数据类型，例如字节类型（bytes）、字节数组（bytearray）、内存视图（memoryview）、范围类型（range）、空类型（none）等等，这里不再一一细述。熟悉这些数据类型和数据结构的特性和用法，可以帮助我们更好地编写Python程序。

Python变量及赋值

如前文所述，计算机程序就是数据+算法。当一个程序运行时，其相关数据被加载到内存中。内存如同一个大仓库，被分割为一个个小库房。当程序需要使用某个库房时，首先要做一个声明，表示要占用该库房，并为其贴上一个标签。用编程术语来说，就是“声明”了一个“变量”。声明变量后，就可以在里面储存各色货物（数据）了，编程术语称之为“赋值”，这一操作通过等号运算符“=”来实现，等号左侧为变量名称，等号右侧即赋予该变量的数据。以下代码显示了Python中的几种赋值方式：

x = 1

x += 1

x, y, z = 1, 2, "Hello!"

x = y = z = 99.9

第1种是基本赋值，使用“=”将值赋给变量。

第2种是增量赋值，将一个值添加到变量的现有值中。假设变量x的初始值为1，那么“x += 2”就将x的值变成了1加2等于3了。这其实是一种复合运算符赋值，如果将等号前的加号换成减号（x -= 2）则x将被赋值为1减2等于“-1”，如果将加号换成乘号（x *= 2）将得到1乘2等于2的值，以此类推。

第3种是多元赋值，如果需要赋值的变量很多，可以将它们放到一行中进行赋值，只需用逗号将每个变量隔开即可，等号后面各变量对应的赋值也同样用逗号隔开。

第4种是链式赋值，适用于将同样一个数据同时赋值给多个变量。

理论上来说变量名可以由任意字符组成，不过Python对变量命名实际还是有一定限制的，规则要求：变量名只能由字母、数字和下划线组成，且不能以数字开头，另外变量名不能是Python关键字。比如“num_01”是合法变量名，而“01_num”则是非法变量名。再比如“my_var_name”是合法的，而带空格的“my var name”则是非法的。另外像“if”、“while”、“for”等Python所保留的关键字是不能用来做变量名的。对于Python变量名还有一点需要注意，就是它是区分大小写的，像“mytime”和“myTime”，这实际上是两个变量。

变量还有一个重要属性，即变量的类型，它规定了变量能够储存什么样的数据。变量类型即上文所介绍的各类数据类型。其实所谓布尔类型（bool）、整数类型（int）、浮点数类型（float）、字符串类型（str）等等，只是一个形象说法，其本质就是定义了该变量占用多大的空间，比如1个布尔变量只占用1位空间，而一个整数变量则需要8位（1字节）空间。其他编程语言，比如C++、JAVA等，声明一个变量时需要明确声明其数据类型，而Python则省略了这一步，它直接通过所赋值的数据来自动确定该变量的类型，比如“x = 1”自动将x设置为整数类型，而“x = 99.9”则自动将x设置为浮点数类型。

Python表达式和运算符

如果说变量是程序的“词汇”，那么表达式就是程序的“句子”。词汇量再丰富，不把它们组织成句子就毫无意义。Python中的表达式，是指由运算符、操作数（变量和值）和函数调用一起构成的组合，用以计算某种值的的公式。表达式总是会被计算并返回一个结果。

运算符是构成表达式的重要元素，它相当于粘合剂将数据连接到一起，作为算法的“执行者”它对变量和值进行操作。Python中的运算符大致分为以下七大类。

1、算术运算符：这类运算符执行基本的算术运算，如加(+)、减(-)、乘(*)、除(/)、模(%)和取幂(**)。以下代码中，首先声明了a、b两个整数变量并分别赋值，然后对它们依次进行了加、除、模等算术运算，并通过print函数打印出运算结果（见其后的注释语句，下同）。

# Arithmetic operators

a = 5

b = 2

print(a + b) # Output: 7

print(a / b) # Output: 2.5

print(a % b) # Output: 1

2、比较运算符：这类运算符比较两个值并返回一个布尔值(True或False)。它们包括等于(==)、不等于(!=)、大于(>)、小于(<)、大于或等于(>=)和小于或等于(<=)。以下代码首先声明了x、y两个整数变量并分别赋值，然后依次进行了大于和等于这两种比较运算，其计算结果，x大于y是对的，所以返回结果True（真），而x==y显然是错误的，所以返回结果为Flase（假）。

# Comparison operators

x = 10

y = 5

print(x > y) # Output: True

print(x == y) # Output: False

3、逻辑运算符：这类运算符对布尔值执行逻辑操作。它们包括逻辑与(AND)、逻辑或(OR)和逻辑非(NOT)。以下代码首先声明了a、b两个布尔变量，分别赋值为True（真）和Flase（假）。同一件事不可能同时又真又假，这个判断显然是错误的，所以逻辑与运算“a and b”返回的结果是False（假）。而一件事或者是真或者是假，必居其一，这个判断是正确的，所以逻辑或运算“(a or b)”返回的结果为True（真）。

# Logical operators

a = True

b = False

print(a and b) # Output: False

print(a or b) # Output: True

4、位运算符：这类运算符对二进制值执行位操作。包括按位与(&)、按位或(|)、按位异或(^)、按位取反(~)、左移(<<)、右移(>>)。以下代码中，首先声明了x、y两个整数变量，不过它们的赋值采用的二进制，所以数字前面加上了“0b”标志，其中二进制的1010等于十进制的10，二进制的1100等于十进制的12。最后两行代码分别对两个变量进行了按位与以及按位或运算，得到了8和14的运算结果。

# Bitwise operators

x = 0b1010 # Binary representation of 10

y = 0b1100 # Binary representation of 12

print(x & y) # Output: 0b100 (binary representation of 8)

print(x | y) # Output: 0b1110 (binary representation of 14)

5、赋值运算符：这类运算符为变量赋值。上文已有详细介绍，此处不再赘述，下面仅举一个增量赋值的简单示例，“a += 2”表示在原有的值5之上再加2，所以最终赋值结果是7。

# Assignment operators

a = 5

a += 2

print(a) # Output: 7

6、标识运算符：这类运算符比较两个标识符的存储单元（内存地址），判断它们是不是引用自同一个对象（x is y），类似id(x) == id(y)，如果引用的是同一个对象则返回True，如果不是则返回False。反之，则判断两个标识符是不是引用自不同的对象（x is not y）。以下代码首先声明了一个列表变量，接着又将该变量的地址赋值给了变量y，这两个变量实际指向的是同一个内存地址，所以“x is y”的标识运算结果为True（真）。反之，变量z虽然也是一个列表，并且其值和x相同，但它们并不在同一个内存地址上，所以“x is z”的标识运算结果为False（假）。

# Identity operators

x = [1, 2, 3]

y = x

z = [1, 2, 3]

print(x is y) # True

print(x is z) # False

7、成员关系运算符：这类运算符检查值是否为序列或集合的成员，它们包括in和not in。以下代码，通过“in”运算符指出2是列表numbers的成员，并以“not in”运算符指出6不是列表numbers的成员，这两个运算都是对的，所以返回的结果都为True（真）。

# Membership operators

numbers = [1, 2, 3, 4, 5]

print(2 in numbers) # Output: True

print(6 not in numbers) # Output: True

除了以上运算符表达式外，Python还有字符串表达式、函数调用表达式，以及针对列表、元组和字典进行运算的表达式。每一类表达式都有各自的特色，它们是编程的重要组成部分，理解它们如何工作对于编写有效的代码至关重要。

表达式是用来计算的，但是如何控制计算的流程和逻辑以实现特殊的算法，就需要用到控制语句了。和其他编程语言一样，Python的控制语句主要有三大类：顺序语句、条件语句（if语句）和循环语句（for语句和while语句）。其中顺序语句比较容易理解，即从先到后按顺序一条一条执行代码命令，我们上面的示例基本都是顺序语句。接下来我们重点介绍条件语句和循环语句。

条件语句

条件语句用于根据条件决定程序的执行路径，通常是实现分支选择。它的基本语法如下：

if condition:

# 如果condition为True，则执行这里的语句

elif condition2:

# 如果condition为False，但是condition2为True，则执行这里的语句

else:

# 如果上述所有条件都为False，则执行这里的语句

Python的条件语句使用if、elif和else关键字，其中if语句是必须的，elif和else语句是可选的。条件语句中的condition和condition2可以是任何返回布尔值的表达式，例如比较操作、逻辑操作或函数调用等。

下面是一个简单的例子，演示如何使用条件语句判断一个数是正数、负数还是零：

num = 5

if num > 0:

print("这个数是正数")

elif num == 0:

print("这个数是零")

else:

print("这个数是负数")

在这个例子中，如果num大于0，则打印出“这个数是正数”；否则，如果num等于0，则打印出“这个数是零”；当num小于0时，打印出“这个数是负数”。

注意，Python中缩进非常重要，因为它是区分代码块的方式。条件语句中的每个代码块必须缩进相同的空格数，通常是四个空格。

循环语句

循环语句用于重复执行一段代码。Python提供了两种循环语句：for循环和while循环。

for循环用于遍历序列（例如列表、元组、字符串等）中的每个元素。for循环的基本语法如下：

for variable in sequence:

# 在这里执行循环体代码

其中，variable是一个变量名，用于存储序列中当前遍历到的元素；sequence是一个序列，可以是列表、元组、字符串等。for循环将会遍历sequence中的每个元素，并将其赋值给variable，然后执行循环体代码，直到遍历完所有元素。

下面这个简单的例子演示了如何使用for循环遍历一个列表：

numbers = [1, 2, 3, 4, 5]

for num in numbers:

print(num)

这个例子中我们定义了一个列表numbers，然后使用for循环遍历列表中的每个元素，并将其赋值给变量num，最后打印出num的值（图18）。

图18 for循环遍历列表后输出

while循环重复执行一段代码，直到指定的条件不再满足。while循环的基本语法如下：

while condition:

# 在这里执行循环体代码

其中，condition是一个返回布尔值的表达式。只要condition为True，while循环就会一直执行循环体代码，直到condition变为False为止。

下面这个例子演示了如何使用while循环计算1到10的和：

total = 0

i = 1

while i <= 10:

total += i

i += 1

print("1到10的和为:", total)

本例我们定义了变量total和i，然后使用while循环重复执行计算1到10的和的代码，直到i大于10为止，最后打印出计算结果（图19）。

注意，在使用while循环时，必须确保条件可以在某个时刻变为False，否则循环将会无限执行下去，导致程序卡死。可以使用break语句或者修改循环变量的值来结束循环。

图19 while循环演示

Python函数定义和调用

函数是一组执行特定任务的代码，它可以重复使用，从而提高代码的重用性和可读性。在Python中，函数定义通常为以下格式：

def function_name(parameters):

"""

Docstring:函数的文档字符串，用于描述函数的用途和参数。

"""

# code block to be executed

return value # 可选

上述定义中，def是函数定义的关键字；function_name是函数的名称，由字母、数字和下划线组成；parameters是函数的参数，这是可选的，可以是零个或多个；Docstring是函数的文档字符串，用于描述函数的用途和参数，也是可选的；return是函数的返回值，同样也是可选的。

下面介绍一个简单的Python函数示例：

def greet(name):

"""

此函数对作为参数传送的人表达欢迎。

"""

print("嗨, " + name + "，欢迎光临！")

greet("韩梅梅")

本例定义了一个名为greet的函数，它带有一个参数name，用于向函数传递一个名称。函数的主体包括一个打印语句，它将问候语与传递的名称一起打印。函数定义后，需要调用它才能够执行，所以代码的最后是函数调用语句，并传递了一个名称“韩梅梅”（图20）。

图20 Python函数定义和调用

这只是一个简单的例子，函数可以执行比这更复杂的任务。函数的优点之一，就是它们可以帮助你将代码组织成更小、更易于管理的模块，并将代码分解为可维护的部分。函数还可以使用return语句返回值，允许将计算结果传递回调用代码。

Python的程序结构

上面学习了Python的基础知识，现在就让我们来了解一下完整的Python程序文件是什么样。一般来说，Python的程序结构通常由以下几个部分分组成。

1、导入模块：在程序的开头，我们通常需要导入需要使用的模块。这些模块包含Python内置的模块，也包括第三方库和自定义模块。例如：

import math

import numpy as np

from my_module import my_function

2、全局变量和常量：在程序的顶部，通常定义一些全局变量和常量。这些变量可以在程序的任何地方访问。例如：

PI = 3.14159

name = "John"

3、函数定义：在程序的中间通常定义各种函数，用于执行特定的任务。

4、主程序代码：程序底部通常编写主程序代码，用于执行程序的主要功能。主程序代码可以调用导入的模块、全局变量和常量以及定义的函数。例如：

import math

PI = 3.14159

def area_of_circle(radius):

return PI * radius ** 2

def main:

r = 5

area = area_of_circle(r)

print("The area of the circle with radius", r, "is", area)

if __name__ == '__main__':

main

本例我们定义了一个计算圆的面积的函数area_of_circle，然后在主程序代码中使用该函数计算圆的面积并输出结果。

注意，在这个例子中，我们使用“if __name__ == '__main__':”语句来检查是否在运行当前模块。如果模块是主程序运行的，它将执行main函数，否则将忽略它。这个语句通常用于避免在模块被导入时执行一些不必要的代码。

总之，在Python中，程序结构的规范化编写有助于使代码更易于阅读、理解和维护。对于大型项目，通常需要更复杂的程序结构和更具体的组织方式，例如使用面向对象编程。

Python编程实战

使用Python的优势之一就是有大量的第三方库可以使用，我们无需从头开发，即可实现非常专业的应用。下面的实战，我们通过Python加第三方库的方式对Excel表格进行处理。

假设我们有一个记录全班同学考试成绩的原始Excel文件，其中包括每个人的姓名、学号及各科成绩的数据（图21）。现在因为某种需求，要把其中的“姓名”和“语文成绩”两列数据提取出来，单独保存为新的Excel文件。

图21 学生成绩数据

能够处理Excel文件的第三方库有不少，这里我们选用的是Openpyxl。开始之前请先安装它，操作极其简单。打开Windows的命令提示符窗口，执行“pip install openpyxl”命令即可（图22）。

图22 通过pip命令安装Python第三方库

我们也可以在PyCharm中安装这个库。点击窗口底部的“Python Packages”选项打开一个窗格，然后在搜索框中输入“openpyxl”，找到之后点击右侧的“Install package”按钮即可安装（图23）。

图23 在PyCharm中安装Openpyxl库

需要注意的是，Openpyxl库只支持xlsx格式的Excel文件，不支持旧版的xls文件。万事俱备，接下来就可以PyCharm中编写Python程序了：

import openpyxl

# 打开原始Excel表格文件

workbook = openpyxl.load_workbook('原始数据.xlsx')

# 选择原始Excel表格中的第一个工作表

worksheet = workbook.active

# 创建一个新的工作簿

new_workbook = openpyxl.Workbook

# 选择新工作簿中的第一个工作表

new_worksheet = new_workbook.active

# 将原始Excel表格中的“姓名”和“语文成绩”两列数据提取出来，并添加到新工作表中

for row in worksheet.iter_rows(values_only=True):

name, score = row[0], row[3]

new_worksheet.Append([name, score])

# 保存新工作簿到Excel文件中

new_workbook.save('姓名与语文成绩.xlsx')

上述程序首先通过“import openpyxl”语句导入Openpyxl库，然后使用“openpyxl.load_workbook”函数打开原始Excel表格文件，该函数将返回一个Workbook对象，存储在名为workbook的变量中。接下来，使用workbook.active选择原始Excel表格中的第一个工作表，该工作表将作为程序读取数据的来源。

接着，使用“openpyxl.Workbook”函数创建一个新的工作簿，将返回一个Workbook对象，存储在名为new_workbook的变量中。使用new_workbook.active选择新工作簿中的第一个工作表，该工作表将作为程序写入数据的目标。

然后，使用“worksheet.iter_rows”函数迭代原始Excel表格中的每一行数据，其中values_only=True表示只返回单元格的值。在每次迭代中，使用row[0]和row[3]提取出当前行中的“姓名”和“语文成绩”两列数据，分别存储在名为name和score的变量中。最后，使用“new_worksheet.append”函数将name和score写入到新工作表中。

最后，使用“new_workbook.save”函数将新工作簿中的数据保存到Excel文件中，文件名为“姓名与语文成绩.xlsx”。

将原始数据Excel文件和Python程序文件放到同一个文件夹中，按Shift+F10键运行程序，即可在该文件夹中保存一个仅有“姓名”和“语文成绩”两列的新的Excel文件了（图24）。

图24 运行程序得到新的Excel文件

当然，Python编程内容丰富，不是一篇文章就能介绍完的。如果本文能为大家学习Python带来些许的帮助，笔者也就知足了。 CF

原文刊登于2022 年 12月15 日出版《电脑爱好者》第 24 期

END