你知道Python有内置数据库吗？Python内置库SQlite3使用指南

2020-08-04

加入收藏

如果你是软件开发人员，相信你一定知道或者曾经使用过一个非常轻量级的数据库——SQLite。它具有作为关系数据库所需的几乎所有功能，但是这个数据库把所有功能都保存在一个文件中。在其官方网站上，SQLite的主要应用场景包括：

嵌入式设备和物联网
数据分析
数据传输
文件存档或数据容器
内部或临时数据库
在演示或测试期间替代企业数据库
教育、培训和测试
实验性SQL语言扩展

当然，SQLite还有很多其他功能，在此不一一列举，感兴趣的同学可以去看官方文档：https://www.sqlite.org/whentouse.html

最重要的是，SQLite实际上是作为Python库内置的。换言之，你不需要安装任何服务器端/客户端软件，也不需要运行某个服务，只要你在Python中导入库并开始编程，那么你就有了一个关系数据库管理系统！

导入和使用

这里我们说“内置”的意思就是，你甚至不需要运行 pip install ，就能获取库。只需要通过以下方式导入：

import sqlite3 as sl

1.创建与数据库的连接

我们根本不需要为驱动程序、连接字符串等烦恼。可以直接创建一个 SQLite 数据库，并拥有一个简单的连接对象：

con = sl.connect('my-test.db')

运行此行代码后，我们就已经创建并连接到该数据库上。如果要求Python连接的数据库不存在，它就会自动帮我们创建一个空数据库。如果我们已经创建了数据库，就能用上面完全相同的代码连接到现有数据库。

2.创建表格

接下来，我们先创建一个表格。

with con:
    con.execute("""
        CREATE TABLE USER (
            id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,
            name TEXT,
            age INTEGER
        );
    """)

在这个 USER 表中，我们添加了三列。正如我们所看到的，SQLite 确实是轻量级的，但是它支持常规 RDBMS 应该具有的所有基本特性，例如数据类型、可为null、主键和自动递增。

运行这段代码之后，我们就已经创建好了一个表，尽管它什么都没有输出。

3.插入记录

让我们在刚刚创建的 USER 表中插入数据记录，这也可以证明我们确实创建了它。

如果我们需要一次性插入多个记录，Python中的SQLite也能很容易地实现这一点。

sql = 'INSERT INTO USER (id, name, age) values(?, ?, ?)'
data = [
    (1, 'Alice', 21),
    (2, 'Bob', 22),
    (3, 'Chris', 23)
]

我们需要用问号作为占位符来定义SQL语句。接下来就是创建一些要插入的示例数据。使用连接对象，就能插入这些示例行。

with con:
    con.executemany(sql, data)

在运行代码之后，没有报错，那就是成功的。

4.查询表格

接下来，我们通过实际的方式来验证我们所做的一切，通过查询表格来获取示例行。

with con:
    data = con.execute("SELECT * FROM USER WHERE age <= 22")
    for row in data:
        print(row)

你可以看到，很简单就得到了结果。

此外，尽管 SQLite 是轻量级的，但是作为一个广泛使用的数据库，大多数SQL客户端软件都支持使用它。

我自己用得最多的是 DBeaver，接下来给大家介绍一下。

5.从SQL客户端（DBeaver）连接到SQLite数据库

因为我用的是 googlecolab，所以我要将 my-test.db 文件下载到我的本地计算机上。当然，你也可以直接在你的电脑上使用 Python 数据库连接你的本地数据库。

在 DBeaver 中，创建一个新连接并选择 SQLite 作为数据库类型。

然后，浏览DB文件。

现在你可以在数据库上运行任何SQL查询，看看它与其他常规关系数据库有什么不同。

与Pandas无缝连接

你以为就只有这些？不，事实上，作为Python的一个内置特性，SQLite 可以与 Pandas 数据帧无缝连接。

让我们先来定义一个数据帧。

df_skill = pd.DataFrame({
    'user_id': [1,1,2,2,3,3,3],
    'skill': ['Network Security', 'Algorithm Development', 'Network Security', 'JAVA', 'Python', 'Data Science', 'machine Learning']
})

然后，我们可以简单地调用数据帧的to_sql（）方法将其保存到数据库中。

df_skill.to_sql('SKILL', con)

就这样我们甚至不需要预先创建表，列的数据类型和长度都会被推断出来。当然，如果你想的话，你也可以先定义。

然后，假设我们要将表 USER 和 SKILL 连接在一起，并将结果读入Pandas数据框。

df = pd.read_sql('''
    SELECT s.user_id, u.name, u.age, s.skill 
    FROM USER u LEFT JOIN SKILL s ON u.id = s.user_id
''', con)

是不是很厉害？让我们把结果写到一个名为USER_SKILL的新表中。

df.to_sql('USER_SKILL', con)

我们也可以用SQL客户端来检索表。

总结

实际上，Python中还隐藏着很多惊喜。而且这些惊喜并不没有隐藏起来，只是Python有太多现成可以直接使用的特性了，这就导致很多人无法发现这些特性。

在本文中，我介绍了如何使用 Python 内置库 sqlite3 在 SQLite 数据库中创建和操作表。它也支持对表格进行更新和删除操作，建议大家在看完这篇文章之后自己尝试一下。

最重要的是，我们可以轻松地将表从 SQLite 数据库读入 Pandas 数据帧，反之亦然。这使我们能够更容易地与我们的轻量级关系数据库进行交互。

你可能会注意到 SQLite 没有进行身份验证，这也是它刻意设计的行为，因为需要轻量化。

一起去探索Python中更多令人惊讶的特性吧！

--END--

作者：Christopher Tao

原文链接：https://towardsdatascience.com/do-you-know-python-has-a-built-in-database-d553989c87bd

编译：未艾信息（www.weainfo.net）

喜欢本文的同学记得转发+点赞~

更多内容，欢迎大家关注我们的公众号：为AI呐喊（weainahan）