当前位置:首页 > 随笔 > 正文内容

使用Python连接数据库并提取数据的完整指南

访客 随笔 2026年6月11日 1

引言

在现代数据分析和后端开发中,Python因其简洁语法和强大的生态系统成为首选语言之一。其中,从数据库中读取数据是常见且关键的操作。本文将介绍如何通过Python连接主流关系型数据库(如MySQL、PostgreSQL和SQLite),执行查询并安全地获取结果。

准备工作:安装依赖库

不同数据库需要对应的驱动程序来与Python交互。以下是常用数据库的连接库及其安装方式:

  • MySQL:使用 pymysqlmysql-connector-python
    安装命令:pip install pymysql
  • PostgreSQL:使用 psycopg2
    安装命令:pip install psycopg2-binary
  • SQLite:Python内置 sqlite3 模块,无需额外安装

通用操作流程

无论使用哪种数据库,基本的数据提取流程都包括以下几个步骤:

  1. 导入库
  2. 建立数据库连接
  3. 创建游标对象
  4. 执行SQL语句
  5. 提取查询结果
  6. 关闭资源

具体实现示例

1. 连接 MySQL 数据库

import pymysql

# 建立连接
conn = None
try:
    conn = pymysql.connect(
        host='127.0.0.1',
        port=3306,
        user='root',
        password='your_password',
        database='test_db',
        charset='utf8mb4'
    )

    # 创建游标并执行查询
    with conn.cursor() as cur:
        cur.execute("SELECT id, name, age FROM users WHERE age > %s", (18,))
        results = cur.fetchall()

        for record in results:
            print(f"ID: {record[0]}, Name: {record[1]}, Age: {record[2]}")

except Exception as e:
    print(f"数据库错误: {e}")
finally:
    if conn:
        conn.close()

2. 连接 PostgreSQL 数据库

import psycopg2

try:
    conn = psycopg2.connect(
        host="localhost",
        database="myapp",
        user="admin",
        password="secret",
        port=5432
    )

    with conn.cursor() as cur:
        cur.execute("SELECT * FROM products ORDER BY price DESC LIMIT 10")
        rows = cur.fetchall()
        for row in rows:
            print(row)

except psycopg2.Error as e:
    print(f"PostgreSQL 错误: {e}")
finally:
    if conn:
        conn.close()

3. 使用 SQLite(无服务器模式)

import sqlite3

# 连接本地数据库文件
with sqlite3.connect('local_data.db') as conn:
    cursor = conn.cursor()
    cursor.execute("CREATE TABLE IF NOT EXISTS logs (id INTEGER PRIMARY KEY, message TEXT, timestamp DATETIME)")
    cursor.execute("INSERT INTO logs (message, timestamp) VALUES (?, datetime('now'))")

    # 查询数据
    cursor.execute("SELECT * FROM logs")
    for log in cursor.fetchall():
        print(log)

结果处理方法对比

方法 说明 适用场景
fetchone() 返回单行数据,格式为元组 逐行处理大数据集,节省内存
fetchall() 返回所有结果,格式为元组列表 结果集较小,需一次性加载
fetchmany(n) 返回最多 n 行数据 分批读取,平衡性能与内存

最佳实践建议

  • 使用参数化查询:避免SQL注入攻击,例如 WHERE id = %s 而非字符串拼接
  • 善用上下文管理器:利用 with 自动释放游标和连接
  • 异常捕获:对连接失败、权限不足等情况进行合理处理
  • 连接池优化:高并发应用可引入 DBUtils 或 ORM 框架中的连接池机制

各数据库特性简析

MySQL:广泛用于Web应用,支持主从复制和读写分离,适合中高流量系统。
PostgreSQL:支持JSON、GIS、窗口函数等高级功能,适合复杂分析场景。
SQLite:零配置、单文件存储,适用于移动端或小型工具类项目。

掌握这些基础技能后,可以进一步结合 pandas 的 read_sql_query() 实现数据分析流水线,或将数据库操作封装成服务接口供其他模块调用。

相关文章

可以按小时收费的VPS

很多 VPS 提供商都支持 按小时计费(hourly billing),想短期试用 / 临时搭建节点、测试网络、短期项目等场景非常合适。下面是当前最主流且靠谱的按小时 VPS 选项,分别按不同需求场景整理: 1. Vultr(全球节点,包括日本) 按小时计费 可选机房:东京 / 大阪 / 洛杉矶 / 法兰克福 / 伦敦 … 支持 PayPal(部分情况),但更常用信用卡/PayPal+卡价格参考$...

在 iPhone 上下载国外App

地区/国家限制App Store 会根据 Apple ID 的国家或地区限制应用下载。如果你的 Apple ID 绑定的是中国大陆,就可能无法下载 OpenAI 官方的 ChatGPT 应用,因为它在大陆 App Store 不上架。解决办法:换成美国、加拿大、香港等地区的 Apple ID。或者在现有 Apple ID 上更改地区。注册一个国外 Apple ID(推荐)比如注册 美国区 Appl...

Selenium自动化测试入门指南

Selenium自动化测试入门指南

什么是自动化测试? 自动化测试是指利用软件工具自动执行测试用例,模拟用户操作,如打开网页、点击链接、输入文本等,并验证结果是否符合预期。 其主要优点包括: 大幅减少人工成本 测试速度快 可以在非工作时间运行 支持持续集成和交付 然而,它也存在一些局限性,例如开发成本较高、不适合快速变化的项目、依赖稳定的UI界面等。 自动化测试的应用条件 适合引入自动化测试的情况包括: 手动测试耗时且需要大量...

MariaDB Galera集群故障快速恢复指南

OpenStack控制节点采用三节点MariaDB Galera集群架构。当数据库集群因故障重启时,有时会出现Galera集群无法正常启动的问题。虽然有多种方法可以恢复数据库服务,但如何实现快速启动同时确保数据完整性呢? 通过分析日志发现,MariaDB Galera集群节点宕机时会在日志中输出以下信息: [Note] WSREP: 新集群视图:全局状态: 874d8e7e-5980-11e8-8...

Android 中 EventBus 的通信机制与实现原理深度解析

EventBus 核心设计思想 EventBus 是一个基于观察者模式的事件总线框架,广泛应用于 Android 平台以实现组件解耦。它通过中心化的消息分发机制,使不同层级、不同线程的对象能够以"发布-订阅"方式通信,避免了传统接口回调或广播带来的强依赖问题。 核心角色说明 事件(Event):任意 Java 对象,作为数据载体,如网络状态变更通知、用户登录信息等。 发布者(Publi...

二叉树基础操作实现(C语言)

二叉树基础操作实现(C语言)

二叉树遍历方法 以下为二叉树结构示例 前序访问实现: void traversePreOrder(TreeNode* node) { if (node == NULL) { printf("N "); return; } printf("%d ", node->value); trave...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。