引言

Python Pandas 是一个强大的数据分析库,它提供了高效的数据结构和数据分析工具。在数据处理过程中,数据读取与保存是两个关键步骤。本文将深入探讨如何使用 Pandas 轻松进行数据读取和高效保存。

数据读取

1. 读取CSV文件

CSV(逗号分隔值)是一种常见的文件格式,用于存储表格数据。Pandas 提供了 read_csv() 函数来读取 CSV 文件。

import pandas as pd # 读取CSV文件 df = pd.read_csv('data.csv') # 显示前5行数据 print(df.head()) 

2. 读取Excel文件

Excel 文件是另一种常用的数据存储格式。Pandas 提供了 read_excel() 函数来读取 Excel 文件。

# 读取Excel文件 df = pd.read_excel('data.xlsx') # 显示前5行数据 print(df.head()) 

3. 读取数据库

Pandas 支持从多种数据库中读取数据,例如 SQLite、MySQL 和 PostgreSQL。使用 read_sql() 函数可以读取数据库数据。

import sqlite3 # 连接数据库 conn = sqlite3.connect('database.db') # 读取数据库中的数据 df = pd.read_sql('SELECT * FROM table_name', conn) # 关闭数据库连接 conn.close() 

高效保存

1. 保存为CSV文件

将数据保存为 CSV 文件是 Pandas 中的一个常见操作。使用 to_csv() 函数可以轻松实现。

# 保存为CSV文件 df.to_csv('output.csv', index=False) 

2. 保存为Excel文件

将数据保存为 Excel 文件也非常简单,使用 to_excel() 函数即可。

# 保存为Excel文件 df.to_excel('output.xlsx', index=False) 

3. 保存为数据库

Pandas 还支持将数据保存到数据库中。使用 to_sql() 函数可以实现这一功能。

# 将数据保存到数据库 df.to_sql('table_name', conn, if_exists='replace', index=False) 

总结

本文介绍了 Python Pandas 中数据读取和保存的技巧。通过使用 Pandas 的 read_csv()read_excel()read_sql() 函数,可以轻松读取各种格式的数据。同时,使用 to_csv()to_excel()to_sql() 函数可以高效地将数据保存为不同格式。希望本文能帮助您更好地掌握 Pandas 的数据读取与保存技巧。