Python 中的 Excel 是数据分析师和专业人士中的热门话题,它提供了两个最基本的数据处理和分析工具的强大组合。Python 的灵活编程语言可用于自动化重复的 Excel 任务、处理复杂数据集以及创建有见地的数据可视化。通过将 Python 与 Excel 集成,用户可以利用这两个应用程序的优势来提高生产力、简化工作流并更深入地了解数据。在本文中,我们将探讨 Python 中 Excel 的优势以及它如何提高数据分析能力。
如何在 Python 中读取 Excel 文件
Python 是使用 Excel 的绝佳语言。借助 Python Excel 库,你可以轻松地处理 Excel 文件、分析数据和自动化任务。以下是如何将 Python 与 Excel 一起使用的两个示例
使用 pandas
读取和写入 Excel 文件
要使用 Python 读取和写入 Excel 文件,可以使用 pandas
库。要安装,请使用 pip install "pandas[excel]"
。以下是一个读取 Excel 文件并将其另存为新文件的代码片段
import pandas as pd
df = pd.read_excel('input_file.xlsx')
df['new_column'] = df['old_column'] * 2
df.to_excel('output_file.xlsx', index=False)
在此示例中,我们使用 read_excel()
函数读取输入文件,然后添加新列并将旧列乘以 2
,最后使用 to_excel()
函数将结果保存到新的输出文件。
使用 OpenPyXL 处理 Excel 文件
如果你需要对 Excel 文件进行更多控制,可以使用 OpenPyXL
库。要安装,请使用 pip install openpyxl
。以下是如何向现有工作簿添加新工作表的示例
from openpyxl import load_workbook, Workbook
wb = load_workbook('existing_workbook.xlsx')
new_ws = wb.create_sheet('New Worksheet')
new_ws['A1'] = 'Hello, world!'
wb.save('existing_workbook.xlsx')
在此示例中,我们使用 load_workbook()
加载现有工作簿,使用 create_sheet()
创建新工作表,向单元格 A1
添加值,最后使用 save()
保存更改。
使用 xlrd
读取和写入 Excel 文件
Xlrd 是一个用于从历史 .xls
格式的 Excel 文件中读取数据和格式信息的库。以下是如何使用 xlrd
读取 Excel 文件的示例代码片段
import xlrd
# specify path and filename of Excel file
file_path = 'path/to/file/excel_file.xls'
# open workbook
workbook = xlrd.open_workbook(file_path)
# get sheet by name
worksheet = workbook.sheet_by_name('Sheet1')
# read data from cells
cell_value = worksheet.cell_value(0, 0)
在上面的示例中,xlrd
库用于打开 Excel 文件。workbook.sheet_by_name
函数用于访问名为“Sheet1”的工作表。worksheet.cell_value
函数用于读取工作表单元格中的数据。在示例中,读取单元格 A1 的值。
在 Python 中创建新的 Excel 表格
如果你想在 Python 中创建新的 Excel 表格,可以使用 openpyxl
模块。此模块允许你创建、读取和修改 Excel 文件。
代码示例 1:openpyxl
import openpyxl
# Create a new Excel workbook
workbook = openpyxl.Workbook()
# Activate the first sheet
sheet = workbook.active
# Rename the first sheet
sheet.title = "New Sheet"
# Save the workbook
workbook.save("new_excel_sheet.xlsx")
代码示例 2:xlwt
import xlwt
# Create a new workbook
workbook = xlwt.Workbook()
# Add a new sheet to the workbook
sheet = workbook.add_sheet("New Sheet")
# Save the workbook
workbook.save("new_excel_sheet.xls")
这两个示例都将创建一个名为 New Sheet
的新 Excel 表格并将其保存到文件中。你可以修改代码以创建具有不同名称的工作表或向工作表添加数据。
在 Python 中打开不同目录的 Excel
要在 Python 中从不同的目录打开 Excel 文件,可以使用 Python 的 os
模块并将工作目录设置为所需的目录。然后,使用 pandas
库读取 Excel 文件。
import os
import pandas as pd
### set working directory to desired directory
os.chdir('/path/to/directory')
### read Excel file using pandas
df = pd.read_excel('excel_file.xlsx')
import pandas as pd
### read Excel file from a specific directory using pandas
df = pd.read_excel('/path/to/directory/excel_file.xlsx')
在这两个示例中,pd.read_excel()
函数用于读取 Excel 文件。第一个示例使用 os.chdir()
在读取文件之前将工作目录更改为所需的目录。第二个示例直接从特定目录读取 Excel 文件。
使用这些代码,可以轻松地在 Python 中从不同的目录打开 Excel 文件。