如何用 Python 批量处理 Excel 文件? 随着数据的不断增长和业务的扩张,Excel 工作表已逐渐成为数据管理和统计分析的常用工具。然而,当我们需要同时处理成千上万个 Excel 文件时,手动操作将变得异常繁琐和耗时,这时候就需要借助 Python 这个强大的工具来批量处理这些文件。 本文将介绍如何使用 Python 进行批量处理 Excel 文件,涵盖以下技术知识点: 1. Python 基本语法 2. Pandas 库的基本使用 3. 使用 os 库操作文件 4. 循环遍历文件夹中的 Excel 文件 1. Python 基本语法 在 Python 中,使用“#”来注释代码,这样可以提高代码的可读性和可维护性。 下面是一个简单的 Python 示例,其中我们使用 print 函数来输出“Hello, World!”这个字符串: ``` # 输出 Hello, World! print("Hello, World!") ``` 2. Pandas 库的基本使用 Pandas 是一个强大的数据处理库,它支持读取和写入各种格式的数据,包括 Excel、CSV、JSON 等等。 我们可以使用 Pandas 库来处理 Excel 文件,并对数据进行分析和处理。下面是一个简单的 Pandas 示例,其中我们读取一个名为“example.xlsx”的 Excel 文件,并输出其中的所有行和列: ``` # 导入 Pandas 库 import pandas as pd # 读取 Excel 文件 df = pd.read_excel('example.xlsx') # 输出所有行和列 print(df) ``` 3. 使用 os 库操作文件 Python 中的 os 库提供了许多用于操作文件和目录的函数。我们可以使用它来获取文件信息、重命名文件、删除文件等等。 使用 os 库操作文件时,需要首先导入 os 库。下面是一个简单的 os 示例,其中我们使用 os 库的 listdir 函数来列出当前目录下的所有文件和文件夹: ``` # 导入 os 库 import os # 列出当前目录下的所有文件和文件夹 print(os.listdir('.')) ``` 4. 循环遍历文件夹中的 Excel 文件 最后,我们可以将上述技术知识点整合起来,使用 Python 来批量处理 Excel 文件。下面是一个代码示例,其中我们使用 Pandas 库读取每个 Excel 文件,并将它们合并成一个大的 Excel 表格,并将该表格保存为“output.xlsx”文件: ``` # 导入 Pandas 和 os 库 import pandas as pd import os # 定义 Excel 文件夹路径 excel_folder = 'path/to/folder' # 获取该文件夹下所有 Excel 文件的文件名 excel_files = [f for f in os.listdir(excel_folder) if f.endswith('.xlsx')] # 定义一个空的数据框 all_data = pd.DataFrame() # 循环读取每个 Excel 文件,并将其合并到 all_data 中 for file in excel_files: data = pd.read_excel(excel_folder + '/' + file) all_data = pd.concat([all_data, data]) # 保存合并后的数据为 Excel 文件 all_data.to_excel('output.xlsx') ``` 以上代码示例通过 os 库中的 listdir 函数获取 Excel 文件夹中的所有 Excel 文件的文件名,并通过 Pandas 库中的 read_excel 函数读取每个 Excel 文件的数据。接着,将读取到的数据使用 Pandas 库中的 concat 函数合并到一个数据框 all_data 中。最后,将 all_data 数据框保存为一个名为“output.xlsx”的 Excel 文件。 总结 通过本文介绍的技术知识点,我们可以使用 Python 和 Pandas 库来批量处理 Excel 文件,从而实现更方便、快捷、高效的数据管理和统计分析。同时,希望本文对 Python 和 Pandas 库的初学者有所帮助,让大家能够更好地掌握 Python 和数据处理的相关知识。