使用Python Pandas库读取excel文件(.xlsx, .xls)。 使用pandas的 read_excel()方法来读取excel数据,可以读取第一个sheet,指定的sheet,多个sheet或所有的sheet。Pandas会将这些数据转化成一个 DataFrame结构,它是一个扁平的结构来的。接着就可以对数据进行数据分析了。
1.安装Anaconda3
我们使用anaconda3来安装和管理python库。在Anaconda的官方网站下载一个下来安装即可。
2.安装xlrd
Pandas的read_excel方法内部会使用xlrd库。xlrd是一个用于读取excel文件(.xlsx, .xls)的库。使用Anaconda安装xlrd库:
$ conda install xlrd1
3.安装pandas
作为本篇的主角pandas,当然是要安装的了。
$ conda install pandas1
4.使用pandas读取excel数据
默认读取第一张sheet。
import pandas as pd
df = pd.read_excel('sample.xlsx')
print(df)1
2
3
4
5
6
4.1.读取指定sheet的数据
通过指定read_excel方法的sheet_name参数来指定。可以通过数字来指定是第几张:
import pandas as pd
df_sheet_index = pd.read_excel('sample.xlsx', sheet_name=1)
print(df_sheet_index)1
2
3
4
5
也可以直接指定sheet的名字:
import pandas as pd
df_sheet_name = pd.read_excel('sample.xlsx', sheet_name='sheet2')
print(df_sheet_name)1
2
3
4
5
4.2.读取多张sheet的数据
可以通过数字或名称来指定这几张sheet。
import pandas as pd
df_sheet_multi = pd.read_excel('sample.xlsx', sheet_name=[0, 'sheet2'])
print(df_sheet_multi)1
2
3
4
5
4.3.读取所有的sheet
import pandas as pd
df_sheet_all = pd.read_excel('sample.xlsx', sheet_name=None)
print(df_sheet_all)1
2
3
4
下一篇《用pandas做数据分析》
文章来源: ,作者:WongKyunban,版权归原作者所有,如需转载,请联系作者。
原文链接:/weixin_40763897/article/details/109155716
如果觉得《python pandas处理excel 统计数据_python使用pandas处理excel数据》对你有帮助,请点赞、收藏,并留下你的观点哦!