一.分组汇总数据
用法和参数
DataFrame.groupby(values)
values:分组的依据
实例
import pandas as pddata = pd.read_excel('产品统计表.xlsx')# 根据产品列对数据进行分组print(data.groupby('产品'))'''<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001CA43E176D0>'''# 根据分组信息求数据总和print(data.groupby('产品').sum())'''成本价(元/个) 销售价(元/个) 数量(个) 成本(元) 收入(元) 利润(元)产品 单肩包 116 248 121 7018 15004 7986手提包 36 14726 936 3822 2886背包 32 13083 1328 5395 4067钱包 180 374 128 11520 23936 12416'''# 分组后对某一列进行汇总计算print(data.groupby('产品')['利润(元)'].sum())'''产品单肩包7986手提包2886背包4067钱包12416Name: 利润(元), dtype: int64'''# 分组后对多列进行汇总计算print(data.groupby('产品')['数量(个)', '利润(元)'].sum())'''数量(个) 利润(元)产品单肩包 121 7986手提包26 2886背包83 4067钱包128 12416'''
二.创建数据透视表
描述
数据透视表可对数据表中的数据进行快速分组和计算
用法和参数
pandas.pivot_tabel(data, values=None, index=None, aggfunc=“mean”)
- data:要制作的DataFrame
- value:指定要计算的列
- index:指定一个列作为数据透视表的行标签
- aggfunc:指定参数values的计算类型
实例
import pandas as pddata = pd.read_excel('产品统计表.xlsx')# 根据数据表的某一列制作透视表a = pd.pivot_table(data, values='利润(元)', index='产品', aggfunc='sum')print(a)'''利润(元)产品 单肩包 7986手提包 2886背包 4067钱包 12416'''# 根据数据表的多列制作透视表b = pd.pivot_table(data, values=['利润(元)', '成本(元)'], index='产品', aggfunc='sum')print(b)'''利润(元)产品 单肩包 7986手提包 2886背包 4067钱包 12416利润(元) 成本(元)产品单肩包 7986 7018手提包 2886 936背包 4067 1328钱包 12416 11520'''
如果觉得《Python_Pandas_分组汇总数据和创建数据透视表》对你有帮助,请点赞、收藏,并留下你的观点哦!