分组
df.groupby
groupby()
方法是 Pandas 中用于对数据进行分组的重要函数。通过 groupby()
方法,你可以按照一个或多个列的数值进行分组,并对每个分组应用相应的聚合函数。
下面是 groupby()
方法的基本用法:
python
# 对 DataFrame 按照某列进行分组,并对另一列进行聚合操作
grouped = df.groupby('column_name')
# 对 DataFrame 按照多列进行分组,并对另一列进行聚合操作
grouped = df.groupby(['column1', 'column2'])
# 对分组后的数据应用聚合函数(例如求和、平均值等)
result = grouped['aggregation_column'].agg(['sum', 'mean', 'count'])
pd.Grouper()
pd.Grouper()
是 Pandas 中的一个函数,用于对时间序列数据进行分组操作。通常情况下,它用于结合 groupby()
函数,按照时间频率进行数据分组。
以下是 pd.Grouper()
的基本语法:
python
pd.Grouper(key=None, freq=None, axis=0, sort=False)
- 时间序列数据是index的时候:
python
# 不用写key,只写freq即可
pd.Grouper(freq='M')
- 时间序列数据就是普通的列的时候,
python
# 只需将 `key` 参数设置为时间列的名称即可。
pd.Grouper(key='date', freq='M')