Pandas 数据框如何用 Groupby() 函数分组并计算均值

2025-01-09 01:37:21   小编

Pandas 数据框如何用 Groupby() 函数分组并计算均值

在数据处理和分析领域,Pandas是Python中非常强大的库之一。它提供了丰富的数据结构和函数,使得数据的处理和分析变得更加高效和便捷。其中,Groupby()函数是一个非常重要的函数,它可以对数据框进行分组操作,并对分组后的数据进行各种计算,比如计算均值。

我们需要导入Pandas库并创建一个数据框。假设我们有一个包含学生信息的数据框,其中包括学生的姓名、班级和成绩。我们可以使用以下代码创建这个数据框:

import pandas as pd

data = {'姓名': ['张三', '李四', '王五', '赵六', '孙七', '周八'],
        '班级': ['一班', '二班', '一班', '二班', '一班', '二班'],
        '成绩': [85, 90, 88, 92, 82, 87]}
df = pd.DataFrame(data)

接下来,我们可以使用Groupby()函数对数据框进行分组。在这个例子中,我们按照班级对学生进行分组:

grouped = df.groupby('班级')

现在,我们已经将数据框按照班级进行了分组。接下来,我们可以使用均值函数来计算每个班级的平均成绩:

mean_scores = grouped['成绩'].mean()

上述代码中,我们首先选择了分组后数据框中的“成绩”列,然后使用均值函数计算了每个班级的平均成绩。最后,我们可以打印出计算结果:

print(mean_scores)

运行上述代码,我们可以得到每个班级的平均成绩。

除了计算均值,Groupby()函数还可以用于计算其他统计量,如求和、计数、最大值、最小值等。例如,我们可以使用以下代码计算每个班级的学生人数:

count_students = grouped['姓名'].count()
print(count_students)

Pandas的Groupby()函数为我们提供了一种方便的方式来对数据框进行分组操作,并对分组后的数据进行各种计算。通过合理运用这个函数,我们可以更加高效地处理和分析数据,为后续的决策和研究提供有力支持。

TAGS: groupby函数 Pandas数据框 分组计算 均值计算

欢迎使用万千站长工具!

Welcome to www.zzTool.com