Pandas 数据框如何用 Groupby() 函数分组并计算均值

技术文摘

2025-01-09 01:37:21 小编

在数据处理和分析领域，Pandas是Python中非常强大的库之一。它提供了丰富的数据结构和函数，使得数据的处理和分析变得更加高效和便捷。其中，Groupby()函数是一个非常重要的函数，它可以对数据框进行分组操作，并对分组后的数据进行各种计算，比如计算均值。

我们需要导入Pandas库并创建一个数据框。假设我们有一个包含学生信息的数据框，其中包括学生的姓名、班级和成绩。我们可以使用以下代码创建这个数据框：

import pandas as pd

data = {'姓名': ['张三', '李四', '王五', '赵六', '孙七', '周八'],
        '班级': ['一班', '二班', '一班', '二班', '一班', '二班'],
        '成绩': [85, 90, 88, 92, 82, 87]}
df = pd.DataFrame(data)

接下来，我们可以使用Groupby()函数对数据框进行分组。在这个例子中，我们按照班级对学生进行分组：

grouped = df.groupby('班级')

现在，我们已经将数据框按照班级进行了分组。接下来，我们可以使用均值函数来计算每个班级的平均成绩：

mean_scores = grouped['成绩'].mean()

上述代码中，我们首先选择了分组后数据框中的“成绩”列，然后使用均值函数计算了每个班级的平均成绩。最后，我们可以打印出计算结果：

print(mean_scores)

运行上述代码，我们可以得到每个班级的平均成绩。

除了计算均值，Groupby()函数还可以用于计算其他统计量，如求和、计数、最大值、最小值等。例如，我们可以使用以下代码计算每个班级的学生人数：

count_students = grouped['姓名'].count()
print(count_students)

Pandas的Groupby()函数为我们提供了一种方便的方式来对数据框进行分组操作，并对分组后的数据进行各种计算。通过合理运用这个函数，我们可以更加高效地处理和分析数据，为后续的决策和研究提供有力支持。

TAGS: groupby函数 Pandas数据框分组计算均值计算

万千站长工具

技术文摘

Pandas 数据框如何用 Groupby() 函数分组并计算均值

欢迎使用万千站长工具！