Python 为现有 DataFrame 添加新列的示例代码

2024-12-28 22:12:11 小编

在 Python 的数据分析中，pandas库的DataFrame是一个非常强大和常用的数据结构。有时，我们需要为现有的DataFrame添加新的列来丰富数据或者进行进一步的分析。下面通过示例代码来演示如何为现有DataFrame添加新列。

确保已经安装了pandas库。

import pandas as pd

假设我们有一个初始的DataFrame，例如：

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
print(df)

接下来，我们可以使用多种方法为其添加新列。

方法一：直接赋值

df['C'] = [7, 8, 9]
print(df)

方法二：基于现有列进行计算

df['D'] = df['A'] + df['B']
print(df)

方法三：使用函数生成新列的值

def custom_function(x):
    return x * 2

df['E'] = df['A'].apply(custom_function)
print(df)

方法四：从外部数据添加新列

new_column_values = [10, 11, 12]
df['F'] = new_column_values
print(df)

通过以上示例，我们可以看到为DataFrame添加新列是非常灵活和方便的。可以根据具体的需求选择合适的方法来添加新列，以满足数据分析和处理的要求。

在实际应用中，根据数据的特点和分析目的，合理地添加新列能够帮助我们更好地理解和处理数据，为后续的分析和建模提供更有力的支持。

无论是进行数据清洗、特征工程还是构建复杂的数据分析流程，掌握为DataFrame添加新列的技巧都是至关重要的。希望上述示例代码能够对您在使用 Python 进行数据分析时有所帮助。

万千站长工具