君语贤
时光静好,与君语;细水流年,与君同;繁华落尽,与君老...

建站开发>Python>正文

Pandas使用教程

2024-01-29 10:58 君语贤Pandas

Pandas使用教程

Pandas是Python中一个非常强大的数据分析库,可用于数据清洗、数据处理、数据分析等任务。以下是Pandas的使用教程:

安装Pandas

使用pip工具安装Pandas:pip install pandas

导入Pandas

在Python的脚本中使用以下代码导入Pandas库:

import pandas as pd

创建DataFrame

Pandas的核心数据结构是DataFrame。可以使用以下方法创建DataFrame:

import pandas as pd

# 使用字典创建DataFrame
df = pd.DataFrame({
    '姓名': ['张三', '李四', '王五'],
    '年龄': [18, 20, 22],
    '性别': ['男', '男', '女']
})

# 使用列表创建DataFrame
data = [
    ['张三', 18, '男'],
    ['李四', 20, '男'],
    ['王五', 22, '女']
]
df = pd.DataFrame(data, columns=['姓名', '年龄', '性别'])

查看DataFrame数据

可以使用以下方法查看DataFrame的数据:

import pandas as pd

df = pd.DataFrame({
    '姓名': ['张三', '李四', '王五'],
    '年龄': [18, 20, 22],
    '性别': ['男', '男', '女']
})

# 查看前5条数据
print(df.head())

# 查看后5条数据
print(df.tail())

# 查看DataFrame的形状,即行数和列数
print(df.shape)

# 查看DataFrame的数据类型
print(df.dtypes)

数据选择和筛选

Pandas提供了多种方法用于选择和筛选数据:

import pandas as pd

df = pd.DataFrame({
    '姓名': ['张三', '李四', '王五'],
    '年龄': [18, 20, 22],
    '性别': ['男', '男', '女']
})

# 选择姓名这一列
print(df['姓名'])

# 选择第一行数据
print(df.iloc[0])

# 选择年龄大于20的行
print(df[df['年龄'] > 20])

# 选择年龄大于20且性别为女的行
print(df[(df['年龄'] > 20) & (df['性别'] == '女')])

数据排序

可以使用以下方法对数据进行排序:

import pandas as pd

df = pd.DataFrame({
    '姓名': ['张三', '李四', '王五'],
    '年龄': [18, 20, 22],
    '性别': ['男', '男', '女']
})

# 按年龄升序排列
print(df.sort_values(by='年龄'))

# 按姓名降序排列
print(df.sort_values(by='姓名', ascending=False))

数据聚合和分组

数据聚合和分组是数据分析的重要功能,Pandas提供了多种方法实现这个功能:

import pandas as pd

df = pd.DataFrame({
    '姓名': ['张三', '李四', '王五', '赵六'],
    '年龄': [18, 20, 22, 20],
    '性别': ['男', '男', '女', '男']
})

# 按性别对年龄进行分组,计算平均值
print(df.groupby('性别')['年龄'].mean())

# 按性别对年龄进行分组,计算平均值、标准差、最大值、最小值
print(df.groupby('性别')['年龄'].agg(['mean', 'std', 'max', 'min']))

这是Pandas的一些基础用法,掌握了这些基础用法之后,可以使用Pandas对数据做很多处理和分析。

本文链接:https://www.weguiding.com/python/1025.html