当前位置:首页 > Python > 正文内容

[Python 教程] Pandas 数据分析实战

admin4周前 (03-18)Python39

Pandas 数据分析实战

Pandas 是 Python 数据分析的核心库,提供 DataFrame 和 Series 数据结构。本文介绍 Pandas 的实用技巧。

一、创建 DataFrame

import pandas as pd
import numpy as np

# 从字典创建
df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'city': ['NYC', 'LA', 'Chicago']
})

# 从 CSV 读取
# df = pd.read_csv('data.csv')

# 从 Excel 读取
# df = pd.read_excel('data.xlsx')

二、数据查看

df.head()      # 前 5 行
df.tail()      # 后 5 行
df.info()      # 数据信息
df.describe()  # 统计描述
df.shape       # (行数,列数)
df.columns     # 列名

三、数据选择

# 选择列
df['name']
df[['name', 'age']]

# 选择行
df.loc[0]       # 标签索引
df.iloc[0]      # 位置索引
df.loc[0:2]     # 行范围

# 条件筛选
df[df['age'] > 30]
df[(df['age'] > 25) & (df['city'] == 'NYC')]

四、数据处理

# 添加列
df['salary'] = [50000, 60000, 70000]

# 删除列
df.drop('city', axis=1, inplace=True)

# 重命名
df.rename(columns={'name': 'full_name'}, inplace=True)

# 排序
df.sort_values('age', ascending=False)

# 去重
df.drop_duplicates()

五、数据统计

df['age'].mean()    # 平均值
df['age'].median()  # 中位数
df['age'].std()     # 标准差
df['age'].value_counts()  # 值计数
df.groupby('city')['age'].mean()  # 分组统计

六、处理缺失值

# 检查缺失值
df.isnull().sum()

# 删除缺失值
df.dropna()

# 填充缺失值
df.fillna(0)
df['age'].fillna(df['age'].mean())

相关文章

Python 上下文管理器实战:从 with 语句到自定义资源管理

在 Python 编程中,上下文管理器(Context Manager)是一个强大但常被低估的特性。当你使用 open() 函数读取文件时,那个熟悉的 with 语句背后,正是上下文管理器在默默工作。...

深入理解 Python 装饰器与上下文管理器:从原理到实战

在 Python 开发中,装饰器和上下文管理器是两个非常强大的高级特性。它们能够让代码更加简洁、可读,并且在不修改原有代码逻辑的情况下增强功能。本文将从实际应用场景出发,深入探讨这两个重要概念。一、装...

Python 装饰器:从原理到高级实战完全指南

Python 装饰器是一种强大的语法糖,它可以在不修改原函数代码的情况下,为函数添加额外的功能。装饰器的本质是一个接受函数作为参数,并返回一个新函数的高阶函数。 装饰器的基本原理 装饰器的工作原理...

Python 上下文管理器:让代码更优雅

在 Python 开发中,我们经常需要处理资源的获取和释放——这些资源可能是文件句柄、数据库连接、网络%E 套接或锁。传统的方法是使用 try-finally 块来确保资源被正确释放,但这种方式往往使...

Python 装饰器实战与原理深度解析

在 Python 开发中,我们经常需要在多个函数中添加相同的功能,比如日志记录、性能计时、权限校验等。如果每个函数都重复编写这些代码,不仅效率低下,还容易出错。装饰器正是为了解决这类问题而诞生的。...

Python 类型注解完整指南与最佳实践

引言 随着 Python 项目的规模增长,代码的可维护性和类型安全性变得越来越重要。Python 3.5 引入了类型注解(Type Hints)机制,允许开发者在代码中标注变量和函数的类型信息。虽然...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。