Pandas学习笔记
本文最后更新于 2025年12月26日 晚上
pandas DataFrame 使用大全
一、创建 DataFrame
1. 从字典创建
1 | |
2. 从列表创建
1 | |
3. 从 Series 创建
1 | |
4. 从 NumPy 数组创建
1 | |
5. 特殊创建方法
1 | |
二、访问数据
1. 基本查看
1 | |
2. 选择列
1 | |
3. 选择行
1 | |
4. 同时选择行和列
1 | |
5. 使用 query 方法
1 | |
三、删除数据
1. 删除行
1 | |
2. 删除列
1 | |
3. 重置索引
1 | |
四、修改数据
1. 修改列名
1 | |
2. 修改行索引
1 | |
3. 修改值
1 | |
4. 添加列
1 | |
5. 添加行
1 | |
6. 数据类型转换
1 | |
五、数据操作
1. 排序
1 | |
2. 分组聚合
1 | |
3. 合并连接
1 | |
4. 数据透视
1 | |
5. 缺失值处理
1 | |
6. 重复值处理
1 | |
六、常用技巧
1. 链式操作
1 | |
2. 矢量化操作
1 | |
3. 内存优化
1 | |
4. 性能优化
1 | |
七、保存和加载
1 | |
- 使用
loc和iloc进行明确的索引访问 - 避免链式索引(如
df['A'][0] = 1),使用df.loc[0, 'A'] = 1 - 尽量使用向量化操作而非循环或apply
- 注意inplace参数,大多数操作默认返回新DataFrame
- 及时释放内存,处理大数据时注意内存管理
- 使用query进行复杂筛选,代码更简洁
- 保存中间结果,避免重复计算
Pandas学习笔记
https://www.mirstar.net/2025/12/26/pandas-learning-journal/