PhoneGap中文网

 找回密码
 立即注册
查看: 15708|回复: 0
打印 上一主题 下一主题

Pandas库常用函数

[复制链接]

87

主题

87

帖子

327

积分

中级会员

Rank: 3Rank: 3

积分
327
跳转到指定楼层
楼主
发表于 2017-8-7 23:15:27 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本文和大家分享的主要是Pandas库常用函数相关内容,一起来看看吧,希望对大家学习Pandas有所帮助。
  1. DataFrame 处理缺失值 pandas.DataFrame.dropna
  df2.dropna(axis=0, how='any', subset=[u'ToC'], inplace=True)
  把在ToC列有缺失值的行去掉
  2. 根据某维度计算重复的行 pandas.DataFrame.duplicated
  print df.duplicated(['name']).value_counts()  # 如果不指定列,默认会判断所有列"""
  输出:
  False    11118
  True       664
  表示有664行是重复的
  """
  利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否为重复行,非重复行显示为False,重复行显示为True
  3. 去重 pandas.DataFrame.drop_duplicates
  df.drop_duplicates(['name'], keep='last', inplace=True)"""
  keep : {‘first’, ‘last’, False}, default ‘first’
  first : Drop duplicates except for the first occurrence.
  last : Drop duplicates except for the last occurrence.
  False : Drop all duplicates."""
来源:博客园
it营
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐 上一条 /1 下一条

ionic4视频教程

Archiver|手机版|小黑屋| PhoneGap中文网 ( 京ICP备13027796号-1 )  

GMT+8, 2024-12-22 16:10 , Processed in 0.070917 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表