当前位置:首页 » 《随便一记》 » 正文

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(5)

28 人参与  2022年11月28日 13:13  分类 : 《随便一记》  评论

点击全文阅读


文章目录

前期准备1. 将create Time列设置为索引2. 生成一个和df长度相同的随机数DataFrame3. 将上一题生成的DataFrame与df合并4. 生成的新的一列new值为salary列减去之前生成的随机数列5. 检查数据中是否含有空值6. 将salary类型转换成浮点数7. 计算salary 大于10000的次数8. 查看education共有几种学历9. 查看每种学历出现的次数10. 提取salary与new的和大于60000的最后3行

本章的10道题仍然是基于前章的文件,主要学习了有设置索引、合并两个DataFrame对象、更改数据类型,不同列之间的运算,统计一列不同值得个数以及不同值分别出现得次数,还有如何灵活的运用布尔值运算。

前期准备

##  前期准备本章的十道题与前面的试题相连接,数据集用的同一个数据集一些操作也是基于上一个练习的本次导包多导入了一个绘图的包,在这里我们只是简单的应用,后面会有详细的讲解用法```pythonimport pandas as pdimport numpy as npfrom matplotlib import pyplot as plt 

数据集没有的可以私信我,也可以直接去我的资源里面找

df = pd.read_excel('data1.xlsx')def fun(x):    a,b = x.split('-')    a = int(a.strip('k'))*1000    b = int(b.strip('k'))*1000    return int((a+b)/2)df['salary'] = df['salary'].apply(fun)

1. 将create Time列设置为索引

set_index() 将DataFrame的某一列快速设置成索引(index)默认会删除原来的列同样也可以是使用drop=False不删除原来的列

df.set_index('createTime')

在这里插入图片描述

2. 生成一个和df长度相同的随机数DataFrame

随机数的范围1-1000
随机生成

df1=pd.DataFrame(pd.Series(np.random.randint(1,1000,df.shape[0])))

3. 将上一题生成的DataFrame与df合并

其实这个题本质上就是合并两个DataFrame对象

使用merge
这个merge多用于内连接和外连接
pd.merge(df,df1) 
使用concat
df = pd.concat([df,df1],axis=1)df
使用join
df.join(df1)

两个合并之后的情况
在这里插入图片描述

4. 生成的新的一列new值为salary列减去之前生成的随机数列

df['new'] = df['salary'].astype('int') - df['rom']df

在这里插入图片描述

5. 检查数据中是否含有空值

isnull()对所有的元素判断是否是空值
在这里插入图片描述
any() 当序列中有一个True值时返回True否则返回False
all() 当序列中所有的值为True值时返回True否则返回False

df.isnull().values.any()

在这里插入图片描述

6. 将salary类型转换成浮点数

类型转换
这种方式并不会修改原数据,会返回一个修改后的新对象

df['salary'].astype('float') # 方式1df['salary'].astype(np.float64) # 方式2

在这里插入图片描述

7. 计算salary 大于10000的次数

其实这个里面用了一个布尔值计算的等价计算

True代表1 False代表0

sum(df['salary']>10000)

8. 查看education共有几种学历

统计一列中的不同值得个数

# 方式1df.education.nunique()# 方式2df['education'].nunique()

在这里插入图片描述

9. 查看每种学历出现的次数

统计每一种值出现得次数

df['education'].value_counts()  # 方式1df.education.value_counts()     # 方式2

在这里插入图片描述

10. 提取salary与new的和大于60000的最后3行

推荐使用前两种

# 提取salary与new的和大于60000的最后3行# 方式1df[df['salary']+df['new']>60000].tail(3)# 方式2df[df['salary']+df['new']>60000][-3:]# 方式3 df2 = df[['salary','new']]rowsums = df2.apply(np.sum,axis=1)res = df.iloc[np.where(rowsums>60000)[0][-3:],:]res

在这里插入图片描述

期待您的关注


点击全文阅读


本文链接:http://m.zhangshiyu.com/post/49170.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

最新文章

  • 女士的玩具推文_杜小灵白月光杜雪必读文_小说后续在线阅读_无删减免费完结_
  • 女儿要给我养老,我却反手把她告上法庭每日分享_林梦王浩养老一口气完结_小说后续在线阅读_无删减免费完结_
  • 闻妻有两意(林鹿小柿子)_闻妻有两意
  • 我的死党是刘秀?这皇位我不篡了(李哲王莽)全书免费_(李哲王莽)我的死党是刘秀?这皇位我不篡了后续(李哲王莽)
  • 逃荒路末世女王带着空间养儿女(周铁山王寡妇阿蛮)_逃荒路末世女王带着空间养儿女(周铁山王寡妇阿蛮)
  • 霍远凡肖灿续集(霍远凡肖灿)章节前文+全书阅读(丈夫逼我流产,我以死谢罪)最新连载
  • 老公给我13.14亲密付,我堕胎再婚后他悔疯了每日分享_苏暖顾川林晚晚超长版_小说后续在线阅读_无删减免费完结_
  • (白瑶,李玄胤,冰冷)白瑶,李玄胤,冰冷小说(九尾渡红尘)无套路无弹窗全部章节列表
  • (此去经年无故人)南初陆南城:结局+番外精品选集起点章节+阅读即将发布预订
  • 沈凝夏叶晚怡附加完整在线阅读(归雁不栖故人枝)最近更新列表
  • 剧情人物是时初,白浩雄的玄幻言情小说《召诸神,踏万界,天命帝女逆乾坤》,由网络作家&ldquo;海鸥&rdquo;所著,情节扣人心弦,本站TXT全本,欢迎阅读!本书共计381345字,185章节,:结局+番外免费品鉴:结局+番外评价五颗星
  • 凤青禾,江明远,***枢小说(别人修仙我捡漏,卷王们破防了)最近更新(凤青禾,江明远,***枢)整本无套路阅读

    关于我们 | 我要投稿 | 免责申明

    Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1