软件测试|数据分析神器pandas教程(二)

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

软件测试|数据分析神器pandas教程(二)_数据


前言

上一篇文章我们介绍了pandas的安装,并且写了一个简单的示例,本篇文章我们就开始学习pandas的数据结构。

数据结构-Series

Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series 由索引(index)和列组成,函数如下:

pandas.Series( data, index, dtype, name, copy)

参数说明:

  • data:一组数据(ndarray 类型)
  • index:数据索引标签,如果不指定,默认从 0 开始
  • dtype:数据类型,默认会自己判断
  • name:设置名称
  • copy:拷贝数据,默认为 False

创建一个简单的 Series 实例:

import pandas as pd

a = [4, 5, 6]

mydata = pd.Series(a)

print(mydata)
----------------------
输出内容如下:
0    4
1    5
2    6
dtype: int64

从上可知,如果没有指定索引,索引值就从 0 开始,我们可以根据索引值读取数据代码如下:

import pandas as pd

a = [4, 5, 6]

mydata = pd.Series(a)


print(mydata[1])
----------------------------
输出结果如下:
5

我们也可以指定索引值,这样就可以按照索引输出内容,代码如下:

import pandas as pd

place = ["Jiangxi", "Ganzhou", "Zhanggong"]

mydata = pd.Series(place, index = ["provice", "city", "district"])

print(mydata)

---------------------------------------
输出结果如下:
provice       Jiangxi
city          Ganzhou
district    Zhanggong
dtype: object

同样,我们也可以根据指定的索引输出内容,代码如下:

import pandas as pd

place = ["Jiangxi", "Ganzhou", "Zhanggong"]

mydata = pd.Series(place, index = ["provice", "city", "district"])

print(mydata["city"])

-----------------------
输出结果如下:
Ganzhou

类似字典方法,通过键值对对象创建Series,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place)

print(mydata)
---------------------------
输出结果如下:
provice       Jiangxi
city          Ganzhou
district    Zhanggong
dtype: object

从输出结果可以得知,字典的键成为了索引,如果我们需要字典中的一部分数据,只需要指定需要数据的索引即可,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place, index=['city', 'district'])

print(mydata)

----------------------------------------
输出结果如下:
city          Ganzhou
district    Zhanggong
dtype: object

我们同样可以设置 Series 名称参数,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place, index=['city', 'district'], name="my hometown")

print(mydata)
--------------------------
输出结果如下:
city          Ganzhou
district    Zhanggong
Name: my hometown, dtype: object

总结

本文主要介绍了pandas的Series数据结构,这个数据结构较为简单,后续我们将介绍dataframe数据结构。

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6