python数据分析及可视化(二十)Power BI的可视化制作以及A股上市公司数据分析

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

可视化制作

通过图表展示如何用Power BI 制作可视化的图表来展示可视的数据内容。

柱形图

用水平的柱子来表示不同分类数据的大小类似于条形图相当于竖着的条形图。堆积柱形图是不同的序列数据都堆积在一个柱子上簇状柱形图中不同的序列使用不同的柱子方便比较不同序列数值的大小。百分比堆积柱形图中y轴的数据变成百分比显示相对大小跟堆积柱形图相似没办法比较总量。可以在格式中对图表进行个性化的设置美化图表。合格的柱形图为y轴内容清晰、有图例说明、单位、与图表相呼应的标题、合理的颜色搭配等。
在这里插入图片描述
以百分比堆积柱形图为例进行展示跟堆积柱形图类似不同的序列在一根柱子上进行显示。
在这里插入图片描述
可以利用格式对图表进行美化以簇状柱形图为例更改图表显示情况的参数如X、Y轴标题柱子的颜色、背景等。合格的柱形图要求X和Y轴清晰有图例和说明、数据单位、与图表相呼应的标题等等。
在这里插入图片描述

树状图

也被称为矩形树图把整体的数据想象成一棵树每一个数据就是一个枝叶枝叶是放在矩形中的每个矩形错落有致的排列在大矩形中。适用场景需要显示大量的分层数据而条形图不能有效的去处理大量的值需要显示各个部分与整体的比例层次当中的指标在各个类别层次当中的分布模式以及使用颜色、大小来显示属性离群点、异常值等。树状图中几乎没有空白区域里面的每一簇都用在表述关系上在空间利用率是比较高的。
在这里插入图片描述
可以Power Query界面转换—脚本中选择运行Python 脚本使用Python代码进行数据的处理。原本的数据会发生变化展开value列不勾选使用原始列名作为前缀选项原始的数据都会显示出来。在可视化界面选择树状图显示品牌的数量占比把品牌放在组和值中就得到上图显示的效果。
在这里插入图片描述
在矩形树图中可以通过每个矩形的大小、位置和颜色来区分每个数据的权重关系及占总体的比例可以一目了然的看到整个数据集。整个图形都是按从左到右、从上到下面积的降序进行排列此时树形图展示的是单层的数据结构。把容量放到详细信息中就可以看到每个品牌中不同容量的硬盘信息这时显示的就是双层的树状图。

地图可视化

利用微软内置的必应地图在Power BI中轻松的生成地图来实现各种地图的可视化。默认的有三种地图对象频繁使用的是气泡地图着色地图需要用在线版的来显示。
利用气泡的大小来表示不同地区GDP的值在格式中更改气泡的颜色等信息。把国家、省份、城市的数据放到位置栏中可以显示不同层级的数据情况。利用图表上方的向上钻取和向下钻取来选择不同层级的数据在数据中数据要用全称如北京市等等可以把数据中的经纬度放到经度和维度中来保证数据能显示完整。
在这里插入图片描述

常用操作

1. 查看数据

可以在生成图表的右上角点击三个点来以列表显示或者导出数据。

2. 图表钻取

当图表数据中存在层级结构时可以在图表中直接展示下一级数据只要具体日期数据的层级结构足够详细可以如从年份到季度、月份、日期、小时等。利用生成后的图表上方向下钻取按钮然后点击图表中的数据会展开相应的数据点击“向上钻取”进行汇总相应的数据信息。点击图表中“转至层次结构中的下一级别按钮”两个向下的箭头可以逐级显示所有层级的内容点击图表中“展开层次结构中的所有下级级别”可以展开所有级别的数据信息。在其他图表中钻取功能类似可以钻取从国家、省份、城市等一直向下细分的数据信息。

3. 编辑交互

Power BI 可视化的图表是动态的通过页面上的筛选、钻取、突出显示等交互功能进行快速的访问、发现、探索数据背后的规律。默认筛选数据的改变Power BI上与此相关的所有可视化视图都会发生变化每个可视化对象同样可以作为其他图表的筛选条件其他图表也会动态的响应从不同的角度来展现数据筛选操作不当展示的可视化效果也会千差万别。
选中图表点击格式—编辑交互在每个图表上方都会出现“筛选器”和“无”如果希望筛选其中一个图表其他图表不发生变化可以选中其他图表的“无”如果筛选其中一个图表其他图表也跟着产生响应就选中图表上方的“筛选器”。在圆环图和柱形图中还会出现一个按钮“突出显示”当其他图形进行筛选时候这两个图形也会随着筛选产生图形的变化此时单击“突出显示”按钮图形就会恢复之前的状态保留之前图形数据点的内容筛选的部分会进行突出显示有利于我们进行数据的探索。

实战A股上市公司数据分析

1. 数据准备

数据,是接下一系列分析的前提。
以中商情报网为例。
在PowerBI 获取数据选择从Web中获取把需要获取网页的url传入到高级选项卡下的URL部分中需要获取的数据可以为1-20页把URL和后面的数字分开进行传入点击确定就可与获取到第1页的数据。勾选导航器中的表7选择转换数据进入Power Query编辑器中就可以看到获取的第1页的数据。
在这里插入图片描述

2. 数据清洗

把“脏数据”洗掉,这也关乎到后面的分析工作。
把获取到的“招股书”和“公司财报”等不需要的数据点右键进行删除。
可以根据页码参数来设定自定义函数实现批量下载或导入数据。
单击主页—查询—高级编辑器或者右键单击表7选择高级编辑器。在显示的代码上方增加一行代码(p as number as table) =>把let里第一行代码中的字符串1改为 (Number.ToText(p)))单击完成。
在这里插入图片描述
进入输入参数的界面更改表名称为 Data_zs此时p就为该函数的变量传入p的参数值在界面中数据数字就会查询到相应页码的数据。实现批量抓取数据就要批量调用该函数。
在这里插入图片描述
点击主页—新建查询—新建源中找到空查询输入内容= {1…10}创建一个查询的列表然后点击转换—到表转化为表格点击添加列—常规—调用自定义函数在弹出的对话框内输入新的列名称“页码”功能查询内选择创建好的“Data_zs”单击确定就开始抓取设置的1-10页的网页数据。
在这里插入图片描述
单击页码列右边的双向箭头去掉使用原始列名作为前缀的勾选就可以展开抓取到的10页200条数据。

3. 数据建模

多表的协同配合依靠表与表之间的逻辑关系, 建立关系的过程称为数据建模。
此时就一个表不需要建立表与表之间的逻辑关系这个步骤可以省略。

4. 指标计算

需要熟悉常用的业务指标。
可以更改部分列的数据格式如根据需求更改上市日期的显示内容为年右键单击–转换–年点击主页—关闭并应用退出Power Query编辑器加载查询的数据内容。销售额月度增长人数、活跃用户等数据的计算可以通过添加度量值的方式为我们的分析添加相应的指标数据内容。如计算北京、上海、深圳的上市公司的数量在字段下右键单击表名称通过新建度量值的方式来添加数据的查询北上深上市公司数量 = CALCULATE(COUNTROWS(‘查询1’),‘查询1’[城市] in {“上海市”,“深圳市”,“北京市”})字段的调用要用双引号查询1表中就会出现度量值的数据。
在这里插入图片描述

5. 可视化展示

通过可视化,让枯燥的数据变得直观,更容易理解,更快的传递关键信息。
绘制仪表盘图显示北上深上市公司数量的占比个数把刚创建的度量值放到“值”中可以在设置视觉对象格式中修改图表的基本参数值。
添加环形图显示上市公司中经营的行业把行业分类数据放到图例和值中。
添加饼图显示上市公司在城市的排名把城市放到图例中把公司名称放到值中。可以创建度量值进行城市的筛选也可以在右侧的筛选器中城市的筛选类型中选择城市进行显示。
添加簇状柱形图显示从1990年开始每年上市公司的数量把上市日期放在轴中公司名称放在Y轴中。
添加地图显示上市公司在地理位置上的分布把城市放在位置和大小中此时显示的是全球的地图可以在可视化的右下角选择导入视觉对象导入中国的视觉地图导入成功后在可视化的下方会显示中国地图可以在设置视觉对象格式中选择仅数据更改视觉映射的颜色更改地图中地图区域的颜色。
可以在视图中选择主题更改整个画板的主题风格在主页—插入中选择插入文本框输入“A股上市公司数量分析”调整字体的格式和大小以及颜色等。
在这里插入图片描述

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6
标签: python