Python 数据可视化:绘图类的应用

Plotly 的 plotly.graph_objs 库提供了很多种绘图类,涵盖了常用的统计图表,并且还有所拓展。不过,为了对类的理解更深刻,以下讲述将按照对象进行,不同的统计图依据相应的参数来实现。

4.2.1 Scatter 类——绘制直线图、散点图

在 plotly.graph_objs 中的 Scatter 类,功能比较多,用它能够绘制直线图、散点图等。

根据经验,可以在 Jupyter 中输入了 go.Scatter,然后按下 TAB 键,查看到不仅仅是 Scatter,还包含其他以 Scatter 开头的家族成员(如下图所示)。

image

不过在这里,我们仅关注 go.Scatter,其他对象暂时不研究。

go.Scatter(arg=None, cliponaxis=None, connectgaps=None, customdata=None, customdatasrc=None, dx=None, dy=None, error_x=None, error_y=None, fill=None, fillcolor=None, groupnorm=None, hoverinfo=None, hoverinfosrc=None, hoverlabel=None, hoveron=None, hovertext=None, hovertextsrc=None, ids=None, idssrc=None, legendgroup=None, line=None, marker=None, mode=None, name=None, opacity=None, orientation=None, r=None, rsrc=None, selected=None, selectedpoints=None, showlegend=None, stackgaps=None, stackgroup=None, stream=None, t=None, text=None, textfont=None, textposition=None, textpositionsrc=None, textsrc=None, tsrc=None, uid=None, unselected=None, visible=None, x=None, x0=None, xaxis=None, xcalendar=None, xsrc=None, y=None, y0=None, yaxis=None, ycalendar=None, ysrc=None, **kwargs)

面对这么多参数,不要惊慌,前面学习过程中,也不是没有见过这种阵势。参数多,说明它的功能比较全。如果有兴趣,可以根据官方文档的说明,将每个参数的含义通读一遍。若暂时没兴趣或没时间,就到用的时候再去看吧。

下面就用一些示例来说明某些参数的含义(示例中的数据来自:https://github.com/qiwsir/DataSet/tree/master/universityrank)。

import pandas as pd
import plotly
import plotly.graph_objs as go

df = pd.read_csv("/Users/qiwsir/Documents/Codes/DataSet/universityrank/timesData.csv")
df.head()

world_rank university_name country teaching international research citations income total_score num_students student_staff_ratio international_students female_male_ratio year
0 1 Harvard University United States of America 99.7 72.4 98.7 98.8 34.5 96.1 20,152 8.9 25% NaN 2011
1 2 California Institute of Technology United States of America 97.7 54.6 98.0 99.9 83.7 96.0 2,243 6.9 27% 33 : 67 2011
2 3 Massachusetts Institute of Technology United States of America 97.8 82.3 91.4 99.9 87.5 95.6 11,074 9.0 33% 37 : 63 2011
3 4 Stanford University United States of America 98.3 29.5 98.1 99.2 64.3 94.3 15,596 7.8 22% 42 : 58 2011
4 5 Princeton University United States of America 90.9 70.3 95.4 99.9 - 94.2 7,929 8.4 27% 45 : 55 2011

现在读入的数据集是世界各大学排名,在后续示例中,只取其中的前一百所大学。

df100 = df.iloc[:100, :]

首先要做的,就是利用 go.Scatter 创建 Trace 对象,将此对象提交给 Plotly 的 API 之后,Plotly 服务器就能根据此 Trace 对象的有关配置,返回相应的图线,即可得到所要绘制的图示。

trace1 = go.Scatter(x = df100['world_rank'],    # 世界排名
                    y = df100['citations'],        # 被引用次数
                    mode = 'lines',
                    name = 'citations', 
                    marker = dict(color='rgba(16, 112, 2, 0.8)'),
                    text = df100['university_name']
                   )
trace2 = go.Scatter(x = df100['world_rank'],
                    y = df100['teaching'],
                    mode = 'lines+markers',
                    name = 'teaching',
                    marker = dict(color='rgba(80, 26, 80, 0.8)'),
                    text = df100['university_name']
                   )
trace3 = go.Scatter(x = df100['world_rank'],
                    y = df100['research'],
                    mode = 'markers',
                    name = 'research',
                    marker = dict(color='rgba(40, 66, 120, 0.8)'),
                    text = df100['university_name']
                   )
data = [trace1, trace2, trace3]
layout = dict(title = "Citation Research and Teaching VS World Rank of Top100 Universities",
              xaxis = dict(title='Wrold Rank', ticklen=5, zeroline=False)
             )
fig = dict(data=data, layout=layout)

plotly.offline.init_notebook_mode(connected=True)
plotly.offline.iplot(fig)

输出结果:

enter image description here

在这里绘制的是三种图,控制不同类型图的参数是 go.Scatter 中的 mode,它的值可以是:

  • 'lines',折线图,没有标记坐标点;
  • 'lines + markers',折线图,标记坐标点;
  • 'markers',散点图,没有各点之间的连线。

如果觉得观察起来有点乱,可以通过图示的交互功能,比如选择图例,显示指定的图线。

另外几个参数的含义,也简要解释一下:

还有 60% 的精彩内容
©著作权归作者所有,转载或内容合作请联系作者
支付 ¥2.99 继续阅读
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,525评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,203评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,862评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,728评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,743评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,590评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,330评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,244评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,693评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,885评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,001评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,723评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,343评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,919评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,042评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,191评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,955评论 2 355

推荐阅读更多精彩内容