什么!棒棒糖也能画成图?—— ggplot2绘制棒棒糖图/哑铃图

欢迎关注公众号查看原文

Part 1 :棒棒糖图

棒棒糖图因其形状和棒棒糖相似而得名,具体来看实际上是一个散点和一条线段的组合。棒棒糖图是散点图的一种变体,又与柱状图非常相似,但其在清晰展示数据的同时,减少了图形量,使得读者能够更加关注于数据本身而非图形。棒棒糖图能够帮助将数值与类别对齐,非常适合比较多个类别的值之间的差异。 本期介绍棒棒糖图的基本作图方法和优化

示例1:相同数据源下柱状图和棒棒糖图展示数值差异效果对比

示例2:使用棒棒糖图画出的好图

Part 2 :图像与代码

1、快速构建基础图形:

只需在散点图基础上,增加geom_segment( )图层即可画出棒棒糖图

示例3:基础图形

library(ggplot2)

# 随机构建数据
data <- data.frame(xv = LETTERS[1:26],  #x轴:以26个字母作为类别
                   yv = abs(rnorm(26))) #y轴:取26个符合正态分布的随机数
## fig 1 :基础图形
fig3 = ggplot(data, aes(x = xv, y = yv)) +

  geom_segment( aes(x = xv, xend = xv, y = 1, yend = yv),color = "grey40")+ #控制线段的参数,见下
  geom_point(size = 4, pch = 21, bg = 5, col = 1) + #控制散点的参数
  theme_bw()
fig3

#geom_segment中的参数用于控制线条相关参数
#x=xv,xend=xv 表示x轴的线条起始位置x和终止位置xend都是xv(没有线条)
#类似的,y = 1, yend = yv表示y轴线段起始点为y=1,种植点为每个类别的值即yv

2、基础优化:

(1)对线段的控制体现在对geom_segment()函数参数的调整,该函数的详细用法可参考 https://ggplot2.tidyverse.org/reference/geom_segment.html

在此我们介绍常用的参数:

  • x - (必须) 起点的x坐标

  • y - (必须) 起点的y坐标 — 此参数用作设定基线

  • xend - (必须)终点的x坐标

  • yend - (必须)终点的y坐标

  • size - (默认:0.5)线段的宽度

  • linetype - (默认:1=solid)线段的类型,可参见下图中 lty 变量类型

  • color - (默认: "black") 线段的颜色

  • alpha - (默认:1=opaque)线段的透明度


(2)对顶点(散点)的控制则由geom_point()控制,此处不再赘述,可参考:

https://ggplot2.tidyverse.org/reference/geom_point.html?q=geom_point#null

值得一提的是,R语言本身提供了一些自定义图形外观的参数,这些参数几乎可以适用在所有基于R语言的绘图包中:

  • cex - 形状大小

  • lwd - 线条宽度

  • col - 控制颜色类型

  • lty - 线条类型

  • pch - 标记(散点)形状

  • type - 点之间的连接形状

这些参数对应的可选变量见下图:

(3)其他:

  • x、y轴坐标交换 :直接使用** coord_flip() **函数即可
  • 对变量进行排序,使图形更加美观;此处提供3种方法供参考:forcats::fct_reorder()dplyr::arrange()reorder(),具体示例参见:https://www.r-graph-gallery.com/267-reorder-a-variable-in-ggplot2.html
  • 要在散点上显示对应数值:使用geom_text()

示例4:简单优化后的棒棒糖图

library(ggplot2)
library(dplyr)
# 随机构建数据
data <- data.frame(xv=LETTERS[1:26], 
                   yv=abs(rnorm(26)))
data <- data %>% 
  mutate(mycolor = ifelse(yv>1, "Y>1", "Y<=1")) #设置分组

## fig 2 :简单优化后的图形
fig4 <- ggplot(data, aes(x=reorder(xv,-yv), y=yv,fill = mycolor)) +
  geom_segment( aes(x=reorder(xv,-yv), xend=reorder(xv,-yv), y=1, yend=yv,color=mycolor),
  size=0.5,linetype=1)+#使用reorder()排序变量
  geom_point(size = 5, pch = 21, color="black") + 
  #在散点上显示数值并保留两位小数
  geom_text(aes(label =sprintf("%.2f",yv)), color = "black", size = 1.6)+ 
  xlab("26Letters") +
  scale_y_continuous("Y_Values",breaks  =c(0,0.25,0.5,0.75,1,1.25,1.5,1.75,2)) +
  coord_flip() +
  theme_minimal()

fig4

示例5:带分组的棒棒糖图

library(ggplot2)
library(hrbrthemes)
yv1 <- abs(rnorm(6))*2
data6 <- data.frame(
  x=LETTERS[1:24], 
  val=c( yv1, yv1+1+rnorm(6, 14,1) ,yv1+1+rnorm(6, sd=1) ,yv1+1+rnorm(6, 12, 1) ),
  grp=rep(c("grp1", "grp2", "grp3", "grp4"), each=6)
) %>%
  arrange(val) %>%
  mutate(x=factor(x, x))

fig5 = ggplot(data6) +
  geom_segment( aes(x=x, xend=x, y=0, yend=val), color="grey") +
  geom_point( aes(x=x, y=val, color=grp), size=3 ) +
  coord_flip()+
  theme_ipsum() +
  theme(
    legend.position = "none",
    panel.border = element_blank(),
    panel.spacing = unit(0.1, "lines"),
    strip.text.x = element_text(size = 8)
  ) +
  xlab("") +
  ylab("Value of Y") +
  facet_wrap(~grp, ncol=1, scale="free_y")
fig5

3、变体:一个类型两个值

在棒棒糖图中,如果一个类别有两个数值,可以很方便地使用一条线段来表示二者间的差异。即在棒棒糖图中geom_segment(aes(x = xv, xend = xv, y = 1, yend = yv)中,y的起始点不再是固定的度量y=1,而是该类别的另一变量示例6:

library(ggplot2)
library(dplyr)
yv1 = abs(rnorm(26))*2
data2 <- data.frame(
  xv1 = LETTERS[1:26], 
  yv1 = yv1, 
  yv2 = yv1+1+rnorm(26, sd=1) 
)

fig6 = ggplot(data2) +
  geom_segment( aes(x=xv1, xend=xv1, y=yv1, yend=yv2),
  size=0.7,linetype=1,color="grey")+ # 此处y起始点为yv1,终止点为yv2
  geom_point(aes(x=xv1,y=yv1),size = 4, pch = 20, color="#66CCEE") + 
  geom_point(aes(x=xv1,y=yv2),size = 4, pch = 20, color="#EE6677") + 
  xlab("26Letters") +
  scale_y_continuous("Y_Values",breaks  =c(0,1,2,3,4,5,6,7)) +
  theme_minimal()
fig6

示例6这样的图形也被称之为“哑铃图”,并且已有成熟的函数可以绘制:ggalt::geom_dumbbell(),该函数的相关参数含义及用法和示例参见官方文档:https://yonicd.github.io/ggalt/reference/geom_dumbbell.html

下面给出使用该函数绘制“哑铃图”的示例:

示例7:geom_dumbbell()官方文档示例

library(ggplot2)
library(ggalt)
df <- data.frame(trt=LETTERS[1:5], l=c(20, 40, 10, 30, 50), r=c(70, 50, 30, 60, 80))

bbfig3 = ggplot(df, aes(y=trt, x=l, xend=r)) +
  geom_dumbbell(size=3, color="#e3e2e1",
                colour_x = "#5b8124", colour_xend = "#bad744",
                dot_guide=TRUE, dot_guide_size=0.25) +
  labs(x=NULL, y=NULL, title="ggplot2 geom_dumbbell with dot guide") +
  theme_minimal() +
  theme(panel.grid.major.x=element_line(size=0.05))
bbfig3

示例8:geom_dumbbell()绘制哑铃图

llibrary(ggalt)
health <- read.csv("https://raw.githubusercontent.com/selva86/datasets/master/health.csv")
health$Area <- factor(health$Area, levels=as.character(health$Area))
bbfig2 = ggplot(health, aes(x=pct_2013, xend=pct_2014, y=Area)) + 
  geom_dumbbell()+
  theme_minimal()
bbfig2

library(ggalt)
library(ggplot2)
bbfig3 = ggplot(health, aes(x=pct_2013, xend=pct_2014, y=Area)) + 
  geom_segment(aes(x=pct_2013, 
                   xend=pct_2014, 
                   y=Area, 
                   yend=Area), 
               color="#b2b2b2", size=1.5)+
  geom_dumbbell(color="light blue", 
                size_x=3.5, 
                size_xend = 3.5,
                colour_x="#edae52", 
                colour_xend = "#9fb059")+
  labs(x=NULL, y=NULL, 
       title="Dumbbell Chart", 
       subtitle="Pct Change: 2013 vs 2014")+
  geom_text(color="black", size=2, hjust=-0.5,
            aes(x=pct_2013, label=pct_2013))+
  geom_text(aes(x=pct_2014, label=pct_2014), 
            color="black", size=2, hjust=1.5)+
  theme_minimal()
bbfig3

参考:

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 162,547评论 4 374
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,787评论 2 308
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 112,175评论 0 254
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,752评论 0 223
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 53,169评论 3 297
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 41,056评论 1 226
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,195评论 2 321
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,980评论 0 214
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,724评论 1 250
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,872评论 2 254
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,344评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,667评论 3 264
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,379评论 3 245
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,202评论 0 9
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,992评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 36,189评论 2 286
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,987评论 2 279

推荐阅读更多精彩内容