R语言为何令我忍无可忍

在电气电子工程师学会(IEEE)发布的2016年编程语言排行榜中,R语言已经冲到了第五名,仅次于C、Java、Python 和 C++。R语言的流行,大致是与数据科学的兴起有关。用R来分析数据,成了一件很时髦的事情。

我在R语言及其前身S-Plus里面摸爬滚打了多年,却一点也不喜欢,因为R语言有许多令我忍无可忍的脑残设计。在本文里,我举两个例子,展示冰山一角。

例1:自作聪明的序列产生器

不少编程语言里,都有序列产生器,例如:

  1. Haskell 中 [3..7] 的计算结果是 [3,4,5,6,7]。而[7..3]的结果是空表[]
  2. Matlab 与 Haskell 的行为类似,3:7 的计算结果是 3 4 5 6 77:3的结果是空矩阵 Empty matrix: 1-by-0
  3. Python 中采取 Dijkstra 惯例,整数区间不包含上界本身。于是range(3,7) 的计算结果是 [3,4,5,6]。而range(7,3)的结果与前两种语言类似,是空表[]

现在R登场了!

3:7

得到

3 4 5 6 7

这个还正常。现在,倒过来……

7:3

R竟然“聪明”地给出了一个倒序的向量!

7 6 5 4 3

在R里摸爬滚打了许多年,我浅薄地认为,这种标新立异其实是个大坑!

下面,我们做一个程序,列出 “从1、2、3、4这四个数中,取出任意两数” 的所有方案。为了描述清晰,我先用 MATLAB 做出一个版本:

for i=1:4
    for j=(i+1):4
        fprintf('%d %d\n', i, j);
    end
end

计算结果是:

1 2
1 3
1 4
2 3
2 4
3 4

下面我们将MATLAB版本直译成R语言:

for (i in 1:4) {
    for (j in (i+1):4)
        print (c(i, j))
}

我们希望得到类似MATLAB版本的输出,然而,R的计算结果令人发指:

[1] 1 2
[1] 1 3
[1] 1 4
[1] 2 3
[1] 2 4
[1] 3 4
[1] 4 5
[1] 4 4

这个结果让人一时摸不着头脑。在上面的结果中,前面六行没有问题,但第七行也太离谱了!根据正常的逻辑,j的最大值无论如何也就是4,为何会产生5呢?这就是因为R的序列产生器自作聪明!

这个问题的重点是,当i=4的时候,j的范围到底是什么。包括MATLAB在内的正常语言,都会认定此时j的范围是空集,从5到4产生一个序列,下界比上界大,当然是空集咯!但是R偏偏不这么想,它说,下界比上界大,那么我们产生一个逆向的序列吧:5,4。于是,就有了第七和第八行这两对多余的答案。

这里,一定有人说,博主SB,把 for (i in 1:4) 写成 for (i in 1:3) 避免下界比上界大的情况,不就把这坑绕过去了吗?我不想这么做,因为语言是拿来用的,不是拿来练习“绕坑”的!

例2:神奇的等号与箭头

先做个变量 x ,赋值为0。然后,我们来玩一个简单的“比大小”的游戏,比较 x 和 -1 的大小。具体而言,做一个if表达式,完成以下逻辑:

  • 如果 x 小于 -1,取值为“躲”
  • 否则取值为“策”

稍有常识的观众都知道 0 比 -1 大,所以当x=0时,这个if表达式的值应该是“策”。那我们拭目以待:

x=0
if (x<-1) "躲" else "策"

在R里面执行一下,结果是

"躲"

有一定经验的读者或许已经发现问题了。我来班门弄斧,仔细拆解一下。在解释这一行程序的时候,R完成了一系列动作:

  1. <-合在一起当成赋值操作。
  2. 把 x 赋值为 1。
  3. “赋值”这一操作给出一个值:1。
  4. 把数值1当作“逻辑真”代入 if 表达式,条件满足了:“躲”。

这里,一定有人说,博主SB,专写有歧义的表达式,如果在 -1 之前加个空格:

if (x< -1) "躲" else "策"

不就把这坑绕过去了吗?我还是不想这么做,因为语言是拿来用的,不是拿来练习“绕坑”的!

关于这种设计,我想说几句:

  1. “赋值”这个操作,作为一种动作,还是没有值比较好。在没有上下文的情况下,给“动作”定一个值,是一件反自然、反人类的事情。比如,“伞哥把我打了一顿” 这个动作的值是什么,是“爽”还是“疼”呢?在以上的 if 表达式中,x<-1 就有个值。根据R的文档,x<-1 的值,与赋值后的 x 一样,在这里是 1,这种行为与C语言的赋值语句类似。之后,这个值1,虽然是一个数,却被 if 拿去强行当成“逻辑真”,这又与C语言的逻辑机制类似。R没学到C语言的高效率,却继承了一大堆糟粕。

  2. 如果R分不清我是要“赋值”,还是要“比大小”,至少应该给我个提示,让我自行确认吧。无论是什么语言,在 if 表达式的条件里做“赋值”是很罕见的事情。在这个例子中,x<-1 就是 if 表达式的条件,但R解释器对这种罕见的情况熟视无睹。相比之下,C语言虽有“赋值语句带值”的坑,而C的编译器却往往有不错的检查机制。许多学过C语言的朋友,都曾不小心写出过类似

if (x = 1) {
   ...
} else {
   ...
}

的结构。在这种情况下,一个负责任的C编译器会警告说lvalue异常。看到这种警告,合格的C程序员都会再次确认,到底是要写 x = 1 还是 x == 1。然而,C编译器的警告功能,R解释器却没学到:完全无视上文的 if,不报错,不给出任何提示,一意孤行。在这种情况下,再狡猾的程序员,也躲不过好 bug 啊!

  1. 以上的例子中,程序员看到值不对,可以迅速排错。然而,错误的程序能有时能产生正确的结果。例如,把刚才的需求调整一下:现在,如果 x 小于 -1,取值为“策”,否则取值为“躲”。取 x=-2,有 bug 的程序如下:
x=-2
if (x<-1) "策" else "躲"

这样一来,只要一运行,就得到

"策"

这个结果是符合需求的,然而程序完全错误!表达式给出的这个“策”,不是因为“x 小于 -1”,而是因为“x被赋值成1,且1被当成逻辑真”。这样一来,错误的程序弄出了看起来正确的结果,这使得调试非常困难。如果成千上万行程序中藏了个类似的错误,一时通过了测试,直到项目交付之后才爆出问题,就更麻烦了。

结语

编程语言,不是谁都能设计的。稍有不慎,就会制造许多“坑”,甚至还会把某些“坑”当做“特性”。R这种东西,拿来当绘图工具或是计算器倒是可行,却也不是必须的。若要拿它做重要的事情,最好再三考虑。写到这里,我已将R卸载了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,716评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,558评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,431评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,127评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,511评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,692评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,915评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,664评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,412评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,616评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,105评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,424评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,098评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,096评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,869评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,748评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,641评论 2 271

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,100评论 18 139
  • ¥开启¥ 【iAPP实现进入界面执行逐一显】 〖2017-08-25 15:22:14〗 《//首先开一个线程,因...
    小菜c阅读 6,209评论 0 17
  • 我轻唤一声月 月儿云里藏 拨云见圆月 圆月咯咯笑 笑成你笑意如花的脸庞 我轻唤一声月 把月光写成一封无字的...
    夏小时阅读 196评论 0 1
  • 小时候,幸福是一颗糖;长大后,幸福是一次玩耍;现在,幸福是一种感觉。闭上眼,听风拂过耳畔,才恍然大悟,幸福原来那么...
    执笔溢情阅读 478评论 0 3