(转载)短信服务商分析

转载自PMCAFF,侵权请联系本人删除,只为分享出来大家一起学习。

附原文地址:http://www.pmcaff.com/article/index/287054019721344?from=search

最近在排查用户收不到我们下发的短信的情况,排查下来应该是运营商黑名单的问题,想起之前看到的一篇文章,作者分析的很透彻,分享出来给大家看下。

一、第三方短信服务商存在的意义

企业使用短信服务,本质上只是要解决一个给终端用户下发短信的简单需求。之所以有那么多短信服务商的存在,是因为中国的国情,三大运营商互不相同,各个省公司又是独立的,如果作为一个企业,你想直接跟运营商合作,那抱歉,你需要接移动、联通、电信三家运营商,否则部分跨网用户服务无法得到很好的保障。而为了保证服务稳定,有互备,你需要每个运营商需要接2个以上的省公司的通道,以免运营商故障导致服务中断。使用运营商的服务,你作为用户,尤其是普通企业,你不会有被服务的感觉,只能遵照运营商的规则来使用,并按时缴纳保底套餐,而且价格很高昂。

在这样的环境下,第三方服务商出现了,他们跟运营商比有几大优势:1、接入一家直接三网通。2、没有坑爹的保底套餐,起码没有运营商的坑。3、你是甲方,能享受一定的服务。

二、到达率

1、  提交成功率

企业通过服务商提供的API或SDK,向服务商提交短信的发送请求,这时会产生一个提交成功率。提交成功率的高低主要取决于网络环境。通常来说,提交成功率是很高的,99.9%以上。在很多第三方服务商的宣传中会提到成功率98%,99%,甚至更高,说的其实都是提交成功率。

2、  状态报告成功率

当下发的地方网关对手机发送短信后,手机会有一个状态报告返回,告诉网关短信接收状态。这个就是状态报告,是真正手机接收的成功率。在排除手机异常以及运营商网关异常的情况下,这个成功率也是超过99.9%的,就像你平时手机点对点发送短信的成功率是一样的,运营商的基础服务能力还是值得肯定的。

状态报告的成功率,主要取决于企业自己用户手机号的准确度。空号越多,成功率越低。而绝大多数的第三方服务商,在给绝大多数客户提供服务时,不会提供状态报告。或是提供虚假的状态报告。另外有个小知识,运营商的状态报告是72小时内返还的。当手机通讯正常时,接收后会及时的返回。但是如果手机出于异常状态,状态报告是等待返回。等待返回的报告在72小时内陆续返回,如果72小时还没结果,运营商会给出一个结果。比如你给关机的手机下发一条短信,在72小时内只要不开机,就是等待返回状态,开机以后,如果送达,就会显示成功。所以统计过短时间内的状态报告成功率,并不是很有意义。

3、  黑名单

提交的短信如果在服务商或运营商的黑名单里,那这条短信必然是不会发送的。手机用户如果打运营商的投诉电话投诉过短信业务,那不管你是否想收其他企业的短信,运营商都会把你加到黑名单里,并建议第三方服务商也对你的手机号过滤,以免造成更多的投诉。投诉是运营商的一个重要考核指标,运营商也会把这个指标转嫁给第三方服务商,每个服务商都背负着很高的投诉压力,所以他们会想尽办法减少用户投诉。常见的手段就是把“容易投诉的人”加到黑名单里,不对其发送短信。除了前面提到的打过运营商投诉电话的人以外,还有回复TD的人,也会被很多服务商添加到黑名单里。一些老牌服务商做的很简单粗暴,一个手机回复了TD,就会进他们平台的黑名单,因为这个人是“易投诉人群”,他们平台上的所有用户发送时都会屏蔽这个手机。黑名单库的大小会直接决定你短信的到达率。有些服务商的黑名单库有几千万的手机号。传统公司做的久,黑名单库也会越大。通常他们不太会去对黑名单“瘦身”,因为黑名单一方面可以减少投诉,另一方面黑名单失败的部分产生的费用,对于这些公司来说是纯利润。简直找不到“瘦身”的理由。我们做过统计,有些传统公司的黑名单库直接会导致近5%的到达率差异。

4、  频率限制

在使用一些服务商的过程中,企业会碰到一些频率限制,规则各有不同。这些频率限制的初衷是避免骚扰用户,降低投诉。而频率限制会对一些业务场景产生影响,比如监控告警短信。频率限制也会对到达率产生些许影响,但是通常来说,比重相对较小。

5、  扣量

在2013年以前,整个行业主要以垃圾短信为主的时候,扣量很常见,在那个时候,很少有用户知道“状态报告”这东西。而2013年后随着行业逐步向系统短信发展,扣量的行为很少见了。要鉴定服务商是否有扣量,可以做“抽查”。不定时不定期,取一些手机号,混在业务短信或单独测试都行。注意,这些手机号里,请随机放两个空号或者停机或者关机的号码,看一下你的服务商给你的状态报告是否与实际相符。

对于到达率,请服务商提供状态报告,统计状态报告成功率。统计黑名单的失败率,如果发现黑名单失败率高,可以跟服务商沟通取消黑名单,如果无法协商,建议换服务商。不定期的做一下测试,看看服务商的状态报告是否真实。

二、发送速度

这里说的发送速度,指的是从企业发起提交请求,到用户手机接收的这个耗时。当然,在提交请求前,企业内部的业务处理逻辑也会产生些许耗时,也要算在整体时间里面,但这部分时间与服务商无关。

1、  通道速度

每条短信网关,在落地运营商的系统里,都会被配置一个发送速度,不同的运营商、不同的省公司,分配的规则是不同的。比如你在上海移动申请一条10657的端口,或者服务商的10690落地在上海移动,上海移动就是落地运营商,他会给这个通道配置一个速度。这个速度从每秒1条到每秒几百不等。

当然,这个速度,通常不是给你一家的。除非你是月发送量百万级的用户,否则你很难拿到独享的通道速度。大客户有些会有“专用通道”,享受独享的速度。当然这个专用,打了引号,因为大多数客户其实分辨不出是否真的是“专用”。

2、优先级

但是,不是独享,未必就不能“秒到”。在服务商的处理中,有一个优先级处理。当不同的服务商优先级规则也不一样。有些服务商根据你的发送量来定义你的优先级,有些服务商根据你短信的业务类型来分优先级,甚至在一些公司,你所对接的接口销售给不给力,也会影响到你的“优先级”。

3、  服务商平台处理耗时

当短信提交到服务商的平台后,会经过各种逻辑处理,会产生一个耗时。一般服务商的这个耗时在几毫秒到几十毫秒,可以忽略。当然也有差的。

还有一个人为处理的耗时。尤其企业发送批量群发短信的时候,比较明显。短信提交后不是立刻下发的,为了避免用户发送违法违规的内容,第三方服务商会有一个人工的审核,这个审核的耗时取决于服务商的审核人员的效率,当前整个平台上用户的提交的待审核短信量等等。所以往往,在节假日,大促时,人工审核会很大的影响你的短信发送,甚至会有漏审、误审导致你的短信没发出去的。

也许你会碰到一些服务商,使用短信模板,要求你先提交模板,审核通过后再发。可能你会觉得不方便,但是,这却是对你相对可控的策略。因为提前审核通过的模板,在你实际发送的时候就没有人工审核了,可以及时的发送。一个是先发后审,一个是先审后发,从可控的角度,先审更好,如果提前知道内容有问题,还可以做修改直到通过为止,如果活动开始以后才知道内容过不了,这锅服务商是不会帮你背的……

4、  落地网关→下发网关→手机的耗时

经常看到服务商说“短信5秒内必到”,甚至承诺更短的时间,很抱歉,那些都是不真实的。

当你的落地网关和下发网关是一个地方的时候,速度会比不同的时候更快。通道落地在上海移动,给上海移动手机发,会比给北京移动的手机发送更快,这个耗时,不太好统计。

2G/3G/4G等网络环境,也会影响耗时。影响幅度不确定。

手机所处的信号状态,也会影响短信的接受速度。信号不稳定或不好的地方,接收会慢。

我们落地在上海移动的通道给我上海移动的手机(iphone,4G)发送短信时,基本是点下去就收到了的,可是同一个通道给我们不同的监控机发送的统计来看,在2-6秒不等。

根据我们的监控统计三网所有用户的数据显示,客户在实际发送时,大约70%的短信,会在5秒内到达,25%左右在5-10秒内,也就是说,在实际场景下,大约95%的短信,会在10秒内到达用户手机。这是客观真实的情况。

小结:总的来说,发送速度是很能体现供应商的技术实力及资源实力的。在这方面,通常来说,大公司相对小公司强。偶有例外。不要轻信销售的口头承诺和接入测试期的情况,多在实际运营过程中去检验。

三、稳定性

容易被忽视的一个指标。无论你选择直接跟运营商合作,还是和第三方服务商合作,都会面临这个问题。应该有很多用户碰到过这种情况:短信挂了,发现了去找服务商,过了段时间好了,然后对于之前挂的问题,服务商会给出“机房断电了”,“运营商故障”等等解释。而这时候,你的损失已经无法挽回。影响到服务稳定性的因素很多,常见的有网络环境、服务器超载、运营商割接导致的终端、运营商故障等等。这些问题不可避免,但是优质的服务商可以通过严密的监控和切换逻辑,将这些故障的影响降到最低。

以通道故障为例,如果是落地网关的故障,有些公司在没有监控或只是通过状态报告成功率来监控的情况下,发现问题的时候已经滞后半小时甚至更久。而在没有自动切换的情况下,尤其是节假日和半夜,没有人及时的来处理,这种服务中断可能是半小时一小时,可能是几小时更久。对于这个问题,云片的有自己的监控和自动切换平台。我们对所有的通道每分钟一次做监控,发现异常后系统自动切换通道,从问题的发现到切换在一分钟内完成。这意味着如果你的用户使用的验证码短信因为通道故障第一条没有正常送达用户的话,当这个用户在1分钟后再次尝试获取验证码时,短信的通道故障已经被排除。

小结:理论上,如果你或者你的服务商,通过网络的监控、API请求的监控、服务器负载的监控、通道实际发送监控以及状态报告统计监控等各个维度的监控及处理机制,能够有效的提高服务的稳定性。这些监控,通常企业不会投入太多的时间和精力自己做,或者做了但是做得并不专业,运营商也无法给用户提供这类服务,所以选择一个靠谱的第三方服务商是最好的解决办法。

四、价格

(略)


原文作者所服务的公司:云片,www.yunpian.com

推荐阅读更多精彩内容