服务端技术全栈之九大门派

导语:本文是基于我github上的项目server-tech-tree:https://github.com/star2478/server-tech-tree的演绎版本,更详细内容(各门派核心技术原理分析)要去github上看。

自20世纪30年代现代计算机诞生至今,服务端软件技术(本文简称服务端技术)已经发展成为IT领域一大重要分支。大到操作系统,小到仅一行代码的工具,数以亿计的服务端软件运行在无数服务器和各类硬件设备上,支撑着现代人类文明的运转。

从难度来看,操作系统难度最高,直接对硬件进行驱动和抽象化,其次是编译器(编程语言),第三是数据库,这top 3是公认三大系统软件,再往下是框架、中间件,最后是各类应用级软件。学习软件,最好的方法是官方网站,有精力可以研究源码,其次是经典书籍,最后才是上网碎片化找答案。学习中最难获取的知识是每一项设计背后的思路和权衡,也就是要知其所以然,这往往需要主动思考和大量的经验推演,而有时设计者撰写的书籍也可能帮助到我们,比如Spring发明者Rod Johnson写的《Expert One-on-One J2EE Development without EJB》

时至今日,服务端技术分化出了九大门派,我在server-tech-tree上称为九大元问题,分别是开发效率、资源管理能力、可用性、伸缩性、性能、安全、质量、数据、智能。这九大派掌管并解读了服务端技术宇宙中几乎所有的奥义。

服务端技术九大门派

各大门派都有众多门徒,比如数据派有我们常用的MySQL关系型数据库、NoSQL以及各类大数据技术。有些技术一开始只属于某一门派,后来修炼了多门技艺,加入了多个门派,和牛顿既属于物理学家又属于数学家一个道理,比较典型的就是开发框架,比如Spring,一开始主要解决开发效率问题,后来不断发展到可用性、性能、安全、质量等方面。而有些技术从诞生之初就自带多门派属性,比如Serverless技术,既有开发效率又有资源管理能力。

在九大派中,开发效率是最古老的门派之一,自计算机技术诞生之初起,人类就在开发效率上竭尽脑汁。最直观的当属计算机语言,从机器0/1到汇编再到高级语言,发展趋势是越来越远离晦涩的硬件,那些对人类更友好简单、能更快开发出功能的高级语言成为主流。上世纪90年代是高级语言的黄金时代,89年Python、94年PHP、95年Java和JavaScript、00年C#,这些90后语言占据了当今计算机语言绝对统治地位,70后C语言、80后C++、00后代表Golang短时间内根本无法撼动他们。与此同时,由于人类对性能门派的拥护,或者由于习惯难以改变,或者由于升级成本较大,现在很多企业、机构或个人还在使用对程序员不太友好但性能杠杠的C语言,参见下图的TIOBE 2019年11月榜单,C语言占据16.037%份额,排在第二位,仅落后Java。

TIOBE编程语言2019年11月榜单

数据真正的开宗立派要追溯到1970年,那年47岁的IBM研究员埃德加·科德,发表了关系型数据库的奠基论文《大型共享数据库数据的关系模型》。时间一晃到了21世纪,Google一口气连续发表3篇划时代论文,03年GFS、04年MapReduce、06年BigTable,以此开创了大数据时代,数据派也迎来了第二春。

安全也是古老门派之一,上世纪70年代发明的诸多密码学(比如RSA)是该门派祖师爷级别的传家之宝。虽然不可或缺,但该门派向来都比较低调,直到08年中本聪第一次提出区块链,该门派迅速成为网红,迎来久违的高度关注。

2006年,Google CEO埃里克·施密特首次提出云计算的概念,同年亚马逊推出AWS,标志着云计算真正意义上的诞生,从此资源管理能力门派开始冒头。

还有,不得不提的是当前最火的智能,虽然该门派也已历史悠久,最早可追溯到首次提出AI概念的1956年,此间浮浮沉沉了多次,最近几年由于算力提升和数据加持,迎来了强势回归,其门徒活跃在各行各业,其发展已上升到国家战略级别。

最后,还有一些近年来未产生革命性技术的门派,比如伸缩性可用性质量,这属于自然发展历史规律,相信不久将来这些门派会迎来自己的爆发。

如果你创建了一门新技术,它到底属于哪个门派,要看该技术主要解决什么问题。比如,为了解决应用的性能问题,我们自研了一套缓存技术,它可能就属于性能门派。为了方便大家分清各大派,避免加错组织,各大门派定义了自己的事务范畴,一门技术所解决的问题只要在某个门派事务范畴内,就可以自称归属该门派,各大派事务范畴的定义如下:

开发效率:指开发完成需求的速度。我们常见的软件复用性、可移植性、可理解性等问题,归根结底都是要解决开发效率问题。

资源管理能力:指对资源(软件及其使用的硬件)进行部署、监控、调配、备份、采集、存取、展示、故障处理等管理的能力。解决此问题要靠提升管理能力,具体就是减少管理成本和提升管理全面性,详见指标。云计算、运维人员、DevOps尤其关注此问题。

可用性:也称稳定性,是指系统开始运行之后,不发生故障(能正常提供服务)的概率和能力。

伸缩性:指系统(尤其分布式系统)在增加或减少硬件资源时能够继续服务的能力。

性能:指系统的运行速度和消耗资源量。

安全:指系统的漏洞问题,由漏洞频率、漏洞周期等若干指标组成。漏洞指的是软件中存在能被攻击者利用来实施窃取信息、瘫痪系统等攻击的地方。

质量:指系统的缺陷问题,由缺陷频率、缺陷周期等若干指标组成。缺陷和漏洞很容易混淆,缺陷是软件功能未实现、实现不完整、实现不正确的地方。测试人员尤其关注此问题。

数据:指数据在存取和分析过程中的效率、管理能力、可用性&一致性、伸缩性、性能、安全、质量问题。

智能:特指当前软件人工智能问题,其指标主要对标机器学习的模型评估标准。当前机器学习主要关注在分类、回归、聚类三个子问题上,所以指标也以这三个问题来划分。

同一个门派里,有些人是九段高手,有些人是菜鸡,这是怎么分出来的呢?原来,各大派都制定了一套森严的标准,谁指标完成得好谁就厉害,非常透明。各大派具体的指标详见元问题定义和指标

如果你对各门派主要核心技术和原理感兴趣,可以关注我github上的项目server-tech-tree,那里会不间断更新各门各派核心技术的原理分析,包括热门的Spring (Boot/Cloud)MySQLABCD(AI/Blockchain/CloudComputing/Data)等。

推荐阅读更多精彩内容

  • 金钱只是富人呈现在世人面前的结果而已,那些促成富人成功的要素才是关键所在,也是他们与普通人的差别所在!
    悟空问道阅读 261评论 0 1
  • 考试 复习时习惯胡思乱想 习惯畏手畏脚 但又不甘心自己的野心被磨灭 想重新来过 想放弃 总做白日梦 但是又时常不知...
    竹叶舟阅读 83评论 0 1
  • 今天帆帆写作业积极,早早地把作业写完了,就是没有检查,8点多才改完错,还是给她一颗星吧。让我陪她玩儿了翻花,快20...
    芃芃___阅读 58评论 0 0