哈佛机:体验一把穿孔纸带上的编程

稍晚些时候,踏足机电计算领域的还有哈佛大学。当时,一名在校的物理学博士生——霍华德·艾肯(Howard Hathaway Aiken),和当年的祖思一样,被手头繁复的计算困扰着,一心想建台计算机,于是从1937年开始,抱着方案四处寻找愿意合作的公司,最终是IBM伸出了橄榄枝。

霍华德·哈瑟维·艾肯(Howard Hathaway Aiken),1900-1973,美国物理学家。(图片来自维基百科)

彼时的IBM,已是单元记录市场的巨头企业,拥有丰富的计算设备建造经验。而除了其主营的制表机型,当时的总裁托马斯·沃森(Thomas John Watson)对尝试通用计算机也颇有兴趣。

艾肯想实现自己的理想,沃森想进一步提高公司的声誉,两人一拍即合。1939年3月31日,哈佛和IBM签订协议,哈佛方面由艾肯主导设计,IBM方面则派出顶尖的工程师团队负责实现,最终成果归哈佛所有。

IBM斥资40~50万美元,却甘愿把成果拱手相让,正是因为沃森不在乎钱也不准备打造产品,而纯粹是为了彰显公司的实力。照理说,哈佛和IBM的贡献是对等的。不料,在机器建好之后的庆典上,哈佛新闻办公室与艾肯私自准备的新闻稿中,严重偏袒了己方的功绩,对IBM的功劳没有给予足够的认可,把沃森气得与艾肯老死不相往来。

这台强强联合、于1944年完成的计算机名叫Harvard Mark I,在“娘家”IBM被称为IBM自动顺序控制计算机(IBM Automatic Sequence Controlled Calculator),ASCC。

Harvard Mark I

Mark I是当年的大型计算机,它由约765000个机电元件组成,内部电线总长达800公里。机器长约15.5米,高约2.4米,重达5吨,撑满了整个机房的墙面。机器左侧的玻璃柜中,是2个30行24列的置数旋钮阵列(图中只出镜了一半),可输入60个23位十进制数(留出1位表示正负,0表示正、9表示负);中间部分是更为壮观的计算阵列,由72个计数器组成,每个计数器包括24个机电计数轮,共可存放72个23位十进制数;机器的右侧部分是若干台穿孔式输入输出装置,包括2台读卡器(用于输入相对固定的经验常数)、3台穿孔带读取器(分别读取存有常数表、插值系数和控制指令的3种穿孔带)、1台穿孔机和2台自动打字机。

图片来自《A Manual of Operation for the Automatic Sequence Controlled Calculator》

从数据输入,到数据处理,再到输出,Mark I自始至终在与十进制打交道,即便它使用了继电器和穿孔技术。不论是置数旋钮,还是计数器,其背后都是10齿的金属轮。对于每个金属轮,都有一个电刷与它的某个齿接触,接通表示相应数值的电路。这个电路进而可以引起某个磁性爪抓住另一个金属轮的轴,并带动它旋转相应的角度——如此,一个轮的数值便作用到了另一个轮身上。

为了编程,艾肯给72个计数器和60组置数旋钮进行了统一编号:

Mark I计数器编号
Mark I置数旋钮组编号

乍看之下,编号的规律让人摸不着头脑。其实,这和穿孔带有关。

控制机器运行的穿孔带上每一行有24个孔位,使用时分成3组,每组8位,用于表示数据地址或操作指令。艾肯将一组的8个孔位从右至左标为1~8,因此以上2表中的编号总是由数字1~7组成。

Mark I上的纸质穿孔带(图片来自维基百科)

当我们进一步将这些编号转换为穿孔带上的孔洞时,不难发现它们本质上就是顺序增长的8位二进制编码:

Mark I数据地址编号的穿孔形式

与其说艾肯用十进制为数据地址编号,不如说他想出了一种二进制码的十进制表示,让使用者更容易阅读、熟记和交流。

操作指令也有类似的编号,比如加法指令是7,清空指令也是7,打印指令是7432和74321(对应2台打字机),乘法指令是761,正弦指令是7631。这些指令往往包含数字7,因为机器只有在遇到含7的指令时才会继续往下执行,后者会暂停。不同指令在24个孔位中的位置也有所不同,对于不涉及数据的操作,指令可以占据前8位;对于涉及数据的操作,前8位乃至前16位就需要让给数据地址,指令只能退居末8位了。以下为几条具有代表性的代码示例。

怎么样?是不是挺容易呢?将这些由数字构成的简单语句按照一定顺序排列,用穿孔机在纸带上打出相应的孔洞,就形成了Mark I可以识别的程序,足以解决各种复杂的数学问题。在Mark I上运行的第一批程序,就包括了冯·诺依曼为曼哈顿计划所编写的原子弹内爆模拟程序。

Mark I穿孔机(图片来自维基百科)

在计算速度上,Mark I的表现并不出众,一次加减运算需要3秒,乘法6秒,除法15.6秒,正弦和乘方往往超过1分钟,对数运算更是高达89.4秒。但它仍是当时一台十分成功的通用计算机,从1944年5月开始在美国海军服役了14年之久。

1959年,庞大的Mark I被拆解,部件分布于哈佛大学、IBM和史密森学会。

后话

和祖思一样,艾肯的方案并不局限于某种材料,他更关注计算机的整体架构。在IBM之前,他曾找到生产销轮计算器的门罗公司,如果协议达成,那么Mark I就会是纯机械的。

和IBM闹僵之后,艾肯继续在哈佛大学研制了Mark II~Mark IV,它们延续了Mark I的架构,在材料上进行了升级。1947年的Mark II是全继电器的,并使用了BCD编码;1949年的Mark III用5000个真空管和1500个晶体二极管取代了部分继电器,并引入了磁鼓、磁带等存储介质;1952年的Mark IV则已是纯电子计算机,并用性能更好的磁芯存储器替代了磁鼓。

与同时期其他“重复制造轮子”的先驱不同,艾肯“站在了巨人的肩膀上”,他深入研究了帕斯卡、莱布尼茨、巴贝奇、霍尔瑞斯等前人的工作,并对他们寄予了极高的评价。他充分参考了他们的成果,也将他们的失策引以为戒——正是有了巴贝奇的前车之鉴,艾肯选择直接利用IBM现成的制表机零件,而没有走自己生产元件的弯路。

也正得益于这份扎实的调研基础,艾肯对计算机科学有着更系统、更深刻的理解。1947年,他在哈佛大学开设了计算机专业的硕士学位,成为世界上第一位计算机科学教授,培养出一众出色的计算机学家。而几近10年之后,其他大学才陆续开设这一专业,并模仿着艾肯的教学体系。

参考文献

禁止转载,如需转载请通过简信或评论联系作者。

推荐阅读更多精彩内容