数据储存的阴谋论
小庄/文
“2045年,我那现在还没有出生的祖孙孙们在我那现在还没有买下的房子里翻找阁楼上的老古董,他们看见了一封1995年写的信以及一张CD光盘。信里面说,这张光盘中有一个文档,里面有我那现在还没有赚到的遗产。祖孙孙们当然非常开心,但是接下来马上就开始发愁了——他们从来没有在电影以外的现实生活中见过压缩光盘这种东西;更何况,即使他们能够找到一个什么器件让这玩意儿转起来,可是又能从哪里搞到能读出可以看明白的字儿的软件?说白了,几十年后,那些陈旧的数字文档可怎么用?”
以上是计算机科学家与数字存储专家杰夫·罗森博格在1995年1月号《科学美国人》上发表的文章《确保数字信息长命百岁》的开篇,作者由此提出一个被他冠以“祖父两难”之名的问题:前辈们费尽周折存储、保留下来给后代的重要信息载体,最后只会成为一堆毫无头绪、无法显示的废品。
纸全废了,就只剩计算机,这个教训有点大
作为世界级的数据老法师,罗森博格在很多文章里都致力于提出一些未雨绸缪的解决方案,防止此类事件发生,比如说呼吁创建一套开放标准来保证计算机系统和应用软件的兼容性,即便将来的硬件和软件千变万化,也能不离其宗,该读取时就读取。但是,现实中的一切可不像想象的那么简单,他也有无计可施之时——比如《末日审判书》的数字版恢复问题。
“征服者威廉”1066年成为英格兰国王威廉一世,1085年下令调查英格兰的人口和土地的分配情况。调查于1086年8月初步完成,调查结果集合为一本土地志,被称为《末日审判书》,里面记录了土地拥有者名下的土地和佃户,多少人在使用这片土地(除了佃户以外还有村民、无业游民和奴隶),林地和草场的数量,家畜、鱼类、犁和其他物资的数量,以及建筑的明细,包括教堂、城堡、作坊、盐仓,等等,总之,被威廉视为自己治下代表价值的动产和不动产全都囊括在内,并号称“没有一个人或一亩地,没有一头牛或一头猪被遗漏”;而就“审判日”一词乃是从《圣经》里面借用来的事实而言,足见其牛气冲天。900年后的1986年,英国广播公司(BBC)花了250万英镑为《末日审判书》制造了一个多媒体的计算机软件复制品。这个电子版内容超过了真本,其中有25万个地名、2.5万张地图、5万张图片、3000套资料、60分钟电影,外加几十份《英国生活》的说明。参与项目的相关人员超过100万,最后所有成果集合在一张12英寸的光盘上,只有利用BBC当年购置的特殊计算机才可读取和处理。但是不承想,2002年有人想用同样的计算机来阅读光盘资料,却没有获得成功;接着又试了许多办法,竟无一有效。于是,杰夫·罗森博格被邀请去协助解决问题,在对情况进行了分析之后,他不得不承认“当前还没有明显有效的技术可以解决问题”。他认为,如果一个信息系统的行为能够被充分描述,以后的人就可按照这些描述来重新复制出原始系统所需要的数字文件,只可惜现在的信息科学还远远没有达到这么高的技术水平,所以,“我们日益增加的数码资产就有丧失的严重危险”。极具讽刺意味的是,《末日审判书》原件写在纸上,历经近千年变迁后仍然保存完好,适于阅读。
所以,我们有一千个理由去礼赞冯·诺依曼,他发明的那台机器自问世以来彻底改变了整个人类社会的生活秩序,同时也有第一千零一个理由去质问:嗯,这个东西是不是外星人用来颠覆地球文明的手段之一?想象一下,数字化以后的各种档案、文件,说白了就是那些能够在某种程度上证明我们曾经存在的痕迹,看似收编得整整齐齐,却脆弱得不堪一击,销毁起来轻而易举!就在刚刚过去的不长一段时期中,著名的例子比比皆是:1960年代美国的人口调查数据因为软件改变差一点无法保存下来;1960年代纽约州商务部与康奈尔大学合作进行的土地利用与自然资源调查计划的资料早已不存在;1964年麻省理工学院与卡内基梅隆大学的第一封电子邮件因系统改变而报废;1970年代比利时的人造卫星观测数据,特别是其中有关亚马逊河变迁的资料已经遗失;甚至1990年美国国会众议院的报告也难逃厄运。
未完,更多精彩内容,见《科幻世界》杂志。


