第9章 跳舞小人(第3/5页)

频率分析手段面对自然语言几乎是无敌的,只要样本量够,一定有办法破解,所需要的只是足够的计算力而已。这直接导致了战争各方对运算能力的需求急速增长。从草稿纸到计算尺,再到电子打孔计算机,算力演进的军备竞赛成了决定战争胜负的重要因素。

在二战刚刚结束的1946年,算力的军备竞赛创造了一个伟大的成果,为破解德军密码而研发的ENIAC姗姗来迟。ENIAC,这个迟来的人类第一台计算机从此改变了我们文明的进程,地球走进了由恐怖运算能力构成的信息时代。

白泓羽这时才第一次意识到,密码学是人类二十世纪科技大爆炸的最重要肇因之一!

然而,她并没有意识到,人类文明已经再次站在因为密码而骤变的路口。

随着频率分析这个无敌武器的泛滥,加密方式终于不得不进行革新——用复杂密钥字典来代替简单密钥字典,以掩盖密文的频率规律。换句话说,原文的A在某些时候会被加密成X,在某些时候又会被加密成Z。密文字频与原文字频的联系被破坏,除非找到对应的加密字典,否则很可能永远无法解开密码。

二十世纪的冷战时期,间谍曾一度使用唯一的一次性密码字典:没有任何规律的解码字典所含的信息量已经远远超过了密文本身。除了发信人和收信人,任何人都无法破解密文的内容。但这种手法失败得出人意料:许多情报因为一次性密码字典丢失而变成了废纸。

冷战之后,随着计算机的普及,二进制数据代替自然语言成了通信的基本载体。语言频率分析法最终宣告失效——二进制数据文件有无数种可能的格式,要进行频率分析,第一步必须了解原文文件的编码规律——图像、语音等各种文件的频率复杂度远在语言文字之上。

然而,加密手段在计算机可怕的算力模型下飞速发展,区块链、公钥、私钥,加密算法的多重叠加达到了难以想象的程度,复杂字典也终于被抛弃了——在没有密钥的情况下,单纯依靠密码碰撞来破解,需要全球算力运行几千年。

但无论如何,加密逻辑依然是不变的:将明文原文通过特定的加密算法进行加密,加密算法结合特定的密钥,两者决定加密的实际过程。如果既不知道密钥,也不知道加密算法,密码的破解是非常困难的。

虽然白泓羽只是粗浅地研究了密码学,但作为一个科学素质满分的专业人才,这已经足够让她意识到问题了。

所有的人类语言学分析也好,密码频率分析也罢,都基于一个关键基础:人类的世界共识。

因为大家都是人类,身体都是由蛋白质、脂肪、糖类、水等元素构成,人类无论在哪里生活,都以基本成分相同的物质作为食物,需要水分和氧气;有两个性别,女性怀孕,胎生;双目视觉,有立体景深,视觉能侦测的电磁波范围在380nm-760nm,通过520nm(绿色)、480(蓝色)、700nm(红色)三种原色组合理解视觉空间。人类一切智慧交互的信息都围绕着这些物质基础进行理解:食物可能在不同文化中指代面包、米饭、烤肉,但不会指代月亮。这些物质共识决定了信息的组织结构:人类的嘴作为消化道的入口和发声器官,语言里自然会把说和吃的语意进行混合,同样如果人类是腔肠动物,食物的消化和排泄都通过口器进行,那么“吃饭”和“拉屎”很可能是同一个词。

那么,一个信息不是来自人类,甚至不是来自地球,我们要怎么去破解这些信息的智慧内容?

白泓羽想起一些科幻作品里人与外星文明的交流,这时候就觉得很滑稽。想要理解来自人类以外的信息,必须和对方面对面地用同样的指代一对一完成语意对应。但是这也很难,你怎么知道外星文明往看起来像嘴一样的器官里塞东西是吃饭,而不是交配?你怎么确定外星文明是单性繁殖还是多性繁殖?