《破译》

下载本书

添加书签

破译- 第23部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
,相当于在一万个字母中平均出现八次。另外,从单词的使用频率看,定冠词the的使用频率最高,其次是专有名词和it等代词,还有in和on等前置词的使用频率也很高。从字母在单词中的分布来看,也有一些规律,字母Y总使用频数的百分之九十都集中在单词的结尾,而W的百分之九十都集中在单词的开头,P和C在单词的开头多,在结尾少,R在单词的中间出现较多,J和Q在缩略语以外的单词结尾不会出现,英文中仅有两个单词是由单字母组成的,就是A和I。此外还有很多类似的频率特征。

密码学家们还对日、俄、德、意、系、葡等语言的字母频数和使用频率进行过统计,也得出了类似的使用频率特征,制作出了相应的普遍使用频率表。文人小说下载

下面就是王玲统计出的这份密文中各个字母的频数:

表2

字母 A  B  C  D  E  F  G  H  I  J  K  L  M

频数 55  58  2  41  22  13  87  4  71  70  11  85  8

字母 N  O  P  Q  R  S  T  U  V  W  X  Y  Z

频数 50  14  12  0  12  23  1  2  40  80  8  96  3

这份密文共有八百九十三个字母,因此很容易算出各个字母的使用频率。然后再进行明密比较。

但是,并不是说将密文字母简单地用与其频率相近的英文字母代替就可以的,因为在一般情况下,这些密文字母在密文中的使用频率是不会离开它们所代表的明文字母的频率太远的。从表1中可以看出,明文字母E,T,A,O,N,R,I,S,H可称为高频字母群,D,L,F,C,U,M可称为中频字母群,G,Y,P,W,B,V可称为低频字母群,K,X,J,Q,Z则是罕见字母群。而且从中频字母群到高频字母群,一般都有个明显的频率跳跃,高频字母群中频率最低的字母H为0。0528,中频字母群中频率最高的字母D只有0。0378。这种不同频率字母群之间的突变,在密文字母的频率统计中应该有对应的表现。将密文字母按频数从多到少排列,高频字母群与中频字母群的分界线看来应该在N和D之间:中频字母群与低频字母群的分界线大概是E和O之间,虽然中频字母群应该是六个,而现在只有五个。低频字母群与罕见字母群的分界线大概在M和H之间,虽然低频字母群应该是六个,而现在是七个,于是就得出一个结论:中频字母群里少的一个字母很可能就是低频字母中多的这一个。

表3

Y  G  L  W  I  J  B  A  N  D  V  U  S

96  87  85  80  71  70  58  55  50  41  40  27  23

E  O  F  P  R  K  X  M  H  Z  C  T  Q

22  14  13  12  12  11  8  8  4  3  2  1  0

特别是字母Y,很可能是代表最常用的字母E,密文高频字母群中最低的字母N可能是代表明文字母h。密文中剩下的H,Z,C,T(密文中没有出现字母Q)几个字母很可能就是代表明文中罕见字母群K,X,J,Q,Z,但是具体哪一个代表哪一个还不知道。

现在再利用第二个突破口——语言的连接特征。在英语中,字母Q后面除了连接省略号外,几乎百分之百地连接着字母U,这就是连接特征中的后连接方式。另外,有些字母,它们分别在前面几乎总是连接那么少数几个字母:X前面连接的普遍是I和E,极个别的情况下是O和A。还有一种间断连接方式,在E和E之间R的出现频率最高。

较高频密文字母连接次数分类统计表:

表4

Y96  G87  L85  W80  I71  J70  B58  A55  N50  D41  V40

1Y1  7Y3  1Y7  7Y9  0Y2  4Y10  3Y10  10Y7  23Y1  8Y9  4Y14

3G7  0G0  8G2  15G9  3G9  5G17  7G8  10G12  6G0  2G1  3G7

7L1  2L8  1L1  13L6  3L2  11L20  1L6  4L10  16L1  3L10  4L4

9W7  9W15  6W13  2W2  4W9  5W0  12W5  3W0  0W21  8W1  6W3

2I0  9I3  2I3  9I4  1I1  9I15  6I3  2I3  2I1  2I8  10I2

10J4  17J5  20J11  0J5  15J9  3J3  1J7  0J1  0J0  0J0  0J7

11B3  8B7  6B1  5B12  3B6  7B1  6B6  2B0  0B10  4B0  1B1

7A10  12A10  10A4  0A3  3A2  1A0  0A2  15A15  0A0  0A0  0A2

1N23  0N6  1N16  21N  1N2  0N0  10N  0N0  0N0  1N0  10N2

9D8  1D2  10D3  1D8  8D2  0D0  0D4  0D0  0D1  1D1  1D1

14V4  7V3  4V4  3V6  2V10  7V0  1V1  2V0  2V10  1V1  1V1

4U2  5U6  3U5  0U6  11U3  1U0  2U1  0U2  0U0  1U1  0U0

5S4  0S6  2S2  1S0  7S1  0S0  1S0  0S1  0S0  3S0  0S0

8E7  2E2  3E3  0E4  0E0  9E1  1E2  1E1  0E0  1E0  0E0

1O6  2O0  0O0  3O0  1O0  0O0  2O0  2O1  0O0  0O2  0O0

1F0  0F0  2F1  0F2  5F1  0F6  1F2  0F2  2F0  0F4  1F0

0P3  3P0  1P2  0P0  0P0  8P0  0P0  0P0  0P6  0P0  0P0

0R0  1R2  1R1  0R2  0R4  1R0  0R1  1R0  0R0  5R1  0R1

1K8  3K0  3K0  0K0  1K1  1K0  0K0  0K0  0K0  0K0  0K0

1X2  1X2  1X1  0X1  1X4  0X0  4X0  3X3  0X0  0X1  0X0

2M0  1M4  0M2  0M0  01M  0M0  0M0  1M0  0M1  0M0  0M1

0H1  1H0  0H1  0H0  0H1  0H0  0H1  1H0  0H0  0H0  1H0

0Z2  0Z0  0Z0  0Z0  1Z1  0Z0  0Z0  0Z0  0Z0  0Z0  0Z0

0C0  0C2  0C0  0C0  0C0  0C0  0C0  0C0  0C0  0C0  0C0

0T0  0T0  0T0  0T0  0T0  0T0  0T0  0T0  0T0  0T0  0T0

在第一列中(Y96)中,G前面是数字3,表示字母Y在字母G前面出现三次,即字母对YG在密文中出现三次。G后面是数字4,表示字母对GY在密文中出现四次。

从表中数据可以看出,密文字母Y不但频数最大,而且与许多不同的字母连接,已经可以确定Y就是代表的明文字母e。

明文中频率特别高的是E,T,A三个字母,是密文中频率特别高的Y,G,L,W四个字母。假设这三个明文高频字母的代替字母就在这四个当中,已知Y代表E,那么T和A就在G,L,T当中。在高频字母中,元音字母经常出现在大多数字母的前后,而辅音字母则会避开大多数字母。就如字母E可以与任何一个字母组合,而字母J却很少会出现在字母B,D,G,J,K,M,Q,V的两边。从表4中可以看出G,L,T这三个字母的连接特征来,W与其他字母的连接特别少,因此可以得出字母W就是代表辅音字母T。则G和L中的一个则代表A。再加上前面得出的N可能代表的是H,就可以知道WNY代表的是单词the。
 
另外,明文中的三个高频原音字母A,I,O在连接上的特征是:它们与其他字母的连接总数相对较大,但是自己相互间却总是避免相连。观察统计表4,由于字母Y和W已经被推断出来,于是选择具备这些特征的排列在最前面的G,L,I三个字母来假定为A,I,O。但具体是哪一个代表哪一个还不知道。于是又根据明文中io的频率比较高,而oi,ia,ai,oa,ao的频率则很低的现象来确定。统计表4给出了密文中相应字母对出现的频数,GL2次,LG8次,GI9次,IG3次,LI2次,IL3次,因此可以假定出现九次的GI=io,于是L=A。

明文辅音字母中最具特征的是字母N,因为它的前连接字母有五分之四是元音字母,字母连接统计表4表中,在密文字母J的前面,较多地连接有字母Y,G,I,L,七十三次中占有六十二次,于是得出J表N。

有些字母的推论有很多不同的方法,通过不同的方法来验证就更能确定推论结果的准确性。比如对于已经大概知道了的N(代表H)W(代表T),就可以用另外的方法来验证。在连接统计表4中,N的特点也很明显,它总是连接在Y(已经确定为E)的前面,达二十三次,而在它后面却只出现了一次,这个特点与明文字母H的特点正好相同,he是英文最常见的字母对之一,而eh则十分罕见,这也能证明N很可能是代表字母H。另外在表4当中,N在W后面多达二十一次,而从未在它后面出现过,明文中th也是最常见的字母对,而ht却十分罕见,则密文字母W就很可能是代表T。还有一个方法可以进一步验证,明文字母H正好同N相反,它居于元音字母之前的次数大约是跟在它们后面的十倍。在连接统计表4中,可以看出密文字母N在Y,G,I,L之前的次数为三十七次,而在后面的次数为三次。通过这几方面的验证,基本上可以肯定N代表H,W代表T。

当然,密码的破译虽然要用到数学方面的知识,但是毕竟不可能像做数学题那样每一个步骤都是可以证明的。更多的是需要假设,还需要运气,比如在划定出大概的某些字母代表某些字母后,你就可以假设某一个字母代表某一个字母,在不断假设的情况下,将已知的字母代替到密文当中,这样一步一步推论下去,如果运气好,有可能每一步都很顺利地走对了,一旦出错,又得从头再来。好比学生做四选一的选择题,根据已经掌握的知识只能排除其中两个选项时,剩下的就只能依靠运气在另外的两个选项里选择一个,但是选择错了就算失败了。而幸运的是此类密码破译的这一环节在选择后,在继续的工作中如果发现错了,再返回来重新选择就成功了。

现在将已经识别的字母全部代入密文,代入的结果如下表:

SGRLSIWIGJ RIFDUGAYVNGJLNYLETFLDWYDBNLB

I a ot o in o I e h ina hea ate ha

EYVGEYEWIBIIJALFJVNLUFAABVLAYIUUYJBGKYW

e i e to oon a n h a a eo en i et

NYLWWLVH MGAA OY WNY UGDBWVNIGVYGJJIDW

he atta I e theit hoi e in no t

NVNGJLJIDWNVNGJLLUWYDWNYMLDBNLJPNLG MG

h hina no thhina a tet h e a hang hai i

AA OYVISYWNYUIVFBIULWWLVHIJIFDSGAGWLDRIO

e o
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架