MD简介
MD的全称是MessageDigest Algorithm 在年代初由MIT的计算机科学实验室和RSA Data Security Inc发明经MDMD和MD发展而来
MessageDigest泛指字节串(Message)的Hash变换就是把一个任意长度的字节串变换成一定长的大整数请注意我使用了字节串而不是字符串这个词是因为这种变换只与字节的值有关与字符集或编码方式无关
MD将任意长度的字节串变换成一个bit的大整数并且它是一个不可逆的字符串变换算法换句话说就是即使你看到源程序和算法描述也无法将一个MD的值变换回原始的字符串从数学原理上说是因为原始的字符串有无穷多个这有点象不存在反函数的数学函数
MD的典型应用是对一段Message(字节串)产生fingerprint(指纹)以防止被篡改举个例子你将一段话写在一个叫readmetxt文件中并对这个readmetxt产生一个MD的值并记录在案然后你可以传播这个文件给别人别人如果修改了文件中的任何内容你对这个文件重新计算MD时就会发现如果再有一个第三方的认证机构用MD还可以防止文件作者的抵赖这就是所谓的数字签名应用
MD还广泛用于加密和解密技术上在很多操作系统中用户的密码是以MD值(或类似的其它算法)的方式保存的 用户Login的时候系统是把用户输入的密码计算成MD值然后再去和系统中保存的MD值进行比较而系统并不知道用户的密码是什么
一些黑客破获这种密码的方法是一种被称为跑字典的方法有两种方法得到字典一种是日常搜集的用做密码的字符串表另一种是用排列组合方法生成的先用MD程序计算出这些字典项的MD值然后再用目标的MD值在这个字典中检索
即使假设密码的最大长度为同时密码只能是字母和数字共++=个字符排列组合出的字典的项数则是P()+P()…+P()那也已经是一个很天文的数字了存储这个字典就需要TB级的磁盘组而且这种方法还有一个前提就是能获得目标账户的密码MD值的情况下才可以
在很多电子商务和社区应用中管理用户的Account是一种最常用的基本功能尽管很多Application Server提供了这些基本组件但很多应用开发者为了管理的更大的灵活性还是喜欢采用关系数据库来管理用户懒惰的做法是用户的密码往往使用明文或简单的变换后直接保存在数据库中因此这些用户的密码对软件开发者或系统管理员来说可以说毫无保密可言本文的目的是介绍MD的Java Bean的实现同时给出用MD来处理用户的Account密码的例子这种方法使得管理员和程序设计者都无法看到用户的密码尽管他们可以初始化它们但重要的一点是对于用户密码设置习惯的保护
有兴趣的读者可以从这里取得MD也就是RFC 的文本
实现策略
MD的算法在RFC中实际上已经提供了C的实现我们其实马上就能想到至少有两种用Java实现它的方法第一种是用Java语言重新写整个算法或者再说简单点就是把C程序改写成Java程序第二种是用JNI(Java Native Interface)来实现核心算法仍然用这个C程序用Java类给它包个壳
但我个人认为JNI应该是Java为了解决某类问题时的没有办法的办法(比如与操作系统或I/O设备密切相关的应用)同时为了提供和其它语言的互操作性的一个手段使用JNI带来的最大问题是引入了平台的依赖性打破了SUN所鼓吹的一次编写到处运行的Java好处因此我决定采取第一种方法一来和大家一起尝试一下一次编写到处运行的好处二来检验一下Java 现在对于比较密集的计算的效率问题
实现过程
限于这篇文章的篇幅同时也为了更多的读者能够真正专注于问题本身我不想就某一种Java集成开发环境来介绍这个Java Bean的制作过程介绍一个方法时我发现步骤和命令很清晰我相信有任何一种Java集成环境三天以上经验的读者都会知道如何把这些代码在集成环境中编译和运行用集成环境讲述问题往往需要配很多屏幕截图这也是我一直对集成环境很头疼的原因我使用了一个普通的文本编辑器同时使用了Sun公司标准的JDK for Windows NT
其实把C转换成Java对于一个有一定C语言基础的程序员并不困难这两个语言的基本语法几乎完全一致.我大概花了一个小时的时间完成了代码的转换工作我主要作了下面几件事
把必须使用的一些#define的宏定义变成Class中的final static这样保证在一个进程空间中的多个Instance共享这些数据
删去了一些无用的#if define因为我只关心MD这个推荐的C实现同时实现了MD MD和 MD而且有些#if define还和C不同编译器有关
将一些计算宏转换成final static 成员函数
所有的变量命名与原来C实现中保持一致在大小写上作一些符合Java习惯的变化计算过程中的C函数变成了private方法(成员函数)
关键变量的位长调整
定义了类和方法
需要注意的是很多早期的C编译器的int类型是 bit的MD使用了unsigned long int并认为它是bit的无符号整数而在Java中int是 bit的long是 bit的在MD的C实现中使用了大量的位操作这里需要指出的一点是尽管Java提供了位操作由于Java没有unsigned类型对于右移位操作多提供了一个无符号右移>>>等价于C中的 >> 对于unsigned 数的处理
因为Java不提供无符号数的运算两个大int数相加就会溢出得到一个负数或异常因此我将一些关键变量在Java中改成了long类型(bit)我个人认为这比自己去重新定义一组无符号数的类同时重载那些运算符要方便同时效率高很多并且代码也易读OO(Object Oriented)的滥用反而会导致效率低下
限于篇幅这里不再给出原始的C代码有兴趣对照的读者朋友可以去看RFC MDjava源代码
测试
在RFC 中给出了Test suite用来检验你的实现是否正确
MD () = ddcdfbeecfe
MD (a) = ccbcfbace
MD (abc) = cdfbdfdef
MD (message digest) = fbdcbdafaafd
MD (abcdefghijklmnopqrstuvwxyz) = cfcddedfbccaeb
……
这些输出结果的含义是指空字符串的MD值是ddcdfbeecfe字符串a的MD值是ccbcfbace……
编译并运行我们的程序
javac –d MDjava
java beartoolMD
为了将来不与别人的同名程序沖突我在我的程序的第一行使用了package beartool;
因此编译命令javac –d MDjava 命令在我们的工作目录下自动建立了一个beartool目录目录下放着编译成功的 MDclass
我们将得到和Test suite同样的结果当然还可以继续测试你感兴趣的其它MD变换例如
java beartoolMD
将给出的MD值
可能是我的计算机知识是从Apple II和Z单板机开始的我对大写十六进制代码有偏好如果您想使用小写的Digest String只需要把byteHEX函数中的ABCDEF改成ab cdef就可以了
MD据称是一种比较耗时的计算我们的Java版MD一闪就算出来了没遇到什么障碍而且用肉眼感觉不出来Java版的MD比C版的慢
为了测试它的兼容性我把这个MDclass文件拷贝到我的另一台Linux+IBM JDK 的机器上执行后得到同样结果确实是一次编写到处运行了
Java Bean简述
现在我们已经完成并简单测试了这个Java Class我们文章的标题是做一个Java Bean
其实普通的Java Bean很简单并不是什么全新的或伟大的概念就是一个Java的Class尽管 Sun规定了一些需要实现的方法但并不是强制的而EJB(Enterprise Java Bean)无非规定了一些必须实现(非常类似于响应事件)的方法这些方法是供EJB Container使用(调用)的
在一个Java Application或Applet里使用这个bean非常简单最简单的方法是你要使用这个类的源码工作目录下建一个beartool目录把这个class文件拷贝进去然后在你的程序中import beartoolMD就可以了最后打包成jar或war是保持这个相对的目录关系就行了