1、JAVA 类文件保护分析与研究【摘 要】:由于 Java 语言面向对象和编译成中间代码执行的特点,其在抗反编译和反盗版方面显得尤其脆弱。本文针对 Java 软件的特点,运用多种方法,综合设计出一个保护 Java 类 文件的方法。关键词:Class;加密;密钥;代码混淆1. 引言目前,Java 编程语言的应用在全世界范围正流行,它广泛的应用在 Internet 的数据库、 多媒体、CGI 及动态网页的制作方面。1999 年在美国对 Java 程序员的需求量首次超过 C+。 经调查统计,Java 语言应用在软件领域占领着举足轻重的地位,为人类科技文明进步奠定了 重要基础。然而,Java 语言却存在
2、着巨大的安全隐患。Java 是一种跨平台的、解释型语言。 第一,Java 源代码编译中间“字节码”存储于 Class 文件中。Class 文件是一种字节码形式的中 间代码,该字节码中包括了很多源代码的信息,例如变量名、方法名等;第二,由于跨平台 的需求,Java 的指令集比较简单通用,较容易得出程序的语义信息;第三,Java 编译器将每 一个类编译成一个单独的文件,这也简化了反编译的工作;第四,Java 的 Class 文件中,仍 然保留所有的方法和变量的名称,可以通过这些名称来访问变量和方法,这些符号往往带有 许多语义信息。因此,Java 程序的这些特点,很容易对不经过处理的 Java 程序
3、进行反编译。 目前,市场上有许多优秀的 Java 反编译工具,能够反编译出非常接近源代码的程序。所以, 对开发人员来说,如何保护 Java 程序就变成一个非常重要的任务。2. Java 类文件的安全威胁 Java 的编译 开发 Java 应用程序首先是使用编辑工具编写 Java 的源代码,然后使用编译器编译成虚 拟机可执行的 Class 类文件。编译后生成的类文件是一种有格式的中间代码字节码文件, 不能在本地机器上独立运行,只能在 Java 虚拟机里解释执行。Java 编译器不对变量和方法 等符号的引用转换为数值引用,也不确定程序执行过程中的内存布局,而是将这些符号的引 用信息保留在类文件中,
4、由解释器在运行过程中创建内存布局,然后再通过查找表来确定一 个变量或方法所在的地址1。从 Java 类文件的结构及其实际数据可知 Java 类文件保留了源代码文件的大部分信息, 如所有的变量和方法等信息。正是由于这个特点,只要在各个平台上实现了各自的 Java 虚 拟机,不用修改 Java 应用程序的源代码就可以在各个平台上运行,真正做到跨平台的特性, 这也是 Java 能够迅速流行起来的重要原因。 Java 的反编译 反编译是一个将目标代码转换成源代码的过程。而目标代码是一种用语言表示的代 码,这种语言能通过实机或虚拟机直接执行。从本质上说,他需要根据小规模、低层次的行 为来推断大规模、高层
5、次的行为。因此,反编译目标代码并不容易。在 JDK 中,有一个反编译器 javap,利用该工具可以对 Java 类文件进行反编译。经过该工具反汇编后得到的结果并不是源代码,但是使用 javap 进行反编译的 Java 类文件可以得 到成员变量、方法、行号以及局部变量名等信息。在 javap 工具的基础上,一些反编译工 具如 Mocha,WinDis,DjDecompiler 等工具可反编译出和源代码几乎一摸一样的代码。3. 常用 Java 类文件保护方法由于 Java 字节码的抽象级别较高,容易被反编译,所以就有了多种防止 Java 字节码被 反编译的方法。隔离 Java 程序:最简单的方法就
6、是让用户不能够访问到 Java Class 程序,这种方法是最 根本的方法,具体实现有多种方式。代码混淆:这种方法对 Class 文件进行重新组织和处理,使得处理前后的代码具有相同 的语义,被混淆后的代码很难被反编译。转换成本地代码:本地代码难以被反编译,开发人员可以选择将整个应用程序或关键模 块转换成本地代码。如果仅仅转换关键模块,在使用这些模块时,需调用 JNI 技术,这将牺牲 Java 的跨平台特性加密 Class 文件:为了防止 Class 文件被直接反编译,可以将一些关键的 Class 文件加密,例如对密钥、加密算法、注册码、序列号管理相关的类等。在使用这些被加密的类之前 先解密,然
7、后再将其装载到 JVM 中。对比上述几种方法,都存在其自身的优缺点。隔离 Java 程序只能适合网络环境的客户 机/服务器结构或者分布式的环境,对单机运行的程序就无法隔离,而且 Java 程序需要使用 安全机制保护服务器开放接口的使用,服务器的安全成了整个系统安全的焦点。代码本地化, 对于不同的平台,需要维护不同版本的本地代码,这将加重软件支持和维护的工作。对 Class 文件进行加密,在使用时再进行解密,同时将关键加密代码部分进行代码混淆,这样经过双 重处理后,代码的安全性提高了很多,该方法也是本文研究的重点。4. Class 文件加密技术Java 生成的 Class 文件大量暴露在客户端,
8、利用现在的反编译工具可轻易的获取源代码, 下面将讲叙如何有效的保护 Class 文件。第一,读取本工程的所有待加密 Class 文件,并保存到 byte 型数组中;public static byte symmetricEncrypt(byte key, byte classData) ;方法对读取到的所有 Class 文件进行加密, key 为用来加密的密钥,classData 为所读到的待加密 Class 文件, 返回结果为加密后的 Class 文件,然后将其写回原来的 Class 中,保证结构的完整性。第二,加密过的 Class 文件在使用之前需先对其进行解密。Java 虚拟机有默认的类
9、加载器,但是若要它根据用户提供的密码解密代码就难以做到, 此时需要通过自定义 ClassLoader 类来完成加密类的装载。自定义的 ClassLoader 首先找到被 加密过的类,然后进行解密,最后将解密后的类装载到 JVM 中。这里我的自定义 ClassLoaderClassLoader appLoader=new EncryptedClassLoader(), new File(args1);().setContextClassLoader(appLoader);final Class app = (args);其中参数 args1传入的是方法所在的工程名,args为主函数所在的类名。在
10、加载类后,系统的默认 findClass()并未对加载的类作任何处理,由于 Class 文件已被加密过,此时若运用系统方法 findClass()则会抛出 ClassNotFoundException的异常,所 以这里需要重构我自己的 findClass()方法protected Class findClass(final String name) throws ClassNotFoundException final String classResource = (., /) + .class; final URL classURL = getResource(classResource);
11、 InputStream in = null;File file = new File();byte classBytes = new byte(int)(); FileInputStream fin = new FileInputStream(file); (classBytes);classBytes = decrypt(classBytes); /解密return defineClass(name, classBytes, 0, );在这个函数中,我运用 decrypt(classBytes);方法对所有的加密 Class 文件进行解密,并 在其中调用方法 public static b
12、yte symmetricEncrypto(byte key, byte byteSource)将解密 后的 Class 文件保存直原文件处,保持文件目录级别不变, key 为解密密钥,byteSource 为待解密的 byte 型文件。至此,已完成对类文件的加密和解密,经过测试,功能已实现,Class文件无法被反编译。但为进一步加强程序的安全性,我做了如下的处理。第三,对包 含有关键信 息的方法进 行代码混淆 处理。在 上述内容中 ,方 法 symmetricEncrypt(byte key,te classData) 包含有加密 所用到的 算法,自 定义的 ClassLoader 包含有关
13、键信息,findClass(final String name)以及 decrypt(classBytes);中包含有解 密信息,由于它们本身不是被加密的,因此它可能成为黑客最先攻击的目标。如果相关的解密密钥和算法被攻克,那么被加密的类也很容易被解密。所以这里我对这些关键代码进行代 码混淆。代码混淆是对代码进行重新组织和处理,使得处理后的代码与处理前的代码完成相 同的功能,但是混淆后的代码很难被反编译。代码混淆有符号混淆、数据混淆、控制混淆和 预防性混淆。这里我采用数据混淆对关键代码进行处理。public static byte symmetricEncrypt(byte key, byte
14、classData) ;处理/rawKey,byteSource 为 symmetricEncrypt(byte, byte)的待传入参数byte tempkey = null;tempkey 0 = 0x00;for (int i = 0; i; i+)tempkey i+1 = keyi;tempkey + 1 = 0x11;byte source = null;source0 = 0x00;for(int i = 0; i; i+) sourcei+1 = classDatai; source + 1 = 0x11;public static byte symmetricEncrypt(
15、bytetempkey, bytesource) /取 tempkey 和 source 的除第一个和最后一个 byte 的值.对 public Class loadClass(final String tempname, final boolean resolve)方法进行处理String tempname = abcdefg + name ; /name:loadClass 的第一个待传入参数public Class loadClass(final String tempname, final boolean resolve) String name = (11,();.对 findCla
16、ss(String name)方法进行处理/name 为 findClass(String name)待传入参数,先做如下处理addname = name + 01357924680;protected Class findClass(final String addname)name = (0,()-11);. /fingClass 其他工作int len; /len = 待传文件 file 的长度:()byte classBytes = new byte(int) len; classByteslen + 1 = 0x00; classByteslen + 2 = 0x11;/classB
17、ytes 作为 decrypt(byte classBytes)的传入参数private static byte decrypt(final byte classBytes)byte data = new byte(int) - 2;for(int i = 0; i; i+)datai = classBytesi;. /解密工作5. 结论本文介绍了我针对 Java 类文件设计的保护方法,在众多方法中,我选择了对 Class 文件 进行加密这一思想,加密之后又对包含重要信息的方法进行代码混淆处理,这样就对文件起 到了双重保护的作用。经过在 Windows 平台上测试,效果良好,难以反编译,起到了很好 的保护作用。