记一次对Ghidra反编译的修复

zhaorong · 发表于网络安全 2021-6-29 15:13:23


	前言 Ghidra是NSA在2019年开源的逆向工具可以说从开源发布开始就基本成了开源界唯一可以与 IDA 竞争的存在其它的工具多少总是欠点意思。不过从实际情况来看虽然 Ghidra一直在积极维护但是现在的Bug情况跟IDA相比也还是差点意思。不过开源的好处就是可以自己研究自己修复在我这次参加Defcon资格赛过程中碰到问题的时候我决定自力更生于是有了下面的经历。问题最开始发现问题是在逆Rust的时候 IDA 在逆Rust的时候一向有点问题这次更是出现了分析出来 500多个参数的情况实在让人有点难受。于是我觉得尝试下ghidra 但是打开发现虽然没有了 500 多个参数但是情况也好不了太多出现了奇妙的情况：相比之下IDA就没有这种奇怪的东西：我找了半天当时也没能发现 0x178a97 0x178aa9 之类的玩意儿是从哪里来的但是这肯定是个比较严重的问题因为这基本让反编译没法看了。比赛期间没有办法只能继续用IDA了但是赛后这个问题是肯定要处理处理的。反编译的原理反编译基本都可分为这么几步：基础准备基础准备：一般就是由反汇编器来完成的几个步骤包括： 1. 加载镜像：将文件中的代码数据分析出来从而知道内存中某个地址对应文件中的什么数据。 2. 代码识别+反汇编+代码提升（lifting）：猜测哪些地方应该是机器代码然后对机器代码进行解码得到汇编语言同时还可以将汇编语言进行代码提升也就是liting 得到中间语言。之后的分析一般就发生在中间语言上这样可以避免直接对不同架构的汇编代码进行处理从而可以方便地支持多架构。控制流图获取控制流图获取：这部分开始就是反编译器的工作了一般来说是。首先就是需要进行控制流图的获取控制流图是一种图结构图上的每一个节点叫做一个基本块也就是会连续执行的指令。例如以下的汇编程序： mov eax, 1 add ebx, eax ; 假设 ebx 是外部的输入 cmp ebx, 0x10 jne label1 mov ebx, 0x20 jmp end label1: mov ebx, 0x30 end: xor eax, eax 复制代码这一段程序如果画成控制流图：每一个基本块一旦进入就一定会执行到结尾。这样做之后就会让分析更加方便因为以前我们只能以一句汇编为一个单位进行分析现在就可以一个基本块为一个单位进行分析了。另外有了图的结构也比较清晰的知道一个基本块之后可以走到什么分支了。最后的控制流恢复也和这个步骤息息相关。 SSA 生成 SSA Static Single Assignment，中文叫做静态单赋值是说每一个变量都只应该被赋值一次只写入一次。怎么做到呢？就是将变量进行改名例如eax被写了两次那么第一次写入假设是 mov eax 1 就可以表示为eax_0 = 1 第二次用到的eax 假设是add eax, 1 就会表示为eax_1 = eax_0 + 1 这样一看到eax_1就知道是第二个不会是第一个了。但是如果出现分支就会有一点问题例如这样的程序： cmp ebx, 100 jne L1 mov eax, 1 jmp end L1: mov eax, 2 end: add ebx, eax 复制代码如果重新命名 eax_1 = 1 jmp end L1: eax_2 = 2 end: ebx_1 = ? ; 这里出现了问题应该是 eax_1 还是 eax_2？复制代码所以在SSA里边我们会加入一个特殊的语句叫做phi 有时候也叫做phi-node phi 节点他的作用就是将分支导致的多个变量进行合并例如上面的程序就可以被写作： if ebx_0 != 100 then jmp L1 eax_1 = 1 jmp end L1: eax_2 = 2 end: eax_3 = phi(eax_1, eax_2) ebx_1 = eax_3 复制代码 SSA的目的是让分析更加高效便捷因为在分析的时候你用到的变量都可以很清楚的知道是由哪一条语句进行定义的而不需要往前挨个去找因为只有一条语句可以定义所以就很清楚是哪一条就不需要全部找一遍才能确认。变量恢复即将变量进行分析恢复这也是本次Bug的修复重点。变量分为多种可能包括栈上的变量寄存器里的变量等等栈上的变量目前所使用的方法一般是找到栈指针查看其在函数内开辟了多少空间加减了多大的偏移然后对于用到这一段空间的认为是可能的变量。类型恢复在变量恢复之后会进行类型恢复也就是猜恢复出来的变量可能是什么类型如果实在猜不出来就猜一个大小这个大小可以根据是怎么使用的来确定。例如：加载一个位于rsp + 0x30的 8 个字节就会认为这个位置所对应的变量的大小是 8个字节。至于是指针还是整数还是浮点数这就需要利用后续对这个变量的其他使用方式来确定了。控制流恢复即将控制流图打上标记确认控制流图所对应的程序结构例如在上面控制流图示例中所对应的就应该是 if-else语句。这一部分一般是通过图匹配算法来实现的也就是根据图长什么样子来确定是什么语句。 AST 恢复在控制流图打上标记之后就可以进行AST Abstract Syntax Tree 抽象语法树恢复了。这一部分将基本块里的内容进行转换转换成高级语言的形式以及根据控制流恢复的结果决定应该使用什么条件语句循环语句等进行表达。输出高级语言最后就是将AST恢复的结果打印出来。就得到了我们看到的结果了。 Pcode 在了解ghidra的反编译之前必须先了解ghidra的中间语言：p-code。和其他所有的中间语言一样这个中间语言和MIPS之类的架构比较接近指令数量不多。总结一下pcode中的重点概念： 1. 地址空间 Address Space ：所有的变量都必须存在于一个地址空间中这个地址空间可能是真实的也可能是虚拟的。典型的地址空间包括 a. ram 内存地址空间就和我们理解的内存是同一个东西在ram地址空间中的偏移量一般就是指在内存中的那个地址。 b. register 寄存器内存空间这一点特殊一点在pcode中将所有的寄存器拉通来看然后给每一个寄存器都标在特定偏移量的地方例如在 x86-64 下的 rsp 就是在register空间中 offset 为32的8个字节。这样的好处是不用再特殊处理寄存器范围重叠的问题这个问题在x86下很常见例如esp其实是rsp的低8字节。利用这种方式表示esp就没有难度了可以表示为offset也为32 不过大小为 4 个字节的变量 Varnode。c. const：常量地址空间是虚拟的里边的offset直接被认为是值例如立即数0xdeadbeef 就表示为 const地址空间 offset为0xdeadbeef的变量 varnode。d. unique：特殊地址空间用于生成临时值的在ghidra内部使用。e. stack：特殊地址空间用来表示栈帧在ghidra内部使用。 2. varnode：即pcode所使用的变量 varnode包含地址空间(Address Space 偏移量大小三个属性。 3. opcode：操作符基本和常见的类似例如INT_ADD INT_SUB, BRANCH 这里就不详细列举了基本上看见名字也能猜出来是什么意思。不过需要注意的是除了在ghidra中显示pcode时能看到的操作符以外还有部分操作符是ghidra内部使用的例如 MULTIEQUAL phi指令这一部分并不会显示在ghidra 当中只在反编译器内部使用。 Ghidra 的反编译引擎 Ghidra 的反编译器是使用 C++ 编写的位于Ghidra/Features/Decompiler/src/decompiler/cpp/目录代码中有两套接口一套是ghidra客户端接口是和ghidra的java部分一起使用的还有一个命令行接口是在调试的时候使用的虽然实际情况调起来并不是很方便。 C++ 反编译器和Java层通过在stdio上实现的二进制协议实现和languageserver比较像但是languageserver用了 json-rpc 是文本协议会好调试一些其中的大量的数据交换使用了xml的格式然而这个 xml的格式文档似乎并不是特别全需要看代码才能理解其中的很多含义。所以 ghidra的反编译过程实际上是由java层和C++层不断交互完成的其中需要交互的数据主要是java层用户指定的一些数据例如用户定义了一个变量的名字类型那么反编译引擎就需要考虑到这个问题。反编译过程的具体步骤可以看coreaction.cc文件中的ActionDatabase::universalAction 其中定义了反编译的步骤在 ghidra的反编译引擎中每一个操作被定义为一个Action 一个函数的数据记录在Funcdata中一个Action一般就是对 Funcdata中的数据进行操作。除此以外还有一系列优化效果的规则定义为Rule 一个Rule会在特定的IR指令上进行操作对IR进行修改。由于反编译引擎内容比较多没有办法在这里彻底解决我们就在后续的调试步骤中去讲解所需要利用到的代码啦。调试环境准备 Ghidra的反编译器调试没有什么文档基本上都是自己摸索的。首先是开发环境 ghidra所推荐的开发环境是天杀的Eclipse 但是都1202年了反正我是不想用Eclipse了。我选择的开发环境是vscode 开发环境的准备应该 IDEA也差不多我纯粹是因为要处理Java 和 C++ 甚至 C++ 还更多一些所以选了vscode。配置ghidra的Java部分环境其实大多和官方开发文档差不多但是官方并没有说vscode或者IDEA应该如何配置。我目前的方式配置就多了一步添加了一个启动方式在vscode下配置大概是这样： { "type": "java", "name": "Launch Ghidra", "request": "launch", "projectName": "Framework Utility", "mainClass": "ghidra.GhidraLauncher", "vmArgs": "-Djava.system.class.loader=ghidra.GhidraClassLoader -DbinaryPath=build/cla sses/java/main:build/resources/main/:bin/default/::src/main/resources/", "classPaths": ["${workspaceFolder}\\Ghidra\\Framework\\Utility\\build\\classes\\java\\main"], "args": "ghidra.GhidraRun" } 复制代码这个配置需要添加在launch.json中的configurations里。主要是设置主类 vm参数 class路径还有启动时候的参数。这几点设置完之后就可以正常下断点啦。编译的话通过gradle classes可以进行编译不要开vscode插件里的自动build 虽然不知道为什么但是我发现开了之后他会一直在build。2019年我在开发的时候发现ghidra的gradle对license文件的处理导致会有没办法缓存class的问题不知道现在这个问题还存在不存在说不定也是这个问题导致的。所以基本的流程就是： 1. 修改java代码 2. 修改cpp代码 3. 跑gradle classes编译java层 4. 跑gradle buildNatives_win64或gradle buildNatives_linux64或gradle buildNatives_osx64编译C++层 5. 利用vscode或IDE 启动调试不过这里说的是对java层开发的方式。如果是C++层还可以使用反编译器提供的命令行接口事实上我在调试中更多的是使用的命令行接口因为可以直接gdb。命令行接口可以在cpp那个目录下执行 make decomp_dbg 进行编译得到一个decomp_dbg文件打开之后会有一个 decomp> 的提示符就可以在这里输入命令了。注意这个功能目前看来应该只在linux上支持倒不是说别的系统不能用只是你可能需要处理一大堆依赖……感觉没这个必要直接搞个虚拟机跑就好了。这个提示符的命令没什么文档我是通过看代码了解用法的当然还是有一些诡异的输出实在是看不懂。代码位于consolemain.cc main 函数也定义了 load/save/restore几条命令 ifacedecomp.hh/cc 反编译相关命令。然而我用到的就只有： • load file XXX XXX是路径加载一个二进制文件 • load addr XXX XXX是地址加载特定地址 • decompile进行反编译 • print C打印C出来。不过有命令行之后就可以gdb跑起来了！还是可以的。和d8的调试体验相比应该还是差很多的后续可能我会加一些调试的功能不然确实调起来不太方便开始调试！好了！那么就让我们进入到正题！第一步当然是要处理下程序不然这么大的Rust程序该怎么调试呢？所以需要找到关键点也就是到底是哪一步出现了这个问题。所以我选择使用nasm自己写汇编代码模拟出Rust程序上栈帧的处理最后发现这样一个程序可以最小化的出现问题： ; test program for ghidra decompiler ; nasm -felf64 test.S && ld test.o global _start test_func: ret section .text _start: push rbp mov rbp, rsp push r15 push r14 push r13 push r12 push rbx and rsp, -0x1000 ; 罪魁祸首！就它！ mov rax, 0x1c000 sub rsp, rax mov rax, 1 mov qword [rsp + 0xa020], rax mov qword [rsp + 0xa028], rax lea r12, [rsp + 0xa020] mov rdi, r12 mov esi, 0x1 call test_func pop rbx pop r12 pop r13 pop r14 pop r15 pop rbp ret 复制代码其中最关键的就是一句and rsp, -0x1000 如果没有这一句就完全分析正常。对比下正常情况：加了and之后：提取出来之后发现这个问题其实并不只是在Rust反编译中会出现还会在栈上有变量的情况下出现这个 issue就提到了这个问题 2019年就存在了可是一直没有人修复甚至都没人回复。这一步完成之后至少调试是有可能的了。下面就需要找出来这个问题的原因。这个原因如果是猜测的话还是比较好思考的因为在没有and对齐的时候栈帧的大小是固定的能够通过加法减法都是常量算出来栈帧的大小但是加了and之后就不知道这个大小应该是多大了所以分析就出了问题。因为这个时候栈帧的大小理论上是个范围例如and rsp, -0x1000 那么栈帧的大小就可以在 0x1000大小范围内浮动虽然经验上直接把浮动范围去掉其实也没问题。不过想要在这么大的代码中找到这个点还是比较困难的。于是我开始了我的调试。首先 CTF 惯例有文档先得看文档文档其实是在代码里的docmain.hh和 doccore.hh两个文件伪装成了代码其实直接就是文档。看完文档之后我知道了一些东西： 1. Heritage这个名词对应的是SSA转换 2. 反编译步骤是个大循环中间可能一个步骤会进行多次 3. 变量恢复是在SSA转换之后的实话讲这个时候我还不知道栈上变量恢复是在哪里处理的所以我就先从SSA开始看因为里边有个奇怪的函数叫做 Heritage::discoverIndexedStackPointers 然而调试起来之后发现似乎没什么关系因为我一开始觉得是因为里边没有出现对AND指令的处理于是根据函数里的处理方式把AND指令的处理给加上了结果加上之后才发现没有什么用好吧看来这一点是没看对。然后又是漫长的看代码过程因为代码量比较大所以我其实也没有从头到尾的去看而是通过各种搜索关键字去找到可能相关的代码区域。因为我是在调试具体Bug 所以目标比较明确如果是以学习为目的就不应该这么看了。通过一通搜索我找到了restructure varnode这个action 发现了一些问题。这个action的主要工作就是调用 ScopeLocal::restructureVarnode函数 varmap.hh/cc这个函数的工作分配给了 MapState::gatherVarnodes MapState::gatherOpen 和 MapState::gatherSymbols 最后调用了ScopeLocal::restructure。其中有关的部分在gatherOpen和gatherVarnodes。gatherOpen在正常情况下应该分析出好几段栈空间对应的open RangeHint 其中的处理逻辑在AliasChecker::gather -> AliasChecker::gatherInternal -> AliasChecker::gatherAdditiveBase 。这里也默认base只会出现在加减法中所以没有出现对and 的判断。如果在这里加上对and的判断会发现分析出了栈数组但是这个栈数组并没有和程序中使用到的栈变量结合起来也就是会出现类似于： int func() { char uStackxx[1024]; stackVar = stackVarxxx & 0xfffffffffffff000; // ... } 复制代码其中的uStackxx在程序中完全没有用到。和正常程序对比调试了一下发现在MapState::gatherVarnodes时是没有检查到使用到的几个变量的也就是说使用到的几个变量没有被认为是在 spacebase 也就是栈上。所以没有出现open 的 Rang eHint 和 varnode交叉的情况从而并没有联系起来。虽然这个点并不是我需要的点但是在这一次调试之中我发现了一个问题：其实第一次MapState::gatherVar nodes本来就没什么作用将正常和不正常程序对比调试可以发现到第二次的时候才出现的作用也就是分析流程循环的第二轮MapState::gatherVarnodes 才应当有作用。这就说明并不一定是之前的action没能分析出来栈变量的问题还可能是之后的action的问题。所以我将范围扩大到在heritage restructureVarnodes action之后然后找到了相关的action ：RuleLoadVarnode和 RuleStoreVarnode。这两个action 其实是Rule 应该就是分析的主要了他们都会经过RuleLoadVarnode::checkSpacebase -> RuleLoadVarnode::vnSpacebase -> RuleLoadVarnode::correctSpacebase (ruleaction.cc) 的检查调试发现没能分析出来的变量所对应的 store/load在correctSpacebase的检查中失败了。所以问题应该就在这里了。失败的位置在于 !vn->isSpacebase 也就是这里判断出来了变量对应的varnode 没有被认为是栈变量。在vnSpacebase中有检查如果是CPUI_INT_ADD的code 会检查其define的op所对应的参数0是不是正确的Spacebase 这个值应该是rsp 是应该返回正常的但是事实上这里的检查失败了失败在vn->is Input()这里认为不是input。这个isInput是什么意思呢？通过查看注释可以发现这个判断是说这个varnode是不是 ssa的 input node也就是是不是在这个函数的外面给进来的。断在heritage.cc:2163也就是 Heritage::renameRecurse里的循环获取到op = oiter 之后发现CPUI_INT_ADD 指令的时候两个对比程序都是isInput() == false 这就说明后续其实应该有地方修改了isInput() 的结果或者修改 inrefs 也就是 opcode 访问到的 varnode 。通过下watchpoint 查看inrefs 处的第一个元素发现通过data.opSetInput 和对应的clear input 设置了新的 input 第一次设置的内容打印出来看p vn->isInput() 发现依然是 false 直到第二次的时候才发现是 true 了这个时候通过backtrace 查看到设置的函数是RuleAddMultCollapse ！查看了一下发现这个函数是用来做常量折叠的然而他把涉及到栈指针的常量也折叠了经过这个折叠之后如果input 是栈指针+或减得到的这个时候就会直接和栈指针搭上关系了所以才会出现isInput() == true 。到这里这个Bug的原因就找到了是因为decompiler假设所有的栈指针相对访问经过常量折叠之后都会与栈指针直接相关由于按位与运算的存在导致常量折叠做不完了。然后因为SSA 所以除了第一个rsp被认为是栈指针后面都是等着常量折叠过去的。结果一个and 折叠不过去了就断开了后面的rsp就不认为是栈指针了。解决问题* 最后的解决其实并不算很完美我自己添加了一个Rule 将 AND 的其中一个值是spacebase 也就是会开辟一个子空间的例如栈帧的情况进行了处理直接将对齐操作忽略掉了。为了解决这个问题我还对比了一下IDA的操作发现IDA 虽然没有出这个问题但是也好不到哪去。 IDA的结果：多了一个莫名其妙的alloca出来。另外：看起来分析还是有点问题的但是如果看栈空间就会发现其实也是直接把and操作给忽略了那么我这么改应该就问题不大啦。最后的效果：在Rust上运行的效果：还有好多问题但是至少前面奇怪的保存返回地址的语句没了后记 Ghidra 虽然实现了类似 IDA的功能但是从Bug情况来看确实还有太多太多值得改进的地方。另外ghidra 的官方对PR issue的反应并不算太快似乎他们一直有自己内部的安排在做。想要达到和IDA匹敌的地步确实还有很长的路要走。我们正在尝试对ghidra进行改进后续可能以发行版更快的 fix 一些方便使用的插件默认配置的方式对ghidra进行再发布。

微信扫一扫 分享朋友圈

记一次对Ghidra反编译的修复

微信扫一扫分享朋友圈