命令行使用

参考实现:Introduction: Soot as a command line tool

下载地址:https://soot-build.cs.uni-paderborn.de/public/origin/master/soot/soot-master/

输入以下命令验证一下即可,会有一些提示信息

java -cp sootclasses-trunk-jar-with-dependencies.jar soot.Main

Jimple

生成

示例代码

public class ForLoop {public static void main(String[] args) {int x = 0;for(int i = 0; i<10; i++){x = x + 1;}}
}

编译class文件,测试的大概目录如下:

命令:

java -cp sootclasses-trunk-jar-with-dependencies.jar soot.Main -cp . -pp -process-dir examples/ForLoop/ -f J

参数的一些解释

  • -cp .:soot有自己的classpath且默认classpath为空,所以使用的时候需要添加一下当前路径
  • -pp:soot的工作需要类型信息、类的完整层次结构,所以需要java.lang.Object,使用该参数可以自动包含所需的jar文件
  • -process-dir:处理的目录
  • -f J:生成Jimple类型的文件,默认在soot.jar的目录下的sootOutput下,也可以用-d指定输出文件夹
    • S:shimple
    • G:grimple
  • 默认解析class文件,也可以用-src-prec解析指定类型

生成的Jimple文件如下:

public class ForLoop extends java.lang.Object
{public void <init>(){ForLoop r0;r0 := @this: ForLoop;specialinvoke r0.<java.lang.Object: void <init>()>();return;}public static void main(java.lang.String[]){java.lang.String[] r0;int i1;r0 := @parameter0: java.lang.String[];i1 = 0;label1:if i1 >= 10 goto label2;i1 = i1 + 1;goto label1;label2:return;}
}

基本概念

Soot – 中间代码Jimple介绍

Day 2 Intermediate Representation

jimple是soot分析用到的中间代码(Intermediate Representation),是有类型的三地址码(typed 3-address code)

先从main方法看:

关于这个identity_stmt:

另,如果声明的变量有$标记则理解为临时变量(和opcode的内部可重用变量蛮像的)

对于我们这个FoorLoop类,Jimple中的<init>是默认生成的构造函数(源代码没写也会自动加进去),r0会指向this,然后就会调用父类(Object)的构造函数。

(invokespecial就是specialinvoke)

public class MethodCall {String foo(String para1, String para2) {return  para1 + " " + para2;}public static void main(String[] args) {MethodCall mc = new MethodCall();String result = mc.foo("hello", "world");}
}

它的foo方法的jimple代码如下:

java.lang.String foo(java.lang.String, java.lang.String){java.lang.StringBuilder $r0, $r2, $r3, $r5;java.lang.String r1, r4, $r6;MethodCall r7;r7 := @this: MethodCall;r1 := @parameter0: java.lang.String;r4 := @parameter1: java.lang.String;$r0 = new java.lang.StringBuilder;specialinvoke $r0.<java.lang.StringBuilder: void <init>()>();$r2 = virtualinvoke $r0.<java.lang.StringBuilder: java.lang.StringBuilder append(java.lang.String)>(r1);$r3 = virtualinvoke $r2.<java.lang.StringBuilder: java.lang.StringBuilder append(java.lang.String)>(" ");$r5 = virtualinvoke $r3.<java.lang.StringBuilder: java.lang.StringBuilder append(java.lang.String)>(r4);$r6 = virtualinvoke $r5.<java.lang.StringBuilder: java.lang.String toString()>();return $r6;}

CFG

java -cp sootclasses-trunk-jar-with-dependencies.jar soot.tools.CFGViewer -cp . -pp -process-dir examples/ForLoop/

会在sootOutput下生成dot文件,输入以下命令安装graphviz来处理dot文件

apt-get install graphviz
sudo apt-get install graphviz graphviz-doc

生成png

dot -Tpng ForLoopMain.dot -o ForLoop.png

IDEA使用

我们先了解一下soot的处理流程

Jimple为输入起点,后面的矩形方块内:

  • 第一个字母:

    • s:Shimple
    • j:Jimple
    • b:Baf
    • g:Grimp
  • 第二个字母:
    • t:transformation(用户定义的处理阶段)
    • o:optimizations(优化)
    • a:attribute generation(属性生成)
    • b:body(方法体创建阶段)
  • 第三个字母
    • p:pack(处理阶段,可见soot的执行被划分成了很多阶段)

突然发现不如一张图来得实在…

关于这个全局模式,阶段的组装需要用到

用户可以在转化阶段加入一些自己的分析相关的操作,即在jtp阶段实现。

a easy case

新建一个maven项目导入soot的依赖

<dependency><groupId>org.soot-oss</groupId><artifactId>soot</artifactId><version>4.2.1</version>
</dependency>

初始化配置

@Beforepublic void init(){soot.G.reset();//re-initializes all of sootOptions.v().set_src_prec(Options.src_prec_class);//设置处理文件的类型,当然默认也是class文件Options.v().set_process_dir(Arrays.asList("target/classes/com/examples"));//处理路径Options.v().set_whole_program(true);//开启全局模式Options.v().set_prepend_classpath(true);//对应命令行的 -ppOptions.v().set_output_format(Options.output_format_jimple);//输出jimple文件Scene.v().loadNecessaryClasses();//加载所有需要的类}

然后就是测试一下:

@Testpublic void test(){PackManager.v().runPacks();//运行(要有,不然下面没有输出...坑了好久,加上后运行好慢)PackManager.v().writeOutput();//输出jimple到sootOutput目录中}

add a transformation

步骤如下:

  1. 实现BodyTransformer或者SceneTransformer,其实也就是internalTransform方法实现了转换
  2. 选择阶段(pack),通常是jtp
  3. 写入自己的方法并添加到pack中,运行即可

我们新建一个Transformer

package com.examples;import soot.Body;
import soot.BodyTransformer;import java.util.Map;public class TransformerTest extends BodyTransformer {@Overrideprotected void internalTransform(Body body, String s, Map<String, String> map) {System.out.println(body.getMethod().getName());//输出下程序方法的名字}
}

Test里这么写即可:

@Testpublic void test(){PackManager.v().getPack("jtp").add(new Transform("jtp.TT", new TransformerTest()));for (SootClass appClazz : Scene.v().getApplicationClasses()) {for (SootMethod method : appClazz.getMethods()) {Body body = method.retrieveActiveBody();PackManager.v().getPack("jtp").apply(body);}}//只分析应用类,运行速度明显快了}

这里有几点需要记录一下:

  • jtp是packPhaseName
  • jtp.TT是transformerPhaseName(我们可以随便起的)

稍微跟一下上面分析应用类的代码,其中Scene.v().getApplicationClasses()得到所有应用类

可以看到body是什么内容,然后直接跟进到apply方法中

这里猜上面add transformer应该是把jtp.TT名字和我们的transformer绑定在一起,然后根据jtp.TT来找我们的transformer(真的是我猜的,没验证)跟进到apply处,发现找到了

最后就到了我们的代码处

确实分析起来节省时间,PackManager.v().runPacks()这个都要跑20多s

flow analysis framework

soot自己有个流分析框架,我们要实现的主要流程

  1. 继承自*FlowAnalysis,backword就是BackwardFlowAnalysis<Unit, FlowSet>,forward就是ForwardFlowAnalysis<Unit, FlowSet>

  2. 一些抽象的实现:

    1. 值域的抽象(FlowSet):Soot里有一些默认的,如ArrayPackedSet(其实就是课上提到的bitvector),我们也可以自己实现

    2. copy():其实就是把IN的值给OUT或者OUT给IN (取决于forward或backword)

    1. merge():不难理解,就是Transform Function干的事(可以回忆下那两行算法)
    2. flowThrough():是流分析的核心,brain of analysis
      • 处理式子(等式右边是表达式)
      • 处理从IN到OUT或者OUT到IN到底发生了什么
    protected void flowThrough(FlowSet src, Unit u, FlowSet dest)
    

    我们还需要补充下Soot中Box的概念

    用上面(Unit)u的方法即可得到Box了,如u.getUseBoxes()u.getDefBoxes(),那么也就不难理解Unit是啥了,上图中的s其实也是一个Unit

    我们还要再补充一点点,soot.Local:代表了Jimple中的本地变量

  3. 初始化IN和OUT(边界和每个BB的值):newInitialFlow()entryInitialFlow()

  4. 实现构造函数,且必须要调用doAnalysis

    super(graph);
    super.doAnalysis();
    
  5. 查看结果:(就在本类里测试,当然也可以将我们这个类加入jtp当中)

    OurAnalysis analysis = new OurAnalysis(graph);
    analysis.getFlowBefore(s);//Unit s
    analysis.getFlowAfter(s);
    

把这些基础的用法都了解,才能在后面更加关注静态分析核心的算法部分(加油)

Day 5 Soot使用笔记相关推荐

  1. 阅读笔记 | The Soot framework for Java program analysis:a retrospective

    Soot经常用于对代码或者 日志的静态分析或动态分析.它是一款用于分析和优化Java 程序的软件工程工具.它可以提供Call Graph,程序内的数据分析.为了进行程序内的数据分析,它在一个叫做Uni ...

  2. Soot入门(1): 安装与生成Jimple文件

    Soot入门(1): 安装与生成Jimple文件 这学期选修了程序分析课,作业是基于soot进行一些java程序的静态分析,发现目前不管国内国外对于soot的教程都不太多,要么不太清晰要么太老,打算一 ...

  3. 【读书笔记】知易行难,多实践

    前言: 其实,我不喜欢看书,只是喜欢找答案,想通过专业的解答来解决我生活的困惑.所以,我听了很多书,也看了很多书,但看完书,没有很多的实践,导致我并不很深入在很多时候. 分享读书笔记: <高效1 ...

  4. 【运维学习笔记】生命不息,搞事开始。。。

    001生命不息,搞事不止!!! 这段时间和hexesdesu搞了很多事情! 之前是机械硬盘和固态硬盘的测速,我就在那默默的看着他一个硬盘一个机械测来测去. 坐在他后面,每天都能看到这位萌萌的小男孩,各 ...

  5. SSAN 关系抽取 论文笔记

    20210621 https://zhuanlan.zhihu.com/p/353183322 [KG笔记]八.文档级(Document Level)关系抽取任务 共指id嵌入一样 但是实体嵌入的时候 ...

  6. pandas以前笔记

    # -*- coding: utf-8 -*- """ Created on Sat Jul 21 20:06:20 2018@author: heimi "& ...

  7. PyTorch 学习笔记(六):PyTorch hook 和关于 PyTorch backward 过程的理解 call

    您的位置 首页 PyTorch 学习笔记系列 PyTorch 学习笔记(六):PyTorch hook 和关于 PyTorch backward 过程的理解 发布: 2017年8月4日 7,195阅读 ...

  8. 容器云原生DevOps学习笔记——第三期:从零搭建CI/CD系统标准化交付流程

    暑期实习期间,所在的技术中台-效能研发团队规划设计并结合公司开源协同实现符合DevOps理念的研发工具平台,实现研发过程自动化.标准化: 实习期间对DevOps的理解一直懵懵懂懂,最近观看了阿里专家带 ...

  9. 容器云原生DevOps学习笔记——第二期:如何快速高质量的应用容器化迁移

    暑期实习期间,所在的技术中台-效能研发团队规划设计并结合公司开源协同实现符合DevOps理念的研发工具平台,实现研发过程自动化.标准化: 实习期间对DevOps的理解一直懵懵懂懂,最近观看了阿里专家带 ...

最新文章

  1. 作价20亿美元!英特尔收购以色列AI芯片公司Habana Labs
  2. SIGIR阿里论文 | 可视化理解深度神经网络CTR预估模型
  3. 个人小应用服务器安装搭建,HP 360p Gen9 使用winpe安装centos[一]
  4. python爬虫招聘-Python爬虫实战-抓取boss直聘招聘信息
  5. php把proto解析为文档,Protobuf 文件生成工具 Prototool 命令详解
  6. 【github技巧】解决githubusercontent打不开的问题
  7. 宁波镇海区无犯罪记录办理流程
  8. 爱奇艺动态化框架Qigsaw开源!带来极速原生开发体验和更低crash率
  9. t检验的显著性p值python_t检验中的t值和p值是什么关系_t检验和p值的关系
  10. maven [INFO] No proxies configured [INFO] No proxy was configured, downloading directly
  11. 风变python怎么样_风变编程python到底怎么样?可以自学吗?
  12. 知名清理工具或成恶意软件
  13. python爬网站信息_一个爬取实习僧网站信息的爬虫
  14. 【雕爷学编程】Arduino动手做(43)---单路继电器模块
  15. 九龙证券|大宗商品集体下挫,黄金一枝独秀,纳指领跑全球股市
  16. 取消计算机关机,取消电脑自动关机
  17. 安卓AccountManager数据库存储位置
  18. 深度学习模型压缩与加速技术(三):低秩分解
  19. 在c语言中sqr怎么变成int,Basi与c语言基础.ppt
  20. CSS样式字体与文本相关属性

热门文章

  1. 朝鲜扔导弹那天,我们去了趟板门店
  2. 第一次作业——了解编译原理
  3. BTC探底回升 日内能否打破上方阻力
  4. 电压互感器的基础知识原理及注意事项-安科瑞薛炯毅
  5. 进程间通信————共享内存
  6. unity 2018.3.6f 打bundle unity崩溃的bug
  7. java分词 词权重_直通车高分词的养词方法和整个计划权重的提升
  8. 使用正则过滤掉html标签,正则表达式过滤html标签
  9. 【XBMC教程/kodi】有关XBMC软解、硬解以及外挂播放的详细解答
  10. Java单例模式实现,一次性学完整,面试加分项,网商银行java面试