soot基础 -- soot中基本的对象

2024-03-29 06:38
文章标签 基础 对象 基本 soot

本文主要是介绍soot基础 -- soot中基本的对象,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


  soot有着庞大的类层次结构。这篇文章将给读者介绍扩展soot时候一些非常重要的类。
  这里我们主要介绍Body,Unit,Local,Value,UnitBox以及ValueBox的概念。

关于body的介绍


  在指导手册中,说明了如何创建一个类,Body的概念被简单提到了,这里将进行更详细的介绍。
  Soot使用Body来存储一个方法的代码。在Soot中有4种类型的Body–也就是BafBody,JimpleBody,ShimpleBody以及GrimpBody–每个代表一种中间表示。
  需要注意的是,Chain是一个类似于List的数据结构,提供了常量时间访问chain中的元素,包括插入,删除。
  Body中有三类主要的Chain,分别是Units Chain, Locals Chain , Traps Chain。下面的例子说明了这些chain的角色。
考虑下面一个java方法:

public static void main(String[] argv) throws Exception
{int x = 2, y = 6;System.out.println("Hi!");System.out.println(x * y + y);try{int z = y * x;}catch (Exception e){throw e;}
}

  转化成jimple格式之后如下:

public static void main(java.lang.String[]) throws java.lang.Exception
{java.lang.String[] r0;int i0, i1, i2, $i3, $i4;java.io.PrintStream $r1, $r2;java.lang.Exception $r3, r4;r0 := @parameter0;i0 = 2;i1 = 6;$r1 = java.lang.System.out;$r1.println(``Hi!'');$r2 = java.lang.System.out;$i3 = i0 * i1;$i4 = $i3 + i1;$r2.println($i4);label0:i2 = i1 * i0;label1:goto label3;label2:$r3 := @caughtexception;r4 = $r3;throw r4;label3:return;catch java.lang.Exception from label0 to label1 with label2;
}

局部变量(Local variables)


  这个方法的局部变量可以在这个方法的顶部看到:

    java.lang.String[] r0;int i0, i1, i2, $i3, $i4;java.io.PrintStream $r1, $r2;java.lang.Exception $r3, r4;

  Local的集合存储在localChain中,可以通过body.getLocals()获得。每个中间表示可以定义他自己的对于Local的实现;但是,它必须满足,对于每个Local r0,都有r0.getName(),r0.getType(),R0.setName(),以及r0.setType.
注意局部变量一定要有类型。

异常(Traps)


  为了支持java的异常处理,Soot的Body中定义了Traps的概念。基于的思想是在java字节码中,异常处理用一种多元组的形式(exception,start,top,handler)表示;在start 和 stop之间的语句(包括start但是不包括stop),如果异常被抛出,执行将在handler中继续进行。
在例子中,有一个异常:

catch java.lang.Exception from label0 to label1 with label2;

语句(Units)


  Body中最有趣的部分是它的units chain。这是实际包含在Body中的代码。Jimple提供了Stmt来实现Unit,Grimp提供了Inst来实现。这说明每个IR(中间代码)都有自己对于语句的定义。
  关于Jimple Stmt的一个例子是AssignStmt,表示的是分配语句。一个AssignStmt的形式如下:

x = y + z;

值(Value)


  代码(code)总是作用在数据(data)之上。为了表示数据,Soot提供了Value接口。一些类型的Value s是:

  • Local s
  • Constant s
  • Expressions(Expr)
  • ParameterRef s, CaughtExccptionRef s, 以及 ThisRef s.

      Expr 接口,有着丰富的实现;他们其中有NewExpr以及AddExpr.通常,一个Expr带有一些操作,这些操作针对一个或者多个Value s 并且返回另一个Value。
      这里是一些关于Value s的使用:
x = y + 2;

  这是一个赋值语句(AssignStmt).它的左操作数为x ,有操作数为 y + 2,一个加法表达式(AddExpr).这个加法表达式(AddExpr),包含值(Value)y 和 2作为操作数;前面一个是Local(局部变量),后面一个是Constant(常量)。
  在Jimple中,我们强制要求所有的Value(值) s 包含至多一个表达式
  在Grimp中我们取消了这个限制,产生容易阅读的但是更难分析的代码

盒子(Boxes)


  在soot中盒子是无处不在的。需要记住的主要思想是,一个盒子(Box)是一个指针(Pointer)。它提供了一个间接访问soot 对象的入口。
  一个对于Box更具有描述性的名字应该是Ref。不幸的是,Ref在soot中有不同的含义。
  在soot中有两种类型的Box - ValueBox 以及UnitBox.可以猜到,一个UnitBox包含着Unit s , 一个ValueBox包含着 Value s.在C++中,这可以表示为(Unit *)以及(Value * )。
  现在我们来分别每种类型的Box.

语句盒(UnitBox)


  一些类型的Unit(语句)将需要包含其他Unit的引用。比如说,GotoStmt 需要知道它的目标是什么。因此,Soot提供了UnitBox,一个包含一条语句Unit的盒子Box.
  考虑下面的jimple代码:

    x = 5;goto l2;y = 3;
l2: z = 9;


  每个Unit必须提供 getUnitBoxes().对于大多数UnitBox ,这返回的是一个空的列表。但是,对于GotoStmt,通过 getUnitBoxes()能够返回有一个元素的列表,包含一个Box指向 l2.
  注意SwitchStmt,通常将会返回包含多个box的列表。
  Box的概念对于修饰代码是十分重要的。比如说我们有一个语句 s:

  s: goto l2;


  以及一条在l2处的语句:

l2:  goto l3;


  很明显,s可以指向 l3 ,而不是l2,忽略 s 的实际类型;我们可以用一种统一的方式来进行处理,针对所有类型的Unit s:
- 下面这段代码将 s语句中的保存的指向信息,从l2变为了l3.

public void readjustJumps(Unit s, Unit oldU, Unit newU)
{Iterator ubIt = s.getUnitBoxes.iterator();while (ubIt.hasNext()){StmtBox tb = (StmtBox)ubIt.next();Stmt targ = (Stmt)tb.getUnit();if (targ == oldU)tb.setUnit(newU);}
}


  其他类似的代码也可以进行这样的处理。PatchingChain是Chain的一个实现,用来调整指向Unit s的指针,s是被Chain移除的。

值的盒子(ValueBox)


  与Unit s类似,我们通常也需要指向Value的指针。这被表示为ValueBox类。对于一个Unit,我们能够得到一系列的ValueBox ,包含了在Unit中使用的值以及定义的值
  我们可以使用这些盒子来进行常数合并:如果一个AssignStmt被赋予了AddExpr(加法表达式),该AddExpr用来将两个常量值进行相加,我们可以将他们静态相加,然后将结果放入到UseBox中。
  这里有一些AddExpr s合并的例子:

public void foldAdds(Unit u)
{Iterator ubIt = u.getUseBoxes().iterator();while (ubIt.hasNext()){ValueBox vb = (ValueBox) ubIt.next();Value v = vb.getValue();if (v instanceof AddExpr){AddExpr ae = (AddExpr) v;Value lo = ae.getOp1(), ro = ae.getOp2();if (lo instanceof IntConstant && ro instanceof IntConstant){IntConstant l = (IntConstant) lo,r = (IntConstant) ro;int sum = l.value + r.value;vb.setValue(IntConstant.v(sum));}}}
}


注意这在任何Unit中都是可行的,不管是什么类型。

再次回顾Unit


  我们现在来讨论Unit提供的不同方法。

public List getUseBoxes();
public List getDefBoxes();
public List getUseAndDefBoxes();

  这些方法都是返回ValueBox列表,分别针对在这个Unit中使用的值,定义的值,以及两者都存在的情况。对于getUseBoxes()方法,所有被使用的值被返回;包括表达式以及组成他们的部分。

public List getUnitBoxes();

  这个方法返回Unit所指向UnitBox的列表。

public List getBoxesPointingToThis();

  这个方法返回以此Unit作为目标的UnitBox列表。

public boolean fallsThrough();
public boolean branches();

  这些方法与Unit之后流的执行有关系。前一个方法在有后继Unit的情况下,返回True .后一个方法(branches())在后继有多个Unit的情况下,并且这些情况不回立即执行,返回true.

public void redirectJumpsToThisTo(Unit newLocation);

  这个方法使用 getBoxesPointingTothis 来改变所有跳转到这个Unit的情况,把他们指向新的位置 newLocation.

原文出处:
Fundamental Soot objects

这篇关于soot基础 -- soot中基本的对象的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/857880

相关文章

mapstruct中的@Mapper注解的基本用法

《mapstruct中的@Mapper注解的基本用法》在MapStruct中,@Mapper注解是核心注解之一,用于标记一个接口或抽象类为MapStruct的映射器(Mapper),本文给大家介绍ma... 目录1. 基本用法2. 常用属性3. 高级用法4. 注意事项5. 总结6. 编译异常处理在MapSt

MyBatis ResultMap 的基本用法示例详解

《MyBatisResultMap的基本用法示例详解》在MyBatis中,resultMap用于定义数据库查询结果到Java对象属性的映射关系,本文给大家介绍MyBatisResultMap的基本... 目录MyBATis 中的 resultMap1. resultMap 的基本语法2. 简单的 resul

从基础到进阶详解Pandas时间数据处理指南

《从基础到进阶详解Pandas时间数据处理指南》Pandas构建了完整的时间数据处理生态,核心由四个基础类构成,Timestamp,DatetimeIndex,Period和Timedelta,下面我... 目录1. 时间数据类型与基础操作1.1 核心时间对象体系1.2 时间数据生成技巧2. 时间索引与数据

MySQL JSON 查询中的对象与数组技巧及查询示例

《MySQLJSON查询中的对象与数组技巧及查询示例》MySQL中JSON对象和JSON数组查询的详细介绍及带有WHERE条件的查询示例,本文给大家介绍的非常详细,mysqljson查询示例相关知... 目录jsON 对象查询1. JSON_CONTAINS2. JSON_EXTRACT3. JSON_TA

C#之List集合去重复对象的实现方法

《C#之List集合去重复对象的实现方法》:本文主要介绍C#之List集合去重复对象的实现方法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C# List集合去重复对象方法1、测试数据2、测试数据3、知识点补充总结C# List集合去重复对象方法1、测试数据

安装centos8设置基础软件仓库时出错的解决方案

《安装centos8设置基础软件仓库时出错的解决方案》:本文主要介绍安装centos8设置基础软件仓库时出错的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录安装Centos8设置基础软件仓库时出错版本 8版本 8.2.200android4版本 javas

Java 枚举的基本使用方法及实际使用场景

《Java枚举的基本使用方法及实际使用场景》枚举是Java中一种特殊的类,用于定义一组固定的常量,枚举类型提供了更好的类型安全性和可读性,适用于需要定义一组有限且固定的值的场景,本文给大家介绍Jav... 目录一、什么是枚举?二、枚举的基本使用方法定义枚举三、实际使用场景代替常量状态机四、更多用法1.实现接

git stash命令基本用法详解

《gitstash命令基本用法详解》gitstash是Git中一个非常有用的命令,它可以临时保存当前工作区的修改,让你可以切换到其他分支或者处理其他任务,而不需要提交这些还未完成的修改,这篇文章主要... 目录一、基本用法1. 保存当前修改(包括暂存区和工作区的内容)2. 查看保存了哪些 stash3. 恢

Spring中管理bean对象的方式(专业级说明)

《Spring中管理bean对象的方式(专业级说明)》在Spring框架中,Bean的管理是核心功能,主要通过IoC(控制反转)容器实现,下面给大家介绍Spring中管理bean对象的方式,感兴趣的朋... 目录1.Bean的声明与注册1.1 基于XML配置1.2 基于注解(主流方式)1.3 基于Java

C++/类与对象/默认成员函数@构造函数的用法

《C++/类与对象/默认成员函数@构造函数的用法》:本文主要介绍C++/类与对象/默认成员函数@构造函数的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录名词概念默认成员函数构造函数概念函数特征显示构造函数隐式构造函数总结名词概念默认构造函数:不用传参就可以