JVM Hardcore – Part 14 – Bytecode – Assembleur de bytecode – 2/2

Aujourd’hui nous allons finaliser PJBA avec toutes nos connaissances actuelles, pour pouvoir reprendre notre étude des instructions de la JVM dès le prochain article.

Au cours de cet article nous :

ajouterons toutes les instructions que nous avons déjà vu (avec et sans arguments) et
créerons un analyseur syntaxique nous permettant de transformer des fichiers .pjb en fichiers .class.

Le code est disponible sur Github (tag et branche).

Tout comme l’article Part 8 – Mon premier analyseur syntaxique – 2/2 nous allons créer de multiples branches nous permettant de suivre l’ajout des instructions et la construction de l’analyseur pas à pas.

Tous les articles déjà publiés de la série portent le tag jvmhardcore.

Ajout des instructions sans arguments

Branche part14_01

Ajouter les instructions n’ayant pas besoin d’argument ne semble pas compliqué.
En reprenant la classe Instructions, nous constatons qu’ajouter une instruction consiste en la créations de trois constantes (XXX, XXX_MNEMONIC et XXX_OPCODE où XXX est le nom de l’instruction), l’ajout des instructions dans les maps OPCODE_TO_MNEMONIC et OPCODE_TO_INSTRUCTION et l’ajout des méthodes correspondants aux instructions.

Si cette conception peut convenir avec quatre instructions, lorsque l’on en a plus de deux cents ça ne semble plus être la cas. Nous allons donc opter pour une autre approche, dans le but de réduire le nombre de constantes en supprimant les constantes de type XXX_MNEMONIC et XXX_OPCODE qui n’ont actuellement aucune utilité, et aussi de faciliter la création des maps d’association. Mais rien ne nous empêchera dans le futur de les rajouter si le besoin s’en fait resentir.

Commençons par définir notre besoin :

Les instructions doivent être des constantes. Ceci nous évitera d’avoir à les instancier à chaque utilisation.
A chaque instruction peut être associée une méthode la retournant. Bien que pour l’instant ce ne soit pas indispensable, c’est une fonctionnalité sympathique ne coûtant rien (en terme de développement et de performances).
Nous devons pouvoir récupérer une instruction à partir d’un opcode (utile pour le désassembleur).
Nous devons pouvoir récupérer une mnémonique à partir d’un opcode (utile pour les classes HexDumper et PjbDumper).

Nous pouvons répondre aux deux premières fonctionnalités en reprenant l’existant :

Instruction ACONST_NULL = new NoArgInstruction(0x01, 1, 0);

public static Instruction aconst_null() {
  return ACONST_NULL;
}

En écrivant “en dur” l’opcode en tant que paramètre du constructeur de la classe NoArgInstruction, nous pouvons supprimer toutes les constantes de XXX_OPCODE.

Les deux autres fonctionnalités nécessitent l’utilisation de maps qui doivent être créer dynamiquement à l’initialisation de la classe. Pour se faire nous allons créer une liste temporaire contenant des MetaInstruction

list.add(new MetaInstruction("aconst_null", ACONST_NULL));

Le constructeur d’une MetaInstruction prenant en paramètre la mnémonique de l’instruction ("aconst_null") et l’instruction (ACONST_NULL). L’instruction contenant son opcode, nous passeront pas la MetaInstruction pour faire la liaison entre un opcode et une mnémonique. De même que précédemment pour les constantes de type XXX_OPCODE, la mnémonique étant écrite en dur en tant que paramètre du constructeur de la classe MetaInstruction, nous pouvons supprimer toutes les constantes de type XXX_MNEMONIC.

La classe MétaInstruction n’est qu’un simple bean.

public class MetaInstruction {

  final private int opcode;
  final private String mnemonic;
  final private Instruction instruction;

  public MetaInstruction(final String mnemonic, final Instruction instruction) {
    this.mnemonic = mnemonic;
    this.instruction = instruction;
    this.opcode = instruction.getOpcode();
  }

  // Getters
}

Néosoft rejoint le réseau de partenaires AWS

JVM Hardcore – Part 14 – Bytecode – Assembleur de bytecode – 2/2

Ajout des instructions sans arguments

Ajout des instructions avec arguments

ByteArgInstruction et ShortArgInstruction

Visitor

Assembler

Instructions

MethodBuilder

Disassembler

Dumpers

HexDumper

PjbDumper

L’analyseur syntaxique de PJBA

PjbTokenizer

PjbParser

Tester PjbDumper

What’s next ?