JVM Hardcore – Part 18 – Convertir une expression logique en bytecode

Java a 42 opérateurs différents répartis dans 14 niveaux de priorités. Pour certains langages comme Smalltalk, tous les opérateurs ont le même niveau de priorité, et seules les parenthèses permettent de le changer. Ce concept intéressant pour l’écriture d’un compilateur donne toutefois des résultats étonnants.

Par exemple, le résultat de l’expression arithmétique 3 + 5 * 2 est 16 et non 13. Pour rétablir la priorité des opérateurs arithmétiques il est nécessaire d’ajouter des parenthèses.

3 + (5 * 2)

Mais quel que soit le langage, les opérateurs pouvant être inclus dans une expression logique sont sensiblement identiques et pour la majorité d’entre eux, il est théoriquement possible d’écrire des expressions extrêmement complexes :

((--a + b += 10) << 1) <= c && (d / e.getValue() * f) | g

Heureusement, le bon sens nous interdit d’écrire des expressions ayant plus de cinq opérandes et effectuant des opérations diverses (opérations arithmétiques, logiques, relationnelles, assignations, etc.). Néanmoins, les compilateurs sont dans l’obligation de gérer les cas les plus complexes. Écrire un compilateur est compliqué et la transformation d’une expression logique en bytecode fait partie de l’une des tâches les plus complexes. Mais, aujourd’hui le sujet n’est pas la création d’un compilateur (nous gardons ce sujet pour plus tard), mais de comprendre les mécanismes rudimentaires nous permettant de traduire une expression logique en bytecode.

Le code est disponible sur Github (tag et branche)

Tous les articles déjà publiés de la série portent le tag jvmhardcore.

Analyse syntaxique

Sans entrer dans les détails, nous avons tout de même besoin de savoir comment un analyseur syntaxique va créer un graphe d’objets utilisables. En réalité, nous avons déjà traité ce cas dans les parties 7, 8 et 9 traitant de notre analyseur d’expressions arithmétiques.

Résumons les trois articles succinctement, nous avons créé un analyseur pouvant extraire des nombres, des opérateurs arithmétiques et des parenthèses à partir d’une chaîne de caractères, pour créer une liste représentant l’expression sous une forme postfixée (par exemple 3 4 + 2 *). Ensuite, à partir de cette forme postfixée nous avons créé un interpréteur pouvant résoudre des expressions arithmétiques en s’appuyant sur une pile. Le mécanisme de résolution étant le suivant :

Lire l’expression de gauche à droite, un nombre ou un opérateur à la fois
- Lorsque l’on rencontre un nombre on l’empile
- Lorsque l’on rencontre un opérateur
  - on dépile deux nombres du sommet de la pile
  - on effectue l’opération (en se rappelant que le premier élément dépilé est la seconde opérande)
  - on empile le résultat pour qu’il soit utilisé par l’opération suivante.

Lorsque tous ces concepts sont bien compris, il n’est pas compliqué de rajouter quelques opérateurs, tels que des opérateurs relationnels (<, <=, >, >=, ==, !=), logiques (&& et ||), bit à bit (<<, >>, >>>, &, | et ^), etc. tout en n’oubliant pas qu’ils peuvent avoir différentes priorités, mais aussi des littérales booléennes (true et false) et des variables – dont nous connaissons le type.

Étant donné que nous n’allons pas écrire un nouvel analyseur syntaxique, ni modifier l’ancien, nous partirons du principe que nous avons un analyseur syntaxique théorique, qui à partir de la chaîne de caractères suivante :

((a << 1) <= (b + c)) && ((d / e) | (f * g))

Génère une liste représentant l’expression postfixée :

a, 1, <<, b, c, +, <=, d, e, /, f, g, *, |, &&

et dont les littérales sont de type IntValue, les variables IntVariable, les opérateurs logiques LogicalOperator, les opérateurs relationnels RelationalOperator, les opérateurs arithmétiques ArithmeticOperator et les opérateurs bit à bit BitwiseOperator.

La classe IntValue contiendra des entiers.

public class IntValue {
  final final Integer data;

  public IntValue(Integer data) {
    this.data = data;
  }
}

Et la classe IntVariable, l’index de la valeur (de type int) d’une variable dans les variables locales.

public class IntVariable {
  final final Integer data;

  public IntVariable(Integer data) {
    this.data = data;
  }
}

Les opérateurs sont quant à eux des énumérations.

public enum LogicalOperator {
  AND, // &&
  OR;  // ||
}

	AND	OR
`a == 1 X b == 1`	`ifeq ko` `ifeq ko`	`ifne ok` `ifeq ko`
`a == 0 X b == 0`	`ifne ko` `ifne ko`	`ifeq ok` `ifne ko`
`a < b X c > d`	`if_icmpge ko` `if_icmple ko`	`if_icmplt ok` `if_icmple ko`
`a >= b X c <= d`	`if_icmplt ko` `if_icmpgt ko`	`if_icmpge ok` `if_icmpgt ko`

Néosoft rejoint le réseau de partenaires AWS

JVM Hardcore – Part 18 – Convertir une expression logique en bytecode

Analyse syntaxique

Arbre syntaxique

Traverser un arbre binaire

Les opérateurs logiques et relationnels

Règle 1 – Le nœud ROP n’est pas à gauche d’un nœud de profondeur inférieure

Règle 2 – Le nœud ROP est à gauche d’un nœud AND de profondeur inférieure

Règle 3 – Le nœud ROP est à gauche d’un nœud OR de profondeur inférieure

Implémentation

L’opérateur unaire NOT

What’s next ?