divendres, 1 de febrer de 2013

Primer programa en asm

No vaig a escriure un tutorial en asm, ja que trobe que no val la pena... ;) Però anem a veure el primer programa "Hola món" típic als tutorials de programació.
Tal i com contava en un post anterior, anem a gastar Visual Asm (easy code). Seleccionem crear i li diguem crear un nou projecte, com aplicació de consola:

I ara anem a veure com escrivim en pantalla, la forma més fàcil  que he trobat és trovar l'identificador de l'arxiu pantalla (handle), i escriure uns caràcters en eixa pantalla. Per obtindre l'identificador gastarem la funció del sistema GetStdHandle, i per escriure en eixe identificador, WriteFile. Ho escrivim amb els paràmetres corresponents en la secció main, pareguda a la funció main de C:

Main:
 Push - 11D               ;STD_OUTPUT_HANDLE estàndard output, pel dispositiu què preguntem
CALL GetStdHandle       ;en EAX tindrem el handle
Push 0, Addr buff      ; variable on guardem coses, no val per a res en este cas
Push 9, 'Hola món!'    ;9 tamany de la cadena 'hola món!', en caràcters
PUSH EAX                ;el guardem
CALL WriteFile         ;escrivem en la pantalla
Xor Eax, Eax             ;EAX=0 acabem sense error
Ret


la secció data al principi haurà de contindre la nova varible creada:
.Data

hInst    DD        NULL
buff    DD      0

Executem i tenim el resultat:

vegem que el caracter "extrany" ó apareix incorrectament codificada, d'això parlarem en una altra ocasió. No ha segut tant difícil, eh?

Edite

Si estiguerem en C, el codi hauria segut una cosa sembant a:

 int main(){
    int hd;
    char cadena[]='Hola món';
    int buff=0;
    hd=GetStdHandle(11);
   WriteFile(hd,cadena,strlen(cadena),buff);
   return 0;
}

Programació en assemblador

Com em torna a picar el cuquet de programar en assemblador (asm a partir d'ara), i sempre la gent em preguta per què? quina utilitat té... doncs bé, la justificació teòrica (dels llibres) què donen, és què tens un major control de la màquina, pots optimitzar codi... Fent una analogia mecànica, sempre comparen un canvi de marxes manual (asm) i  un automàtic (C++),  no vull ni pensar que seria el VB.NET actual... potser conduir amb la ment.
Anem a posar un exemple, si tinguem este programa en C:


#include <stdio.h>
void main(){
     int i;
     int vector[10];
     for(i=0;i<=9;i++) vector[i]=0;
}

fem una compilació per veure que s'executa realment (gcc -S) i obtenim el següent codi en asm:
        .file   "prova.c"
        .text
.globl main
        .type   main, @function
main:
        pushl   %ebp
        movl    %esp, %ebp
        subl    $48, %esp
        movl    $0, -4(%ebp)
        jmp     .L2
.L3:
        movl    -4(%ebp), %eax
        movl    $0, -44(%ebp,%eax,4)
        addl    $1, -4(%ebp)
.L2:
        cmpl    $9, -4(%ebp)
        jle     .L3
        leave
        ret


Si observerm, el codi de la copia del vector (inicialitzar a 0),  es fa entre .L3, i  .L2. Realment podriem fer-ho amb menys instruccions, per exemple:
   lea edi, vector
   mov ecx,9
   xor eax,eax
   repsz stosd


Possiblement no siga un bon exemple per què simplement ens estalviariem una instrucció o dos ;), però per a certes coses, no és "recomanat", si no imprescindible, sobretot la interacció amb els hardware. Realment es fa farragosa amb llenguatges com C, quan és molt senzilla en asm. Encara que la millor cosa és juntar-les les dos. Fer parts no crítiques en llenguatges d'alt nivell, i parts crítiques (que necessiten optimització, d'accés al hardware...) en asm. I després mesclar-ho tot.

Un ús curiós és el shellcode, que s'usa en programes maliciosos, per executar instruccions que no deurien de ser executades.  Es passa el shellcode com a paràmetre i es fa que "d'alguna manera" salte l'execució del programa del fil normal fins al paràmetre. Eixe codi pot obrir un shell, o qualsevol altra cosa que "considerem convenient". Llàstima que vaig pedre el meu PFC, sóc un desastre, però tractava sobre el tema, a veure si em torne a reenganxar ;).