Giter VIP home page Giter VIP logo

inf1018-trab2-18.2's Introduction

inf1018-trab2-18.2

INF1018 - Software Básico (2018.2) Segundo Trabalho Gerador de Código com Funções

O objetivo deste trabalho é desenvolver, em C, uma função gera_codigo, que implementa um gerador de código (um "micro-compilador" muito simples) para uma linguagem de programação bastante simples, chamada SBF.

A função gera_codigo deverá ler um arquivo texto contendo o código fonte de uma ou mais funções escritas em SBF e retornar dois endereços:

o início da região de memória que contém o código de máquina que corresponde à tradução das funções SBF para código de máquina
o início do código de máquina da última função lida (essa é a função que será chamada externamente). 

Deve ser implementada também uma função libera_codigo, que libera a memória alocada para armazenar o código criado por gera_codigo. Instruções Gerais

Leia com atenção o enunciado do trabalho e as instruções para a entrega. Em caso de dúvidas, não invente. Pergunte! O trabalho deve ser entregue até meia-noite (23:59) do dia 26 de novembro. Trabalhos entregues com atraso perderão um ponto por dia de atraso. Trabalhos que não compilem não serão considerados! Ou seja, receberão grau zero.

Os trabalhos podem ser feitos em grupos de dois alunos. Alguns grupos poderão ser chamados para apresentações orais / demonstrações dos trabalhos entregues. A Linguagem SBF

Funções na linguagem SBF contém apenas atribuições, operações aritméticas, chamadas de outras funções e retorno. Todas as funções SBF são delimitadas por uma marca de início (function) e uma marca de fim (end).

A linguagem tem um único tipo de dado: inteiro de 32 bits, com sinal.

Variáveis locais são denotadas por vi, sendo o índice i utilizado para identificar a variável (ex. v0, v1, etc...). A linguagem permite o uso de no máximo 5 variáveis locais. As variáveis locais serão necessáriamente alocadas na pilha!

As funções recebem apenas um parâmetro, denotado por p0.

Constantes são escritas na forma $i, onde i é um valor inteiro, com um sinal opcional. Por exemplo, $10 representa o valor 10 e $-10 representa o valor -10.

Uma atribuição tem a forma

var '=' expr

onde var é uma variável local e expr é uma operação aritmética ou uma chamada de função.

Uma operação aritmética tem a forma

varpc op varpc

onde varpc é uma variável local, o parâmetro da função ou uma constante e op é um dos operadores: + - *

A instrução de chamada de função tem a forma

'call' num varpc

onde num é um número que indica a função SBF que será chamada, com argumento varpc (uma variável local, o parâmetro da função ou uma constante).

A primeira função do arquivo de entrada será a de número 0, a segunda a de número 1, e assim por diante. Uma função só pode chamar a si mesma ou funções que apareçam antes dela no arquivo de entrada. A última função do arquivo de entrada é a que será chamada pelo programa principal.

Existem dois tipos de retorno: incondicional e condicional. A instrução de retorno incondicional tem a forma

'ret' varpc

Seu significado é que a função corrente deverá retornar, e o valor de retorno é o segundo operando.

A instrução de retorno condicional tem a forma

'zret' varpc varpc

Seu significado é que, se o primeiro operando tiver valor igual a zero a função corrente deverá retornar, e o valor de retorno é o segundo operando. Não haverá retorno se o primeiro operando tiver valor diferente de zero. 

A sintaxe da linguagem SBF pode ser definida formalmente como abaixo. Note que as cadeias entre ' ' são símbolos terminais da linguagem: os caracteres ' não aparecem nos comandos SBF.

pgm ::= func | func pgm func ::= header cmds endf header ::= 'function\n' endf ::= 'end\n' cmds ::= cmd'\n' | cmd '\n' cmds cmd ::= att | ret | zret att ::= var '=' expr expr ::= oper | call oper ::= varpc op varpc call ::= 'call' num varpc ret ::= 'ret' varpc zret ::= 'zret' varpc varpc var ::= 'v' num varpc ::= var | 'p0' | '$' snum op ::= '+' | '-' | '*' num ::= digito | digito num snum ::= [-] num digito ::= 0' | '1' | '2' | '3' | '4' | '5' | '6' | '7'| '8' | '9'

Alguns Exemplos Veja a seguir alguns exemplos de funções SBF.

Um exemplo muito simples é uma função SBF que retorna uma constante:

function
ret $100
end

Este exemplo implementa uma função f(x) = x + 1.

function
v0 = p0 + $1
ret v0
end

O próximo exemplo é uma função que calcula o fatorial de seu parâmetro:

function
zret p0 $1
v0 = p0 + $0
v1 = v0 - $1
v1 = call 0 v1
v0 = v0 * v1
ret v0
end

Finalmente, uma função que calcula a soma dos quadrados de 1 até o valor do seu parâmetro, usando uma função auxiliar para calcular o quadrado de um número:

function
v0 = p0 * p0
ret p0
end
function
zret p0 $0
v0 = p0 - $1
v1 = call 0 p0
v0 = call 1 v0
v0 = v0 + v1
ret v0
end

Implementação e Execução O que fazer Você deve desenvolver em C uma função chamada gera_codigo, que leia um arquivo de entrada contendo o código fonte de uma ou mais funções na linguagem SBF, gere o código de máquina correspondente, e retorne dois endereços: o início da região de memória alocada para armazenar o código gerado e o endereço da última função definida no arquivo de entrada (ou seja, o endereço da primeira instrução dessa função).

O primeiro endereço retornado é necessário para podermos liberar a memória alocada (usando a função libera_codigo). O segundo endereço é necessário para podermos fazer a chamada à função correspondente.

O arquivo de entrada terá no máximo 50 linhas, com um comando SBF por linha.

O protótipo de gera_codigo é o seguinte:

typedef int (*funcp) (int x); void gera_codigo (FILE *f, void **code, funcp *entry);

O parâmetro f é o descritor de um arquivo texto, já aberto para leitura, de onde deve ser lido o código fonte SBF.

O parâmetro code é um ponteiro para uma variável (do tipo void *) onde deve ser armazenado o endereço da área que contém o código gerado (para posterior liberação dessa área).

O parâmetro entry é um ponteiro para uma variável (do tipo "ponteiro para função que recebe inteiro e retorna inteiro") onde deve ser armazenado o endereço da função a ser chamada pelo programa principal.

Você deverá também desenvolver uma função que libere a área de memória alocada por gera_codigo, com o protótipo

void libera_codigo (void *p);

Implementação

A função gera_codigo deve alocar um bloco de memória onde armazenará o código gerado (lembre-se que as instruções de máquina ocupam um número variável de bytes na memória!). Os endereços retornados por gera_codigo serão o endereço do início da memória alocada e o endereço de início do código da última função (dentro dessa área, obviamente).

Para cada instrução SBF imagine qual uma tradução possível para assembly. Além disso, lembre-se que a tradução de uma função SBF deve começar com o prólogo usual (preparação do registro de ativação, incluindo o espaço para variáveis locais) e terminar com a finalização padrão (liberação do registro de ativação antes do retorno da função).

O código gerado deverá seguir as convenções de C/Linux quanto à passagem de parâmetros, valor de retorno e salvamento de registradores. As variáveis locais devem ser alocadas na pilha.

Para ler e interpretar cada linha da linguagem SBF, teste se a linha contém cada um dos formatos possíveis. Não é necessário fazer tratamento de erros no arquivo de entrada, você pode supor que o código fonte SBF desse arquivo está correto. Vale a pena colocar alguns testes para facilitar a própria depuração do seu código, mas as entradas usadas como testes na correção do trabalho sempre estarão corretas.

Veja um esboço de código C para fazer a interpretação de código aqui. Lembre-se que você terá que fazer adaptações pois, dentre outros detalhes, essa interpretação não será feita na main!

O código gerado por gera_codigo deverá ser um código de máquina x86-64, e não um código fonte assembly. Ou seja, você deverá descobrir o código de máquina que corresponde às instruções de assembly que implementam a tradução das instruções da linguagem SBF. Para isso, você pode usar o programa objdump e, se necessário, uma documentação das instruções da Intel.

Por exemplo, para descobrir o código gerado por movl %eax, %ecx, você pode criar um arquivo meuteste.s contendo apenas essa instrução, traduzi-lo com o gcc (usando a opção -c) para gerar um arquivo objeto meuteste.o, e usar o comando

objdump -d meuteste.o

para ver o código de máquina gerado.

Estratégia de Implementação Este trabalho não é trivial. Implemente sua solução passo a passo, testando separadamente cada passo implementado!

Por exemplo:

Compile um arquivo assembly contendo uma função bem simples usando:

minhamaquina> gcc -c code.s

(para apenas compilar e não gerar o executável) e depois veja o código de máquina gerado usando:

minhamaquina> objdump -d code.o

Construa uma versão inicial da função gera_codigo, que aloque uma área de memória, coloque lá esse código, bem conhecido, e retorne o endereço da área alocada como os dois retornos de gera_codigo (os retornos são iguais pois só há uma função no código).

Crie uma função main e teste essa versão inicial da função (leia o próximo item para ver como fazê-lo). Teste também a sua função de liberação de memória (chamada pela main!)

Implemente e teste a tradução de uma função SBF bem simples, como a do primeiro exemplo fornecido. Depois teste uma função que retorne o valor do parâmetro de entrada.
Comece agora a implementação de atribuições e operações aritméticas. Pense em que informações você precisa extrair para poder traduzir as instruções (quais são os operandos, qual é a operação, onde armazenar o resultado da operação).

Implemente e teste uma operação por vez. Experimente usar constantes, parâmetros, variáveis locais, e combinações desses tipos como operandos.

Lembre-se que é necessário alocar espaço (na pilha) para as variáveis locais!

Deixe para implementar a instrução call apenas quando todo o resto estiver funcionando!

Pense em que informações você precisa guardar para traduzir completamente essa instrução (note que você precisa saber qual o endereço da função a ser chamada). 

Testando o gerador de código

Você deve criar um arquivo contendo as funções gera_codigo e libera_codigo e outro arquivo com uma função main para testá-la.

Sua função main deverá abrir um arquivo texto que contém um "código fonte" na linguagem SBF (i.e, uma ou mais funções SBF) e chamar gera_codigo, passando o arquivo aberto como primeiro argumento, e os endereços de duas variáveis que receberão os retornos.

Em seguida, sua main deverá chamar a função retornada por gera_codigo (o segundo retorno), passando um argumento apropriado. Para verificar se a execução foi correta, você pode, por exemplo, imprimir o valor de retorno.

O "esqueleto" abaixo resume os principais passos de uma função main:

#include "gera_codigo.h" int main(int argc, char *argv[]) { FILE *fp; void code; funcp funcSBF; int res; ... / Abre o arquivo para leitura / fp = fopen(, "r"); ... / Gera o codigo / gera_codigo(fp, &code, &funcSBF); if ((code == NULL) || (funcSBF == NULL)) { printf("Erro na geracao\n"); ... } / Chama a função gerada */ res = (funcSBF)(); ... / Libera a memória utilizada */ libera_codigo(code); ... }

Não esqueça de compilar seu programa com

gcc -Wall -Wa,--execstack -o seuprograma seuprograma.c

para permitir a execução do código de máquina criado por gera_codigo!

Uma sugestão para testar a chamada de uma função SBF com diferentes arquivos e argumentos é utilizar parâmetros para o programa passados na linha de comando. Para ter acesso a eles, a sua função main deve ser declarada como

int main(int argc, char *argv[])

sendo argc o número de argumentos fornecidos na linha de comando e argv um array de ponteiros para strings (os argumentos).

Note que o primeiro argumento para main (argv[0]) é sempre o nome do seu executável, a seguir virão os demais argumentos.

Entrega

Deverão ser entregues via Moodle dois arquivos:

Um arquivo fonte chamado gera_codigo.c , contendo as funções gera_codigo e libera_codigo (e funções auxiliares, se for o caso).
    Esse arquivo não deve conter a função main.
    Coloque no início do arquivo, como comentário, os nomes dos integrantes do grupo da seguinte forma:

    /* Nome_do_Aluno1 Matricula Turma */
    /* Nome_do_Aluno2 Matricula Turma */# inf1018-trab2-18.2

INF1018 - Software Básico (2018.2) Segundo Trabalho Gerador de Código com Funções

O objetivo deste trabalho é desenvolver, em C, uma função gera_codigo, que implementa um gerador de código (um "micro-compilador" muito simples) para uma linguagem de programação bastante simples, chamada SBF.

A função gera_codigo deverá ler um arquivo texto contendo o código fonte de uma ou mais funções escritas em SBF e retornar dois endereços:

o início da região de memória que contém o código de máquina que corresponde à tradução das funções SBF para código de máquina
o início do código de máquina da última função lida (essa é a função que será chamada externamente). 

Deve ser implementada também uma função libera_codigo, que libera a memória alocada para armazenar o código criado por gera_codigo. Instruções Gerais

Leia com atenção o enunciado do trabalho e as instruções para a entrega. Em caso de dúvidas, não invente. Pergunte! O trabalho deve ser entregue até meia-noite (23:59) do dia 26 de novembro. Trabalhos entregues com atraso perderão um ponto por dia de atraso. Trabalhos que não compilem não serão considerados! Ou seja, receberão grau zero.

Os trabalhos podem ser feitos em grupos de dois alunos. Alguns grupos poderão ser chamados para apresentações orais / demonstrações dos trabalhos entregues. A Linguagem SBF

Funções na linguagem SBF contém apenas atribuições, operações aritméticas, chamadas de outras funções e retorno. Todas as funções SBF são delimitadas por uma marca de início (function) e uma marca de fim (end).

A linguagem tem um único tipo de dado: inteiro de 32 bits, com sinal.

Variáveis locais são denotadas por vi, sendo o índice i utilizado para identificar a variável (ex. v0, v1, etc...). A linguagem permite o uso de no máximo 5 variáveis locais. As variáveis locais serão necessáriamente alocadas na pilha!

As funções recebem apenas um parâmetro, denotado por p0.

Constantes são escritas na forma $i, onde i é um valor inteiro, com um sinal opcional. Por exemplo, $10 representa o valor 10 e $-10 representa o valor -10.

Uma atribuição tem a forma

var '=' expr

onde var é uma variável local e expr é uma operação aritmética ou uma chamada de função.

Uma operação aritmética tem a forma

varpc op varpc

onde varpc é uma variável local, o parâmetro da função ou uma constante e op é um dos operadores: + - *

A instrução de chamada de função tem a forma

'call' num varpc

onde num é um número que indica a função SBF que será chamada, com argumento varpc (uma variável local, o parâmetro da função ou uma constante).

A primeira função do arquivo de entrada será a de número 0, a segunda a de número 1, e assim por diante. Uma função só pode chamar a si mesma ou funções que apareçam antes dela no arquivo de entrada. A última função do arquivo de entrada é a que será chamada pelo programa principal.

Existem dois tipos de retorno: incondicional e condicional. A instrução de retorno incondicional tem a forma

'ret' varpc

Seu significado é que a função corrente deverá retornar, e o valor de retorno é o segundo operando.

A instrução de retorno condicional tem a forma

'zret' varpc varpc

Seu significado é que, se o primeiro operando tiver valor igual a zero a função corrente deverá retornar, e o valor de retorno é o segundo operando. Não haverá retorno se o primeiro operando tiver valor diferente de zero. 

A sintaxe da linguagem SBF pode ser definida formalmente como abaixo. Note que as cadeias entre ' ' são símbolos terminais da linguagem: os caracteres ' não aparecem nos comandos SBF.

pgm ::= func | func pgm func ::= header cmds endf header ::= 'function\n' endf ::= 'end\n' cmds ::= cmd'\n' | cmd '\n' cmds cmd ::= att | ret | zret att ::= var '=' expr expr ::= oper | call oper ::= varpc op varpc call ::= 'call' num varpc ret ::= 'ret' varpc zret ::= 'zret' varpc varpc var ::= 'v' num varpc ::= var | 'p0' | '$' snum op ::= '+' | '-' | '*' num ::= digito | digito num snum ::= [-] num digito ::= 0' | '1' | '2' | '3' | '4' | '5' | '6' | '7'| '8' | '9'

Alguns Exemplos Veja a seguir alguns exemplos de funções SBF.

Um exemplo muito simples é uma função SBF que retorna uma constante:

function
ret $100
end

Este exemplo implementa uma função f(x) = x + 1.

function
v0 = p0 + $1
ret v0
end

O próximo exemplo é uma função que calcula o fatorial de seu parâmetro:

function
zret p0 $1
v0 = p0 + $0
v1 = v0 - $1
v1 = call 0 v1
v0 = v0 * v1
ret v0
end

Finalmente, uma função que calcula a soma dos quadrados de 1 até o valor do seu parâmetro, usando uma função auxiliar para calcular o quadrado de um número:

function
v0 = p0 * p0
ret p0
end
function
zret p0 $0
v0 = p0 - $1
v1 = call 0 p0
v0 = call 1 v0
v0 = v0 + v1
ret v0
end

Implementação e Execução O que fazer Você deve desenvolver em C uma função chamada gera_codigo, que leia um arquivo de entrada contendo o código fonte de uma ou mais funções na linguagem SBF, gere o código de máquina correspondente, e retorne dois endereços: o início da região de memória alocada para armazenar o código gerado e o endereço da última função definida no arquivo de entrada (ou seja, o endereço da primeira instrução dessa função).

O primeiro endereço retornado é necessário para podermos liberar a memória alocada (usando a função libera_codigo). O segundo endereço é necessário para podermos fazer a chamada à função correspondente.

O arquivo de entrada terá no máximo 50 linhas, com um comando SBF por linha.

O protótipo de gera_codigo é o seguinte:

typedef int (*funcp) (int x); void gera_codigo (FILE *f, void **code, funcp *entry);

O parâmetro f é o descritor de um arquivo texto, já aberto para leitura, de onde deve ser lido o código fonte SBF.

O parâmetro code é um ponteiro para uma variável (do tipo void *) onde deve ser armazenado o endereço da área que contém o código gerado (para posterior liberação dessa área).

O parâmetro entry é um ponteiro para uma variável (do tipo "ponteiro para função que recebe inteiro e retorna inteiro") onde deve ser armazenado o endereço da função a ser chamada pelo programa principal.

Você deverá também desenvolver uma função que libere a área de memória alocada por gera_codigo, com o protótipo

void libera_codigo (void *p);

Implementação

A função gera_codigo deve alocar um bloco de memória onde armazenará o código gerado (lembre-se que as instruções de máquina ocupam um número variável de bytes na memória!). Os endereços retornados por gera_codigo serão o endereço do início da memória alocada e o endereço de início do código da última função (dentro dessa área, obviamente).

Para cada instrução SBF imagine qual uma tradução possível para assembly. Além disso, lembre-se que a tradução de uma função SBF deve começar com o prólogo usual (preparação do registro de ativação, incluindo o espaço para variáveis locais) e terminar com a finalização padrão (liberação do registro de ativação antes do retorno da função).

O código gerado deverá seguir as convenções de C/Linux quanto à passagem de parâmetros, valor de retorno e salvamento de registradores. As variáveis locais devem ser alocadas na pilha.

Para ler e interpretar cada linha da linguagem SBF, teste se a linha contém cada um dos formatos possíveis. Não é necessário fazer tratamento de erros no arquivo de entrada, você pode supor que o código fonte SBF desse arquivo está correto. Vale a pena colocar alguns testes para facilitar a própria depuração do seu código, mas as entradas usadas como testes na correção do trabalho sempre estarão corretas.

Veja um esboço de código C para fazer a interpretação de código aqui. Lembre-se que você terá que fazer adaptações pois, dentre outros detalhes, essa interpretação não será feita na main!

O código gerado por gera_codigo deverá ser um código de máquina x86-64, e não um código fonte assembly. Ou seja, você deverá descobrir o código de máquina que corresponde às instruções de assembly que implementam a tradução das instruções da linguagem SBF. Para isso, você pode usar o programa objdump e, se necessário, uma documentação das instruções da Intel.

Por exemplo, para descobrir o código gerado por movl %eax, %ecx, você pode criar um arquivo meuteste.s contendo apenas essa instrução, traduzi-lo com o gcc (usando a opção -c) para gerar um arquivo objeto meuteste.o, e usar o comando

objdump -d meuteste.o

para ver o código de máquina gerado.

Estratégia de Implementação Este trabalho não é trivial. Implemente sua solução passo a passo, testando separadamente cada passo implementado!

Por exemplo:

Compile um arquivo assembly contendo uma função bem simples usando:

minhamaquina> gcc -c code.s

(para apenas compilar e não gerar o executável) e depois veja o código de máquina gerado usando:

minhamaquina> objdump -d code.o

Construa uma versão inicial da função gera_codigo, que aloque uma área de memória, coloque lá esse código, bem conhecido, e retorne o endereço da área alocada como os dois retornos de gera_codigo (os retornos são iguais pois só há uma função no código).

Crie uma função main e teste essa versão inicial da função (leia o próximo item para ver como fazê-lo). Teste também a sua função de liberação de memória (chamada pela main!)

Implemente e teste a tradução de uma função SBF bem simples, como a do primeiro exemplo fornecido. Depois teste uma função que retorne o valor do parâmetro de entrada.
Comece agora a implementação de atribuições e operações aritméticas. Pense em que informações você precisa extrair para poder traduzir as instruções (quais são os operandos, qual é a operação, onde armazenar o resultado da operação).

Implemente e teste uma operação por vez. Experimente usar constantes, parâmetros, variáveis locais, e combinações desses tipos como operandos.

Lembre-se que é necessário alocar espaço (na pilha) para as variáveis locais!

Deixe para implementar a instrução call apenas quando todo o resto estiver funcionando!

Pense em que informações você precisa guardar para traduzir completamente essa instrução (note que você precisa saber qual o endereço da função a ser chamada). 

Testando o gerador de código

Você deve criar um arquivo contendo as funções gera_codigo e libera_codigo e outro arquivo com uma função main para testá-la.

Sua função main deverá abrir um arquivo texto que contém um "código fonte" na linguagem SBF (i.e, uma ou mais funções SBF) e chamar gera_codigo, passando o arquivo aberto como primeiro argumento, e os endereços de duas variáveis que receberão os retornos.

Em seguida, sua main deverá chamar a função retornada por gera_codigo (o segundo retorno), passando um argumento apropriado. Para verificar se a execução foi correta, você pode, por exemplo, imprimir o valor de retorno.

O "esqueleto" abaixo resume os principais passos de uma função main:

#include "gera_codigo.h" int main(int argc, char *argv[]) { FILE *fp; void code; funcp funcSBF; int res; ... / Abre o arquivo para leitura / fp = fopen(, "r"); ... / Gera o codigo / gera_codigo(fp, &code, &funcSBF); if ((code == NULL) || (funcSBF == NULL)) { printf("Erro na geracao\n"); ... } / Chama a função gerada */ res = (funcSBF)(); ... / Libera a memória utilizada */ libera_codigo(code); ... }

Não esqueça de compilar seu programa com

gcc -Wall -Wa,--execstack -o seuprograma seuprograma.c

para permitir a execução do código de máquina criado por gera_codigo!

Uma sugestão para testar a chamada de uma função SBF com diferentes arquivos e argumentos é utilizar parâmetros para o programa passados na linha de comando. Para ter acesso a eles, a sua função main deve ser declarada como

int main(int argc, char *argv[])

sendo argc o número de argumentos fornecidos na linha de comando e argv um array de ponteiros para strings (os argumentos).

Note que o primeiro argumento para main (argv[0]) é sempre o nome do seu executável, a seguir virão os demais argumentos.

Entrega

Deverão ser entregues via Moodle dois arquivos:

Um arquivo fonte chamado gera_codigo.c , contendo as funções gera_codigo e libera_codigo (e funções auxiliares, se for o caso).
    Esse arquivo não deve conter a função main.
    Coloque no início do arquivo, como comentário, os nomes dos integrantes do grupo da seguinte forma:

    /* Nome_do_Aluno1 Matricula Turma */
    /* Nome_do_Aluno2 Matricula Turma */

Um arquivo texto, chamado relatorio.txt, contendo um pequeno relatório.
    O relatório deverá explicar o que está funcionando e o que não está funcionando. Não é necessário documentar sua função no relatório. Seu código deverá ser claro o suficiente para que isso não seja necessário.
    O relatório deverá conter também alguns exemplos de funções da linguagem SBF que você usou para testar o seu trabalho. Mostre tanto as funções SBF traduzidas e executadas com sucesso como as que resultaram em erros (se for o caso).
    Coloque também no relatório o nome dos integrantes do grupo 

Indique na área de texto da tarefa do Moodle o nome dos integrantes do grupo. Apenas uma entrega é necessária se os dois integrantes pertencerem à mesma turma. # inf1018-trab2-18.2 INF1018 - Software Básico (2018.2) Segundo Trabalho Gerador de Código com Funções

O objetivo deste trabalho é desenvolver, em C, uma função gera_codigo, que implementa um gerador de código (um "micro-compilador" muito simples) para uma linguagem de programação bastante simples, chamada SBF.

A função gera_codigo deverá ler um arquivo texto contendo o código fonte de uma ou mais funções escritas em SBF e retornar dois endereços:

o início da região de memória que contém o código de máquina que corresponde à tradução das funções SBF para código de máquina
o início do código de máquina da última função lida (essa é a função que será chamada externamente). 

Deve ser implementada também uma função libera_codigo, que libera a memória alocada para armazenar o código criado por gera_codigo. Instruções Gerais

Leia com atenção o enunciado do trabalho e as instruções para a entrega. Em caso de dúvidas, não invente. Pergunte! O trabalho deve ser entregue até meia-noite (23:59) do dia 26 de novembro. Trabalhos entregues com atraso perderão um ponto por dia de atraso. Trabalhos que não compilem não serão considerados! Ou seja, receberão grau zero.

Os trabalhos podem ser feitos em grupos de dois alunos. Alguns grupos poderão ser chamados para apresentações orais / demonstrações dos trabalhos entregues. A Linguagem SBF

Funções na linguagem SBF contém apenas atribuições, operações aritméticas, chamadas de outras funções e retorno. Todas as funções SBF são delimitadas por uma marca de início (function) e uma marca de fim (end).

A linguagem tem um único tipo de dado: inteiro de 32 bits, com sinal.

Variáveis locais são denotadas por vi, sendo o índice i utilizado para identificar a variável (ex. v0, v1, etc...). A linguagem permite o uso de no máximo 5 variáveis locais. As variáveis locais serão necessáriamente alocadas na pilha!

As funções recebem apenas um parâmetro, denotado por p0.

Constantes são escritas na forma $i, onde i é um valor inteiro, com um sinal opcional. Por exemplo, $10 representa o valor 10 e $-10 representa o valor -10.

Uma atribuição tem a forma

var '=' expr

onde var é uma variável local e expr é uma operação aritmética ou uma chamada de função.

Uma operação aritmética tem a forma

varpc op varpc

onde varpc é uma variável local, o parâmetro da função ou uma constante e op é um dos operadores: + - *

A instrução de chamada de função tem a forma

'call' num varpc

onde num é um número que indica a função SBF que será chamada, com argumento varpc (uma variável local, o parâmetro da função ou uma constante).

A primeira função do arquivo de entrada será a de número 0, a segunda a de número 1, e assim por diante. Uma função só pode chamar a si mesma ou funções que apareçam antes dela no arquivo de entrada. A última função do arquivo de entrada é a que será chamada pelo programa principal.

Existem dois tipos de retorno: incondicional e condicional. A instrução de retorno incondicional tem a forma

'ret' varpc

Seu significado é que a função corrente deverá retornar, e o valor de retorno é o segundo operando.

A instrução de retorno condicional tem a forma

'zret' varpc varpc

Seu significado é que, se o primeiro operando tiver valor igual a zero a função corrente deverá retornar, e o valor de retorno é o segundo operando. Não haverá retorno se o primeiro operando tiver valor diferente de zero. 

A sintaxe da linguagem SBF pode ser definida formalmente como abaixo. Note que as cadeias entre ' ' são símbolos terminais da linguagem: os caracteres ' não aparecem nos comandos SBF.

pgm ::= func | func pgm func ::= header cmds endf header ::= 'function\n' endf ::= 'end\n' cmds ::= cmd'\n' | cmd '\n' cmds cmd ::= att | ret | zret att ::= var '=' expr expr ::= oper | call oper ::= varpc op varpc call ::= 'call' num varpc ret ::= 'ret' varpc zret ::= 'zret' varpc varpc var ::= 'v' num varpc ::= var | 'p0' | '$' snum op ::= '+' | '-' | '*' num ::= digito | digito num snum ::= [-] num digito ::= 0' | '1' | '2' | '3' | '4' | '5' | '6' | '7'| '8' | '9'

Alguns Exemplos Veja a seguir alguns exemplos de funções SBF.

Um exemplo muito simples é uma função SBF que retorna uma constante:

function
ret $100
end

Este exemplo implementa uma função f(x) = x + 1.

function
v0 = p0 + $1
ret v0
end

O próximo exemplo é uma função que calcula o fatorial de seu parâmetro:

function
zret p0 $1
v0 = p0 + $0
v1 = v0 - $1
v1 = call 0 v1
v0 = v0 * v1
ret v0
end

Finalmente, uma função que calcula a soma dos quadrados de 1 até o valor do seu parâmetro, usando uma função auxiliar para calcular o quadrado de um número:

function
v0 = p0 * p0
ret p0
end
function
zret p0 $0
v0 = p0 - $1
v1 = call 0 p0
v0 = call 1 v0
v0 = v0 + v1
ret v0
end

Implementação e Execução O que fazer Você deve desenvolver em C uma função chamada gera_codigo, que leia um arquivo de entrada contendo o código fonte de uma ou mais funções na linguagem SBF, gere o código de máquina correspondente, e retorne dois endereços: o início da região de memória alocada para armazenar o código gerado e o endereço da última função definida no arquivo de entrada (ou seja, o endereço da primeira instrução dessa função).

O primeiro endereço retornado é necessário para podermos liberar a memória alocada (usando a função libera_codigo). O segundo endereço é necessário para podermos fazer a chamada à função correspondente.

O arquivo de entrada terá no máximo 50 linhas, com um comando SBF por linha.

O protótipo de gera_codigo é o seguinte:

typedef int (*funcp) (int x); void gera_codigo (FILE *f, void **code, funcp *entry);

O parâmetro f é o descritor de um arquivo texto, já aberto para leitura, de onde deve ser lido o código fonte SBF.

O parâmetro code é um ponteiro para uma variável (do tipo void *) onde deve ser armazenado o endereço da área que contém o código gerado (para posterior liberação dessa área).

O parâmetro entry é um ponteiro para uma variável (do tipo "ponteiro para função que recebe inteiro e retorna inteiro") onde deve ser armazenado o endereço da função a ser chamada pelo programa principal.

Você deverá também desenvolver uma função que libere a área de memória alocada por gera_codigo, com o protótipo

void libera_codigo (void *p);

Implementação

A função gera_codigo deve alocar um bloco de memória onde armazenará o código gerado (lembre-se que as instruções de máquina ocupam um número variável de bytes na memória!). Os endereços retornados por gera_codigo serão o endereço do início da memória alocada e o endereço de início do código da última função (dentro dessa área, obviamente).

Para cada instrução SBF imagine qual uma tradução possível para assembly. Além disso, lembre-se que a tradução de uma função SBF deve começar com o prólogo usual (preparação do registro de ativação, incluindo o espaço para variáveis locais) e terminar com a finalização padrão (liberação do registro de ativação antes do retorno da função).

O código gerado deverá seguir as convenções de C/Linux quanto à passagem de parâmetros, valor de retorno e salvamento de registradores. As variáveis locais devem ser alocadas na pilha.

Para ler e interpretar cada linha da linguagem SBF, teste se a linha contém cada um dos formatos possíveis. Não é necessário fazer tratamento de erros no arquivo de entrada, você pode supor que o código fonte SBF desse arquivo está correto. Vale a pena colocar alguns testes para facilitar a própria depuração do seu código, mas as entradas usadas como testes na correção do trabalho sempre estarão corretas.

Veja um esboço de código C para fazer a interpretação de código aqui. Lembre-se que você terá que fazer adaptações pois, dentre outros detalhes, essa interpretação não será feita na main!

O código gerado por gera_codigo deverá ser um código de máquina x86-64, e não um código fonte assembly. Ou seja, você deverá descobrir o código de máquina que corresponde às instruções de assembly que implementam a tradução das instruções da linguagem SBF. Para isso, você pode usar o programa objdump e, se necessário, uma documentação das instruções da Intel.

Por exemplo, para descobrir o código gerado por movl %eax, %ecx, você pode criar um arquivo meuteste.s contendo apenas essa instrução, traduzi-lo com o gcc (usando a opção -c) para gerar um arquivo objeto meuteste.o, e usar o comando

objdump -d meuteste.o

para ver o código de máquina gerado.

Estratégia de Implementação Este trabalho não é trivial. Implemente sua solução passo a passo, testando separadamente cada passo implementado!

Por exemplo:

Compile um arquivo assembly contendo uma função bem simples usando:

minhamaquina> gcc -c code.s

(para apenas compilar e não gerar o executável) e depois veja o código de máquina gerado usando:

minhamaquina> objdump -d code.o

Construa uma versão inicial da função gera_codigo, que aloque uma área de memória, coloque lá esse código, bem conhecido, e retorne o endereço da área alocada como os dois retornos de gera_codigo (os retornos são iguais pois só há uma função no código).

Crie uma função main e teste essa versão inicial da função (leia o próximo item para ver como fazê-lo). Teste também a sua função de liberação de memória (chamada pela main!)

Implemente e teste a tradução de uma função SBF bem simples, como a do primeiro exemplo fornecido. Depois teste uma função que retorne o valor do parâmetro de entrada.
Comece agora a implementação de atribuições e operações aritméticas. Pense em que informações você precisa extrair para poder traduzir as instruções (quais são os operandos, qual é a operação, onde armazenar o resultado da operação).

Implemente e teste uma operação por vez. Experimente usar constantes, parâmetros, variáveis locais, e combinações desses tipos como operandos.

Lembre-se que é necessário alocar espaço (na pilha) para as variáveis locais!

Deixe para implementar a instrução call apenas quando todo o resto estiver funcionando!

Pense em que informações você precisa guardar para traduzir completamente essa instrução (note que você precisa saber qual o endereço da função a ser chamada). 

Testando o gerador de código

Você deve criar um arquivo contendo as funções gera_codigo e libera_codigo e outro arquivo com uma função main para testá-la.

Sua função main deverá abrir um arquivo texto que contém um "código fonte" na linguagem SBF (i.e, uma ou mais funções SBF) e chamar gera_codigo, passando o arquivo aberto como primeiro argumento, e os endereços de duas variáveis que receberão os retornos.

Em seguida, sua main deverá chamar a função retornada por gera_codigo (o segundo retorno), passando um argumento apropriado. Para verificar se a execução foi correta, você pode, por exemplo, imprimir o valor de retorno.

O "esqueleto" abaixo resume os principais passos de uma função main:

#include "gera_codigo.h" int main(int argc, char *argv[]) { FILE *fp; void code; funcp funcSBF; int res; ... / Abre o arquivo para leitura / fp = fopen(, "r"); ... / Gera o codigo / gera_codigo(fp, &code, &funcSBF); if ((code == NULL) || (funcSBF == NULL)) { printf("Erro na geracao\n"); ... } / Chama a função gerada */ res = (funcSBF)(); ... / Libera a memória utilizada */ libera_codigo(code); ... }

Não esqueça de compilar seu programa com

gcc -Wall -Wa,--execstack -o seuprograma seuprograma.c

para permitir a execução do código de máquina criado por gera_codigo!

Uma sugestão para testar a chamada de uma função SBF com diferentes arquivos e argumentos é utilizar parâmetros para o programa passados na linha de comando. Para ter acesso a eles, a sua função main deve ser declarada como

int main(int argc, char *argv[])

sendo argc o número de argumentos fornecidos na linha de comando e argv um array de ponteiros para strings (os argumentos).

Note que o primeiro argumento para main (argv[0]) é sempre o nome do seu executável, a seguir virão os demais argumentos.

Entrega

Deverão ser entregues via Moodle dois arquivos:

Um arquivo fonte chamado gera_codigo.c , contendo as funções gera_codigo e libera_codigo (e funções auxiliares, se for o caso).
    Esse arquivo não deve conter a função main.
    Coloque no início do arquivo, como comentário, os nomes dos integrantes do grupo da seguinte forma:

    /* Nome_do_Aluno1 Matricula Turma */
    /* Nome_do_Aluno2 Matricula Turma */

Um arquivo texto, chamado relatorio.txt, contendo um pequeno relatório.
    O relatório deverá explicar o que está funcionando e o que não está funcionando. Não é necessário documentar sua função no relatório. Seu código deverá ser claro o suficiente para que isso não seja necessário.
    O relatório deverá conter também alguns exemplos de funções da linguagem SBF que você usou para testar o seu trabalho. Mostre tanto as funções SBF traduzidas e executadas com sucesso como as que resultaram em erros (se for o caso).
    Coloque também no relatório o nome dos integrantes do grupo 

Indique na área de texto da tarefa do Moodle o nome dos integrantes do grupo. Apenas uma entrega é necessária se os dois integrantes pertencerem à mesma turma. # inf1018-trab2-18.2 INF1018 - Software Básico (2018.2) Segundo Trabalho Gerador de Código com Funções

O objetivo deste trabalho é desenvolver, em C, uma função gera_codigo, que implementa um gerador de código (um "micro-compilador" muito simples) para uma linguagem de programação bastante simples, chamada SBF.

A função gera_codigo deverá ler um arquivo texto contendo o código fonte de uma ou mais funções escritas em SBF e retornar dois endereços:

o início da região de memória que contém o código de máquina que corresponde à tradução das funções SBF para código de máquina
o início do código de máquina da última função lida (essa é a função que será chamada externamente). 

Deve ser implementada também uma função libera_codigo, que libera a memória alocada para armazenar o código criado por gera_codigo. Instruções Gerais

Leia com atenção o enunciado do trabalho e as instruções para a entrega. Em caso de dúvidas, não invente. Pergunte! O trabalho deve ser entregue até meia-noite (23:59) do dia 26 de novembro. Trabalhos entregues com atraso perderão um ponto por dia de atraso. Trabalhos que não compilem não serão considerados! Ou seja, receberão grau zero.

Os trabalhos podem ser feitos em grupos de dois alunos. Alguns grupos poderão ser chamados para apresentações orais / demonstrações dos trabalhos entregues. A Linguagem SBF

Funções na linguagem SBF contém apenas atribuições, operações aritméticas, chamadas de outras funções e retorno. Todas as funções SBF são delimitadas por uma marca de início (function) e uma marca de fim (end).

A linguagem tem um único tipo de dado: inteiro de 32 bits, com sinal.

Variáveis locais são denotadas por vi, sendo o índice i utilizado para identificar a variável (ex. v0, v1, etc...). A linguagem permite o uso de no máximo 5 variáveis locais. As variáveis locais serão necessáriamente alocadas na pilha!

As funções recebem apenas um parâmetro, denotado por p0.

Constantes são escritas na forma $i, onde i é um valor inteiro, com um sinal opcional. Por exemplo, $10 representa o valor 10 e $-10 representa o valor -10.

Uma atribuição tem a forma

var '=' expr

onde var é uma variável local e expr é uma operação aritmética ou uma chamada de função.

Uma operação aritmética tem a forma

varpc op varpc

onde varpc é uma variável local, o parâmetro da função ou uma constante e op é um dos operadores: + - *

A instrução de chamada de função tem a forma

'call' num varpc

onde num é um número que indica a função SBF que será chamada, com argumento varpc (uma variável local, o parâmetro da função ou uma constante).

A primeira função do arquivo de entrada será a de número 0, a segunda a de número 1, e assim por diante. Uma função só pode chamar a si mesma ou funções que apareçam antes dela no arquivo de entrada. A última função do arquivo de entrada é a que será chamada pelo programa principal.

Existem dois tipos de retorno: incondicional e condicional. A instrução de retorno incondicional tem a forma

'ret' varpc

Seu significado é que a função corrente deverá retornar, e o valor de retorno é o segundo operando.

A instrução de retorno condicional tem a forma

'zret' varpc varpc

Seu significado é que, se o primeiro operando tiver valor igual a zero a função corrente deverá retornar, e o valor de retorno é o segundo operando. Não haverá retorno se o primeiro operando tiver valor diferente de zero. 

A sintaxe da linguagem SBF pode ser definida formalmente como abaixo. Note que as cadeias entre ' ' são símbolos terminais da linguagem: os caracteres ' não aparecem nos comandos SBF.

pgm ::= func | func pgm func ::= header cmds endf header ::= 'function\n' endf ::= 'end\n' cmds ::= cmd'\n' | cmd '\n' cmds cmd ::= att | ret | zret att ::= var '=' expr expr ::= oper | call oper ::= varpc op varpc call ::= 'call' num varpc ret ::= 'ret' varpc zret ::= 'zret' varpc varpc var ::= 'v' num varpc ::= var | 'p0' | '$' snum op ::= '+' | '-' | '*' num ::= digito | digito num snum ::= [-] num digito ::= 0' | '1' | '2' | '3' | '4' | '5' | '6' | '7'| '8' | '9'

Alguns Exemplos Veja a seguir alguns exemplos de funções SBF.

Um exemplo muito simples é uma função SBF que retorna uma constante:

function
ret $100
end

Este exemplo implementa uma função f(x) = x + 1.

function
v0 = p0 + $1
ret v0
end

O próximo exemplo é uma função que calcula o fatorial de seu parâmetro:

function
zret p0 $1
v0 = p0 + $0
v1 = v0 - $1
v1 = call 0 v1
v0 = v0 * v1
ret v0
end

Finalmente, uma função que calcula a soma dos quadrados de 1 até o valor do seu parâmetro, usando uma função auxiliar para calcular o quadrado de um número:

function
v0 = p0 * p0
ret p0
end
function
zret p0 $0
v0 = p0 - $1
v1 = call 0 p0
v0 = call 1 v0
v0 = v0 + v1
ret v0
end

Implementação e Execução O que fazer Você deve desenvolver em C uma função chamada gera_codigo, que leia um arquivo de entrada contendo o código fonte de uma ou mais funções na linguagem SBF, gere o código de máquina correspondente, e retorne dois endereços: o início da região de memória alocada para armazenar o código gerado e o endereço da última função definida no arquivo de entrada (ou seja, o endereço da primeira instrução dessa função).

O primeiro endereço retornado é necessário para podermos liberar a memória alocada (usando a função libera_codigo). O segundo endereço é necessário para podermos fazer a chamada à função correspondente.

O arquivo de entrada terá no máximo 50 linhas, com um comando SBF por linha.

O protótipo de gera_codigo é o seguinte:

typedef int (*funcp) (int x); void gera_codigo (FILE *f, void **code, funcp *entry);

O parâmetro f é o descritor de um arquivo texto, já aberto para leitura, de onde deve ser lido o código fonte SBF.

O parâmetro code é um ponteiro para uma variável (do tipo void *) onde deve ser armazenado o endereço da área que contém o código gerado (para posterior liberação dessa área).

O parâmetro entry é um ponteiro para uma variável (do tipo "ponteiro para função que recebe inteiro e retorna inteiro") onde deve ser armazenado o endereço da função a ser chamada pelo programa principal.

Você deverá também desenvolver uma função que libere a área de memória alocada por gera_codigo, com o protótipo

void libera_codigo (void *p);

Implementação

A função gera_codigo deve alocar um bloco de memória onde armazenará o código gerado (lembre-se que as instruções de máquina ocupam um número variável de bytes na memória!). Os endereços retornados por gera_codigo serão o endereço do início da memória alocada e o endereço de início do código da última função (dentro dessa área, obviamente).

Para cada instrução SBF imagine qual uma tradução possível para assembly. Além disso, lembre-se que a tradução de uma função SBF deve começar com o prólogo usual (preparação do registro de ativação, incluindo o espaço para variáveis locais) e terminar com a finalização padrão (liberação do registro de ativação antes do retorno da função).

O código gerado deverá seguir as convenções de C/Linux quanto à passagem de parâmetros, valor de retorno e salvamento de registradores. As variáveis locais devem ser alocadas na pilha.

Para ler e interpretar cada linha da linguagem SBF, teste se a linha contém cada um dos formatos possíveis. Não é necessário fazer tratamento de erros no arquivo de entrada, você pode supor que o código fonte SBF desse arquivo está correto. Vale a pena colocar alguns testes para facilitar a própria depuração do seu código, mas as entradas usadas como testes na correção do trabalho sempre estarão corretas.

Veja um esboço de código C para fazer a interpretação de código aqui. Lembre-se que você terá que fazer adaptações pois, dentre outros detalhes, essa interpretação não será feita na main!

O código gerado por gera_codigo deverá ser um código de máquina x86-64, e não um código fonte assembly. Ou seja, você deverá descobrir o código de máquina que corresponde às instruções de assembly que implementam a tradução das instruções da linguagem SBF. Para isso, você pode usar o programa objdump e, se necessário, uma documentação das instruções da Intel.

Por exemplo, para descobrir o código gerado por movl %eax, %ecx, você pode criar um arquivo meuteste.s contendo apenas essa instrução, traduzi-lo com o gcc (usando a opção -c) para gerar um arquivo objeto meuteste.o, e usar o comando

objdump -d meuteste.o

para ver o código de máquina gerado.

Estratégia de Implementação Este trabalho não é trivial. Implemente sua solução passo a passo, testando separadamente cada passo implementado!

Por exemplo:

Compile um arquivo assembly contendo uma função bem simples usando:

minhamaquina> gcc -c code.s

(para apenas compilar e não gerar o executável) e depois veja o código de máquina gerado usando:

minhamaquina> objdump -d code.o

Construa uma versão inicial da função gera_codigo, que aloque uma área de memória, coloque lá esse código, bem conhecido, e retorne o endereço da área alocada como os dois retornos de gera_codigo (os retornos são iguais pois só há uma função no código).

Crie uma função main e teste essa versão inicial da função (leia o próximo item para ver como fazê-lo). Teste também a sua função de liberação de memória (chamada pela main!)

Implemente e teste a tradução de uma função SBF bem simples, como a do primeiro exemplo fornecido. Depois teste uma função que retorne o valor do parâmetro de entrada.
Comece agora a implementação de atribuições e operações aritméticas. Pense em que informações você precisa extrair para poder traduzir as instruções (quais são os operandos, qual é a operação, onde armazenar o resultado da operação).

Implemente e teste uma operação por vez. Experimente usar constantes, parâmetros, variáveis locais, e combinações desses tipos como operandos.

Lembre-se que é necessário alocar espaço (na pilha) para as variáveis locais!

Deixe para implementar a instrução call apenas quando todo o resto estiver funcionando!

Pense em que informações você precisa guardar para traduzir completamente essa instrução (note que você precisa saber qual o endereço da função a ser chamada). 

Testando o gerador de código

Você deve criar um arquivo contendo as funções gera_codigo e libera_codigo e outro arquivo com uma função main para testá-la.

Sua função main deverá abrir um arquivo texto que contém um "código fonte" na linguagem SBF (i.e, uma ou mais funções SBF) e chamar gera_codigo, passando o arquivo aberto como primeiro argumento, e os endereços de duas variáveis que receberão os retornos.

Em seguida, sua main deverá chamar a função retornada por gera_codigo (o segundo retorno), passando um argumento apropriado. Para verificar se a execução foi correta, você pode, por exemplo, imprimir o valor de retorno.

O "esqueleto" abaixo resume os principais passos de uma função main:

#include "gera_codigo.h" int main(int argc, char *argv[]) { FILE *fp; void code; funcp funcSBF; int res; ... / Abre o arquivo para leitura / fp = fopen(, "r"); ... / Gera o codigo / gera_codigo(fp, &code, &funcSBF); if ((code == NULL) || (funcSBF == NULL)) { printf("Erro na geracao\n"); ... } / Chama a função gerada */ res = (funcSBF)(); ... / Libera a memória utilizada */ libera_codigo(code); ... }

Não esqueça de compilar seu programa com

gcc -Wall -Wa,--execstack -o seuprograma seuprograma.c

para permitir a execução do código de máquina criado por gera_codigo!

Uma sugestão para testar a chamada de uma função SBF com diferentes arquivos e argumentos é utilizar parâmetros para o programa passados na linha de comando. Para ter acesso a eles, a sua função main deve ser declarada como

int main(int argc, char *argv[])

sendo argc o número de argumentos fornecidos na linha de comando e argv um array de ponteiros para strings (os argumentos).

Note que o primeiro argumento para main (argv[0]) é sempre o nome do seu executável, a seguir virão os demais argumentos.

Entrega

Deverão ser entregues via Moodle dois arquivos:

Um arquivo fonte chamado gera_codigo.c , contendo as funções gera_codigo e libera_codigo (e funções auxiliares, se for o caso).
    Esse arquivo não deve conter a função main.
    Coloque no início do arquivo, como comentário, os nomes dos integrantes do grupo da seguinte forma:

    /* Nome_do_Aluno1 Matricula Turma */
    /* Nome_do_Aluno2 Matricula Turma */

Um arquivo texto, chamado relatorio.txt, contendo um pequeno relatório.
    O relatório deverá explicar o que está funcionando e o que não está funcionando. Não é necessário documentar sua função no relatório. Seu código deverá ser claro o suficiente para que isso não seja necessário.
    O relatório deverá conter também alguns exemplos de funções da linguagem SBF que você usou para testar o seu trabalho. Mostre tanto as funções SBF traduzidas e executadas com sucesso como as que resultaram em erros (se for o caso).
    Coloque também no relatório o nome dos integrantes do grupo 

Indique na área de texto da tarefa do Moodle o nome dos integrantes do grupo. Apenas uma entrega é necessária se os dois integrantes pertencerem à mesma turma. # inf1018-trab2-18.2 INF1018 - Software Básico (2018.2) Segundo Trabalho Gerador de Código com Funções

O objetivo deste trabalho é desenvolver, em C, uma função gera_codigo, que implementa um gerador de código (um "micro-compilador" muito simples) para uma linguagem de programação bastante simples, chamada SBF.

A função gera_codigo deverá ler um arquivo texto contendo o código fonte de uma ou mais funções escritas em SBF e retornar dois endereços:

o início da região de memória que contém o código de máquina que corresponde à tradução das funções SBF para código de máquina
o início do código de máquina da última função lida (essa é a função que será chamada externamente). 

Deve ser implementada também uma função libera_codigo, que libera a memória alocada para armazenar o código criado por gera_codigo. Instruções Gerais

Leia com atenção o enunciado do trabalho e as instruções para a entrega. Em caso de dúvidas, não invente. Pergunte! O trabalho deve ser entregue até meia-noite (23:59) do dia 26 de novembro. Trabalhos entregues com atraso perderão um ponto por dia de atraso. Trabalhos que não compilem não serão considerados! Ou seja, receberão grau zero.

Os trabalhos podem ser feitos em grupos de dois alunos. Alguns grupos poderão ser chamados para apresentações orais / demonstrações dos trabalhos entregues. A Linguagem SBF

Funções na linguagem SBF contém apenas atribuições, operações aritméticas, chamadas de outras funções e retorno. Todas as funções SBF são delimitadas por uma marca de início (function) e uma marca de fim (end).

A linguagem tem um único tipo de dado: inteiro de 32 bits, com sinal.

Variáveis locais são denotadas por vi, sendo o índice i utilizado para identificar a variável (ex. v0, v1, etc...). A linguagem permite o uso de no máximo 5 variáveis locais. As variáveis locais serão necessáriamente alocadas na pilha!

As funções recebem apenas um parâmetro, denotado por p0.

Constantes são escritas na forma $i, onde i é um valor inteiro, com um sinal opcional. Por exemplo, $10 representa o valor 10 e $-10 representa o valor -10.

Uma atribuição tem a forma

var '=' expr

onde var é uma variável local e expr é uma operação aritmética ou uma chamada de função.

Uma operação aritmética tem a forma

varpc op varpc

onde varpc é uma variável local, o parâmetro da função ou uma constante e op é um dos operadores: + - *

A instrução de chamada de função tem a forma

'call' num varpc

onde num é um número que indica a função SBF que será chamada, com argumento varpc (uma variável local, o parâmetro da função ou uma constante).

A primeira função do arquivo de entrada será a de número 0, a segunda a de número 1, e assim por diante. Uma função só pode chamar a si mesma ou funções que apareçam antes dela no arquivo de entrada. A última função do arquivo de entrada é a que será chamada pelo programa principal.

Existem dois tipos de retorno: incondicional e condicional. A instrução de retorno incondicional tem a forma

'ret' varpc

Seu significado é que a função corrente deverá retornar, e o valor de retorno é o segundo operando.

A instrução de retorno condicional tem a forma

'zret' varpc varpc

Seu significado é que, se o primeiro operando tiver valor igual a zero a função corrente deverá retornar, e o valor de retorno é o segundo operando. Não haverá retorno se o primeiro operando tiver valor diferente de zero. 

A sintaxe da linguagem SBF pode ser definida formalmente como abaixo. Note que as cadeias entre ' ' são símbolos terminais da linguagem: os caracteres ' não aparecem nos comandos SBF.

pgm ::= func | func pgm func ::= header cmds endf header ::= 'function\n' endf ::= 'end\n' cmds ::= cmd'\n' | cmd '\n' cmds cmd ::= att | ret | zret att ::= var '=' expr expr ::= oper | call oper ::= varpc op varpc call ::= 'call' num varpc ret ::= 'ret' varpc zret ::= 'zret' varpc varpc var ::= 'v' num varpc ::= var | 'p0' | '$' snum op ::= '+' | '-' | '*' num ::= digito | digito num snum ::= [-] num digito ::= 0' | '1' | '2' | '3' | '4' | '5' | '6' | '7'| '8' | '9'

Alguns Exemplos Veja a seguir alguns exemplos de funções SBF.

Um exemplo muito simples é uma função SBF que retorna uma constante:

function
ret $100
end

Este exemplo implementa uma função f(x) = x + 1.

function
v0 = p0 + $1
ret v0
end

O próximo exemplo é uma função que calcula o fatorial de seu parâmetro:

function
zret p0 $1
v0 = p0 + $0
v1 = v0 - $1
v1 = call 0 v1
v0 = v0 * v1
ret v0
end

Finalmente, uma função que calcula a soma dos quadrados de 1 até o valor do seu parâmetro, usando uma função auxiliar para calcular o quadrado de um número:

function
v0 = p0 * p0
ret p0
end
function
zret p0 $0
v0 = p0 - $1
v1 = call 0 p0
v0 = call 1 v0
v0 = v0 + v1
ret v0
end

Implementação e Execução O que fazer Você deve desenvolver em C uma função chamada gera_codigo, que leia um arquivo de entrada contendo o código fonte de uma ou mais funções na linguagem SBF, gere o código de máquina correspondente, e retorne dois endereços: o início da região de memória alocada para armazenar o código gerado e o endereço da última função definida no arquivo de entrada (ou seja, o endereço da primeira instrução dessa função).

O primeiro endereço retornado é necessário para podermos liberar a memória alocada (usando a função libera_codigo). O segundo endereço é necessário para podermos fazer a chamada à função correspondente.

O arquivo de entrada terá no máximo 50 linhas, com um comando SBF por linha.

O protótipo de gera_codigo é o seguinte:

typedef int (*funcp) (int x); void gera_codigo (FILE *f, void **code, funcp *entry);

O parâmetro f é o descritor de um arquivo texto, já aberto para leitura, de onde deve ser lido o código fonte SBF.

O parâmetro code é um ponteiro para uma variável (do tipo void *) onde deve ser armazenado o endereço da área que contém o código gerado (para posterior liberação dessa área).

O parâmetro entry é um ponteiro para uma variável (do tipo "ponteiro para função que recebe inteiro e retorna inteiro") onde deve ser armazenado o endereço da função a ser chamada pelo programa principal.

Você deverá também desenvolver uma função que libere a área de memória alocada por gera_codigo, com o protótipo

void libera_codigo (void *p);

Implementação

A função gera_codigo deve alocar um bloco de memória onde armazenará o código gerado (lembre-se que as instruções de máquina ocupam um número variável de bytes na memória!). Os endereços retornados por gera_codigo serão o endereço do início da memória alocada e o endereço de início do código da última função (dentro dessa área, obviamente).

Para cada instrução SBF imagine qual uma tradução possível para assembly. Além disso, lembre-se que a tradução de uma função SBF deve começar com o prólogo usual (preparação do registro de ativação, incluindo o espaço para variáveis locais) e terminar com a finalização padrão (liberação do registro de ativação antes do retorno da função).

O código gerado deverá seguir as convenções de C/Linux quanto à passagem de parâmetros, valor de retorno e salvamento de registradores. As variáveis locais devem ser alocadas na pilha.

Para ler e interpretar cada linha da linguagem SBF, teste se a linha contém cada um dos formatos possíveis. Não é necessário fazer tratamento de erros no arquivo de entrada, você pode supor que o código fonte SBF desse arquivo está correto. Vale a pena colocar alguns testes para facilitar a própria depuração do seu código, mas as entradas usadas como testes na correção do trabalho sempre estarão corretas.

Veja um esboço de código C para fazer a interpretação de código aqui. Lembre-se que você terá que fazer adaptações pois, dentre outros detalhes, essa interpretação não será feita na main!

O código gerado por gera_codigo deverá ser um código de máquina x86-64, e não um código fonte assembly. Ou seja, você deverá descobrir o código de máquina que corresponde às instruções de assembly que implementam a tradução das instruções da linguagem SBF. Para isso, você pode usar o programa objdump e, se necessário, uma documentação das instruções da Intel.

Por exemplo, para descobrir o código gerado por movl %eax, %ecx, você pode criar um arquivo meuteste.s contendo apenas essa instrução, traduzi-lo com o gcc (usando a opção -c) para gerar um arquivo objeto meuteste.o, e usar o comando

objdump -d meuteste.o

para ver o código de máquina gerado.

Estratégia de Implementação Este trabalho não é trivial. Implemente sua solução passo a passo, testando separadamente cada passo implementado!

Por exemplo:

Compile um arquivo assembly contendo uma função bem simples usando:

minhamaquina> gcc -c code.s

(para apenas compilar e não gerar o executável) e depois veja o código de máquina gerado usando:

minhamaquina> objdump -d code.o

Construa uma versão inicial da função gera_codigo, que aloque uma área de memória, coloque lá esse código, bem conhecido, e retorne o endereço da área alocada como os dois retornos de gera_codigo (os retornos são iguais pois só há uma função no código).

Crie uma função main e teste essa versão inicial da função (leia o próximo item para ver como fazê-lo). Teste também a sua função de liberação de memória (chamada pela main!)

Implemente e teste a tradução de uma função SBF bem simples, como a do primeiro exemplo fornecido. Depois teste uma função que retorne o valor do parâmetro de entrada.
Comece agora a implementação de atribuições e operações aritméticas. Pense em que informações você precisa extrair para poder traduzir as instruções (quais são os operandos, qual é a operação, onde armazenar o resultado da operação).

Implemente e teste uma operação por vez. Experimente usar constantes, parâmetros, variáveis locais, e combinações desses tipos como operandos.

Lembre-se que é necessário alocar espaço (na pilha) para as variáveis locais!

Deixe para implementar a instrução call apenas quando todo o resto estiver funcionando!

Pense em que informações você precisa guardar para traduzir completamente essa instrução (note que você precisa saber qual o endereço da função a ser chamada). 

Testando o gerador de código

Você deve criar um arquivo contendo as funções gera_codigo e libera_codigo e outro arquivo com uma função main para testá-la.

Sua função main deverá abrir um arquivo texto que contém um "código fonte" na linguagem SBF (i.e, uma ou mais funções SBF) e chamar gera_codigo, passando o arquivo aberto como primeiro argumento, e os endereços de duas variáveis que receberão os retornos.

Em seguida, sua main deverá chamar a função retornada por gera_codigo (o segundo retorno), passando um argumento apropriado. Para verificar se a execução foi correta, você pode, por exemplo, imprimir o valor de retorno.

O "esqueleto" abaixo resume os principais passos de uma função main:

#include "gera_codigo.h" int main(int argc, char *argv[]) { FILE *fp; void code; funcp funcSBF; int res; ... / Abre o arquivo para leitura / fp = fopen(, "r"); ... / Gera o codigo / gera_codigo(fp, &code, &funcSBF); if ((code == NULL) || (funcSBF == NULL)) { printf("Erro na geracao\n"); ... } / Chama a função gerada */ res = (funcSBF)(); ... / Libera a memória utilizada */ libera_codigo(code); ... }

Não esqueça de compilar seu programa com

gcc -Wall -Wa,--execstack -o seuprograma seuprograma.c

para permitir a execução do código de máquina criado por gera_codigo!

Uma sugestão para testar a chamada de uma função SBF com diferentes arquivos e argumentos é utilizar parâmetros para o programa passados na linha de comando. Para ter acesso a eles, a sua função main deve ser declarada como

int main(int argc, char *argv[])

sendo argc o número de argumentos fornecidos na linha de comando e argv um array de ponteiros para strings (os argumentos).

Note que o primeiro argumento para main (argv[0]) é sempre o nome do seu executável, a seguir virão os demais argumentos.

Entrega

Deverão ser entregues via Moodle dois arquivos:

Um arquivo fonte chamado gera_codigo.c , contendo as funções gera_codigo e libera_codigo (e funções auxiliares, se for o caso).
    Esse arquivo não deve conter a função main.
    Coloque no início do arquivo, como comentário, os nomes dos integrantes do grupo da seguinte forma:

    /* Nome_do_Aluno1 Matricula Turma */
    /* Nome_do_Aluno2 Matricula Turma */

Um arquivo texto, chamado relatorio.txt, contendo um pequeno relatório.
    O relatório deverá explicar o que está funcionando e o que não está funcionando. Não é necessário documentar sua função no relatório. Seu código deverá ser claro o suficiente para que isso não seja necessário.
    O relatório deverá conter também alguns exemplos de funções da linguagem SBF que você usou para testar o seu trabalho. Mostre tanto as funções SBF traduzidas e executadas com sucesso como as que resultaram em erros (se for o caso).
    Coloque também no relatório o nome dos integrantes do grupo 

Indique na área de texto da tarefa do Moodle o nome dos integrantes do grupo. Apenas uma entrega é necessária se os dois integrantes pertencerem à mesma turma.

Um arquivo texto, chamado relatorio.txt, contendo um pequeno relatório.
    O relatório deverá explicar o que está funcionando e o que não está funcionando. Não é necessário documentar sua função no relatório. Seu código deverá ser claro o suficiente para que isso não seja necessário.
    O relatório deverá conter também alguns exemplos de funções da linguagem SBF que você usou para testar o seu trabalho. Mostre tanto as funções SBF traduzidas e executadas com sucesso como as que resultaram em erros (se for o caso).
    Coloque também no relatório o nome dos integrantes do grupo 

Indique na área de texto da tarefa do Moodle o nome dos integrantes do grupo. Apenas uma entrega é necessária se os dois integrantes pertencerem à mesma turma.

inf1018-trab2-18.2's People

Contributors

marianaruddy avatar ducho-metson avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.