Please enable JavaScript.

Coggle requires JavaScript to display documents.

Capítulo 2 Compiladores e intérpretes image, image, image, image, image…

- - - - Ventajas
        
        ● El diseño del código generado por el compilador no está condicionado por la arquitectura de la máquina de destino.
        
        ● Se mejora la portabilidad.
        
        ● El código de la máquina virtual puede diseñarse para que sea especialmente compacto.
        
        ● La depuración y supervisión en tiempo de ejecución pueden incorporarse al intérprete de la máquina virtual, permite mejorar la seguridad en la ejecución del programa.
      - Desventaja
        
        Es la cuestión de la eficiencia, es probable que el código interpretado sea más lento que la ejecución nativa.
  - - - Ejemplo
        
        Si mylanguage es un lenguaje de programación de alto nivel y mymachine es un procesador implementado en hardware, el programa traductor se llama compilador.
        
        Si mylanguage es un lenguaje ensamblador, el traductor se llama ensamblador y es más fácil de implementar que un compilador.
  - - - Lee el programa fuente en mylanguage, creando estructuras de datos internas que reflejan su estructura sintáctica y semántica.
    - - Genera código para mymachine a partir de las estructuras de datos creadas por la fase de análisis.
- - - - La sintaxis formal de los lenguajes, expresada en forma de BNF, carecerá de una especificación para algunas de las reglas de construcción de programas bien formados.
        
        Se debe al hecho de que una especificación BNF no puede expresar restricciones contextuales.
      - Un ejemplo es la gramática de dos niveles.
        
        Utiliza dos conjuntos de reglas en dos metalenguajes diferentes.
      - Una de las ventajas de conservar esta forma de especificación sintáctica es que la generación de la fase de análisis del compilador puede hacerse muy sencilla.
    - - Se uso en la definición de la sintaxis de ALGOL 60.
      - Es un metalenguaje sencillo pero potente, se ha utilizado para apoyar las definiciones formales.
    - - Es un conjunto de reglas, cada una define un símbolo del lenguaje.
      - BNF está lejos de ser lo potente como para definir la sintaxis del inglés o de otro lenguaje natural.
    - - No existe límite máximo para la longitud de expresiones que pueden ser generadas por estas reglas.
      - Las reglas BNF pueden utilizarse para apoyar la idea de la precedencia de los operadores, aquí el operador * es mayor que la del operador +: la multiplicación se "hace antes" que la suma.
      - Las reglas BNF pueden utilizarse para expresar la asociatividad de los operadores.
    - - Conserva los principios básicos de BNF, pero el detalle sintáctico es un poco diferente.
    - - ● Se pueden utilizar paréntesis para indicar la agrupación en la regla.
      - ● Característica específica para indicar la opcionalidad en una regla: X] especifica que X es opcional.
      - ● Se admite la repetición: {X} implica cero o más instancias de X.
  - - - La semántica operativa, denotativa y axiomática, basando una descripción formal de la semántica en la sintaxis del lenguaje.
    - - Los símbolos de la gramática se asocian a los atributos.
      - Permiten la especificación formal de la semántica operativa del lenguaje, apoyando comprobaciones semánticas.
    - - Especifica la semántica de forma más indirecta mediante la producción de una implementación de referencia.
      - Se selecciona una implementación concreta para definir cómo deben comportarse las demás implementaciones.
      - La simplicidad de este enfoque es atractiva.
    - - Consiste en especificar la semántica utilizando un lenguaje natural.
      - Se utiliza un texto en un lenguaje natural como el inglés para describir las reglas semánticas.
      - Hay que tener cuidado para evitar omisiones o ambigüedades y evitar que la especificación sea demasiado larga.
- - - - ● N es el conjunto finito de símbolos no terminales.
      - ● T es el conjunto finito de símbolos terminales (N y T son disjuntos).
      - ● S es el símbolo inicial, S ∈ N.
      - ● P es el conjunto finito de reglas de producción.
    - - Una forma sentencial es cualquier cadena que pueda derivarse de S, el símbolo inicial.
      - Una frase es una forma sentencial que no contiene ningún símbolo no terminal.
      - Una sentencia es un programa completo, que sólo contiene símbolos terminales.
  - - - Se traduce como cualquier cosa puede transformarse en cualquier cosa.
    - - ● Una gramática de tipo 0, una gramática libre o sin restricciones contiene producciones de la forma α → β.
      - ● Una gramática de tipo 1 o sensible al contexto tiene producciones de la forma αAβ → αγβ.
      - ● Una gramática de tipo 2 o libre de contexto tiene producciones de la forma A → γ donde A es un único símbolo no terminal.
      - ● Una gramática de tipo 3, una gramática regular o una gramática de estado finito pone más restricciones a la forma de las producciones. Las producciones son de la forma A → a o A → aB.
  - - - El analizador sintáctico obtiene un flujo de tokens
        
        A partir del analizador léxico de un compilador convencional y los hace coincidir con los tokens de las reglas de producción
      - Indica si la entrada del analizador sintáctico forma una frase sintácticamente correcta.
      - Esta estructura de datos es un árbol
        
        El árbol se construye a medida que realiza su secuencia de reducciones y la forma del árbol refleja refleja la especificación sintáctica del lenguaje.
        
        El nodo raíz del árbol corresponde al símbolo inicial de la gramática.
        
        Refleja la definición sintáctica formal del lenguaje y puede resultar redundante.
    - - La mayoría de los analizadores sintácticos pueden clasificarse como descendentes o ascendentes.
        
        Analizador sintáctico descendente
        
        Comienza con el símbolo inicial de la gramática y con la raíz del árbol de análisis sintáctico.
        
        Su objetivo es hacer coincidir la entrada con la definición del símbolo inicial.
        
        Cuando el lado derecho de una producción que se está emparejando con la entrada contiene símbolos terminales, estos pueden ser con la cadena de entrada
        
        Si está haciendo reducciones repetidas, el orden y la elección están controlados por la estructura del conjunto de producciones.
        
        Analizador sintáctico ascendente
        
        Empezamos con la cadena de entrada, elegimos una subcadena que coincida con el lado derecho, esta reemplaza la subcadena con el lado izquierdo y repetir hasta que quede el símbolo inicial.
        
        El árbol de análisis sintáctico se construye hacia arriba desde las hojas, llegando finalmente al símbolo inicial en la raíz.
        
        El problema clave aquí es determinar qué reducciones aplicar y en qué orden.
- - - - Son tokens como números, identificadores, signos de puntuación, operadores, cadenas, palabras reservadas, etc.
  - - - Se basa en un tipo de árbol en el que los nodos representan componentes sintácticos definidos por la gramática.
      - Esta estructura de datos debe contener o enlazar con toda la información necesaria para las fases de compilación
  - - - Aplanar el árbol de análisis sintáctico para producir alguna forma de código intermedio.
      - Debe ser sencillo generar este código intermedio recorriendo el árbol.
      - La información de tipo se preserva para que el código intermedio sea funcionalmente equivalente al programa fuente original.
  - - - Seleccionar las instrucciones de máquina adecuadas.
      - Tratar con un esquema de asignación de almacenamiento para todas las variables y estructuras.
      - Generar código para interactuar con las bibliotecas y el SO.
  - - - Soporta una búsqueda de nombres eficiente y accesible.