Please enable JavaScript.

Coggle requires JavaScript to display documents.

Capítulo 3 Análisis léxico image - Coggle Diagram

- - - - dividiendo la entrada en una secuencia de tokens
  - - - producir una lista de todos los tokens léxicos que
        
        el analizador léxico debería reconocer
    - - para la especificación de tokens léxicos
  - - - identificadores se describen como
        
        "comenzando con una letra, seguida de una secuencia de letras o dígitos".
    - - la naturaleza de un token léxico puede depender de su contexto
  - - - tiene que pasar al analizador de sintaxis
        
        El compilador usa el tabla de símbolos para almacenar información
- - - - regulares que definen los tokens
  - - - La estructura de alto nivel de la entrada es simple
        
        La sección consta de un conjunto de pares de nombre / definición
  - - - Incluye solo tres tokens léxicos
        
        Un "número",
        
        Cualquier otro personaje
        
        Una “palabra”,
  - - - con un pequeño conjunto de tokens léxicos
        
        Las definiciones de espacio_blanco, letra, dígito, letra_o_dígito
        
        hacen simplemente para mejorar la legibilidad en la sección de reglas
  - - - para reconocer los tokens individuales,
    - - analizador léxico se devuelven como números enteros
        
        pero para que el código sea un poco más legible y fác
  - - - Para la construcción de un analizador léxico
    - - se reconocen mediante código escrito a mano y los
        
        demás mediante las reglas de expresión regular
    - - Es importante utilizar la herramienta adecuada
- - - - Enfoques para la construcción de analizadores léxicos
        
        implementación directa de analizadores léxicos programándolos desde cero
  - - - Este examinará los caracteres de la entrada
        
        puede leer hasta el final del token y almacenarlo
        
        la constante MAXIDLEN proporciona un límite superior en la longitud de un identificador
        
        hace posible el uso de matrices de longitud fija
  - - - Aborda el reconocimiento de los tipos de tokens individuales
    - - Se pueden insertar libremente entre tokens léxicos
        
        o es factible ni sensato depender de la existencia de
        
        espacios en blanco para separar todos los tokens.
    - - Valor de ch determinará, pero no de forma única
        
        la naturaleza del token que se reconoce
        
        el código para tratar con el token '/' tendrá que ser rediseñado porque el personaje
    - - Es fácil ver que hay algunos tokens más de un solo carácter
        
        código de reconocimiento más sofisticado
        
        no se permiten espacios en blanco entre los dos caracteres.
    - - Las constantes enteras se manejan de manera estándar
        
        convirtiendo un flujo de caracteres de dígitos decimales en un binario interno
        
        posible utilizar la función de biblioteca C atoi
    - - El lenguaje DL admite comentarios entre corchetes / y /.
        
        La variable ingreso está establecido en TRUE
        
        El comentario finaliza si se detecta el final de la entrada
    - - Puede detectar una serie de errores, como leer un carácter inesperado
        
        tales errores deben comunicarse al usuario del compilado
        
        el compilador tiene que recuperar el error
        
        para que el análisis de la entrada pueda continuar.
        
        Una vez que el analizador de sintaxis se ha integrado con el analizador léxico
        
        Está lidiando satisfactoriamente con los errores
  - - - Piezas individuales de código para tratar con cada uno de los tokens léxicos
        
        Un analizador léxico para un lenguaje real requiere
        
        Decisiones de diseño adicionales
        
        una atención cuidadosa a los detalles de codificación.
    - - Las reglas deben seguirse en el analizador léxico.
        
        El analizador léxico necesita acceso a una estructura de datos
        
        La búsqueda rápida es deseable mantener la eficiencia de la compilación
    - - Las constantes de punto flotante tienen una sintaxis más compleja
        
        requieren un enfoque sistemático para la codificación de su análisis léxico
    - - El analizador léxico no debería ser demasiado difícil de probar
        
        la prueba debe ser sistemática y exhaustiva
    - - Lenguajes en los que solo se puede distinguir entre palabras clave
        
        e identificadores examinando el contexto
      - las soluciones prácticas pueden tener que recurrir al análisis léxico
    - - Estructura general del analizador léxico es intuitiva
        
        con una clara separación entre las secciones de código que tratan con cada token individual
- - - - para instancias de expresiones regulares
    - - permite un análisis sintáctico eficiente
        
        el código del analizador es simple, controlado por un gráfico dirigido