Please enable JavaScript.
Coggle requires JavaScript to display documents.
Лексичний аналіз програми - Coggle Diagram
Лексичний аналіз програми
Поняття лексеми
Мінімальна структурна одиниця мови, що складається з елементарних символів.
Типи лексем у програмуванні:
Ідентифікатори: Імена змінних, функцій (наприклад, i, sum).
Ключові слова: Зарезервовані мовою (for, int, if).
Константи: Числові (0, 3.14), рядкові ("Hello"), символьні ('a').
Знаки операцій: Арифметичні, логічні, інкремент (+, ==, ++).
Роздільники: Розділяють частини коду (;, (, {).
Лексичний аналізатор (Сканер)
Роль:
Посередник між вихідним текстом та синтаксичним аналізатором.
Вхід:
"Сирий" текст програми (потік символів).
Вихід:
Таблиця лексем (потік кодів).
Функції:
Виділення лексем.
Видалення "шуму" (коментарі, пробіли, табуляція).
Структурування інформації.
Зберігання результатів
Таблиця лексем:
Містить повний текст програми у кодах
Порядок відповідає оригіналу
Таблиця ідентифікаторів:
Містить лише унікальні назви та константи
Використовується для швидкого пошуку об'єктів
Ключові принципи та правила
Математична база
Скінченні автомати та регулярні граматики
Правило «найдовшої лексеми»
Сканер завжди намагається захопити максимальну кількість символів для однієї лексеми
наприклад,
+++ розпізнається як ++ та +
Переваги окремого етапу
Спрощення синтаксичного аналізу.
Легший перехід між версіями мови.
Підвищення надійності трансляції.