Robert.BrainUsers.net

Analiza leksykalna

Jestem w trakcie pisania w Javie obfuskatora dla języka JavaScript i potrzebowałem zapoznać się z tematyką analizy leksykalnej. Znalazłem stronę Marcina Kubicy z Uniwersytetu Warszawskiego, na której publikuje on treści swoich wykładów, m. in. wykład Języki formalne i automaty, JFA. Chwała mu za to!

Aby wykonać operację zaciemniania kodu JavaScript muszę w jakiś sposób go parsować i odnaleźć identyfikatory, które da się zaciemnić. Z pomocą przychodzi analiza leksykalna. Wystarczy podzielić kod wyrażeniami regularnymi na leksemy - dyskretne (niepodzielne) fragmenty konkretnego typu (np. słowo kluczowe, operator, identyfikator, białe znaki, komentarze). Jeśli cały kod będzie reprezentowany przez leksemy, będę mógł w prosty sposób wyciągnąć z niego i obfuskować identyfikatory a także usunąć niepotrzebne fragmenty (komentarze, białe znaki).

Czytaj także: Zaciemnianie kodu źródłowego

Komentarze

Na razie brak komentarzy, Twój będzie pierwszy.

Dodaj komentarz