Järgmisena normaliseeritakse küsimuse sõnad, et need oleksid masinloetavad. Selleks tehakse mitmeid toiminguid, näiteks sõnade tüvestamist (stemming) ja sõnade lemmatiseerimist (lemmatization). Sõnade tüvestamine tähendab sõna tüve eraldamist ja selle kasutamist erinevate sõna vormide asemel. Näiteks sõnade "jooksma", "jooksjad", "jooksid" puhul võetakse kasutusele sõna "jooks". Sõnade lemmatiseerimine tähendab sõna baasvormi taastamist, et kõik sõna vormid võetakse kokku. Näiteks sõnade "koer", "koera", "koeri" puhul võetakse kasutusele sõna "koer".