Tesseract, Training data generation, Always leverage any priori knowledge…