वर्णों के एक शब्दकोश का प्रतिनिधित्व करता है जिसका उपयोग वर्ण प्रकार का पता लगाने के लिए अनुक्रमण के दौरान किया जाता है। प्रत्येक वर्ण को विभाजक, अक्षर या दोनों के रूप में संभाला जा सकता है।
एक कैरेक्टर रिप्लेसमेंट डिक्शनरी का प्रतिनिधित्व करता है जिसका उपयोग इंडेक्सिंग प्रक्रिया के दौरान किया जाता है। कैरेक्टर रिप्लेसमेंट का उपयोग किया जा सकता है, उदाहरण के लिए, एक्सेंट कैरेक्टर्स से एक्सेंट हटाने या केस-इनसेंसिटिव इंडेक्स बनाने के लिए।