יחידת האינדוקס והחיפוש הבסיסית הינה התמנית, ויחסי המרחק השונים הינם בין תמניות שונות. אם זאת, במידה והמכריע המורפולוגי קבע כי התמנית מורכבת ממספר יחידות, ניתן לחפש גם על יחידות אלו.
הרכב התמנית:
כל תמנית מכילה (בין היתר) את המאפיינים הבאים:
|
word |
התמנית עצמה |
|
prefix |
תחילית - רצף אותיות משהוכל"ב המשמשות כמילות קישור הפותחות את התמנית |
|
base |
יחידת המילה עצמה, ללא תחיליות או סופיות |
|
suffix |
סיומת (לדוגמה סיומת קניין) |
|
lemma |
צורת הבסיס (הכניסה המילונית) של יחידת הבסיס |
שים לב: המאפיינים pos, gender, number, construct, tense, person מתייחסים לצורת ה-base.
נתבונן בדוגמאות הבאות:
וכשילדיהן
|
word |
וכשילדיהן |
|
prefix |
וכש |
|
base |
ילדי |
|
suffix |
הן |
|
lemma |
ילד |
|
pos |
noun |
שעונו (במשמעות "השעון שלו")
|
word |
שעונו |
|
prefix |
_ |
|
base |
שעון |
|
suffix |
ו |
|
lemma |
שעון |
|
pos |
noun |
וללכת
|
word |
וללכת |
|
prefix |
ו |
|
base |
ללכת |
|
suffix |
_ |
|
lemma |
הלך |
|
pos |
verb |
חלומי (כתואר)
|
word |
חלומי |
|
prefix |
_ |
|
base |
חלומי |
|
suffix |
_ |
|
lemma |
חלומי |
|
pos |
adjective |
חלומי (כשם עצם)
|
word |
חלומי |
|
prefix |
_ |
|
base |
חלום |
|
suffix |
י |
|
lemma |
חלום |
|
pos |
noun |