יחידת האינדוקס והחיפוש הבסיסית הינה התמנית, ויחסי המרחק השונים הינם בין תמניות שונות. אם זאת, במידה והמכריע המורפולוגי קבע כי התמנית מורכבת ממספר יחידות, ניתן לחפש גם על יחידות אלו.

 

הרכב התמנית:

 

כל תמנית מכילה (בין היתר) את המאפיינים הבאים:

 

word

התמנית עצמה

prefix

תחילית - רצף אותיות משהוכל"ב המשמשות כמילות קישור הפותחות את התמנית

base

יחידת המילה עצמה, ללא תחיליות או סופיות

suffix

סיומת (לדוגמה סיומת קניין)

lemma

צורת הבסיס (הכניסה המילונית) של יחידת הבסיס

 

שים לב: המאפיינים pos, gender, number, construct, tense, person מתייחסים לצורת ה-base.

 

נתבונן בדוגמאות הבאות:

 

וכשילדיהן

word

וכשילדיהן

prefix

וכש

base

ילדי

suffix

הן

lemma

ילד

pos

noun

 

שעונו (במשמעות "השעון שלו")

word

שעונו

prefix

_

base

שעון

suffix

ו

lemma

שעון

pos

noun

 

וללכת

word

וללכת

prefix

ו

base

ללכת

suffix

_

lemma

הלך

pos

verb

 


 

 

חלומי (כתואר)

word

חלומי

prefix

_

base

חלומי

suffix

_

lemma

חלומי

pos

adjective

 

חלומי (כשם עצם)

word

חלומי

prefix

_

base

חלום

suffix

י

lemma

חלום

pos

noun