Boolský model – aplikace
Př. Oracle SQL – Text RetrievalSELECT FROM WHERE CONTAINS Textový výraz může být ve tvaru:– výrazy bez použití tezauru
„text“ | Obyčejný term |
„text“* | Zprava rozšířený term |
*„text“ | Zleva rozšířený term |
*“text“* | Oboustranně rozšířený term |
„t?xt“ | Term s libovolným znakem místo „?“ |
„t%xt“ | Term s libovolným podřetězcem místo „%“ |
„text1“(m,n)“text2“ | Text1 může být o m slov za text2 nebo, text2 o n slov za text1 |
Boolský model:P vs. R– upřesňováním dotazu v Boolském modelu získáváme větší P, ale menší RPř. pokus (Blair, Maron 1985) – 40 000 právnických textů o dopravních nehodách, Cíl: nejen vysoké P ale i R., Výsledky: P=80%, R=20% – málo!!! (teoreticky 100%), Problém synonym – obecný jazyk, nelze zachytit tezaurem (Př. nehoda, neštěstí, srážka, karambol,…)- automatická indexace neodstraní tyto problémy