截詞檢索的通配符代表一個(gè)字符?
在截詞檢索技術(shù)中,較常用的是后截詞和中截詞兩種方法。如果按所截?cái)嗟淖址麛?shù)目來(lái)分,有無(wú)限截詞和有限截詞兩種。截詞算符在不同的系統(tǒng)中有不同的表達(dá)形式,需要說(shuō)明的是并不是所有的搜索引擎都支持這種技術(shù)。
截詞檢索就是用截?cái)嗟脑~的一個(gè)局部進(jìn)行的檢索,并認(rèn)為凡滿足這個(gè)詞局部中的所有字符(串)的文獻(xiàn),都為命中的文獻(xiàn)。按截?cái)嗟奈恢脕?lái)分,截詞可有后截?cái)唷⑶敖財(cái)唷⒅薪財(cái)嗳N類型。不同的系統(tǒng)所用的截詞符也不同,常用的有?、$、*等。分為有限截詞(即一個(gè)截詞符只代表一個(gè)字符)和無(wú)限截詞(一個(gè)截詞符可代表多個(gè)字符)。下面以無(wú)限截詞舉例說(shuō)明:(1)后截?cái)啵胺揭恢隆H纾篶omput?表示computer,computers,computing等。(2)前截?cái)啵蠓揭恢隆H纾海縞omputer表示minicomputer,microcomputers等。(3)中截?cái)啵虚g一致。如?comput?表示minicomputer,microcomputers等。截詞檢索也是一種常用的檢索技術(shù),是防止漏檢的有效工具,尤其在西文檢索中,更是廣泛應(yīng)用。截?cái)嗉夹g(shù)可以作為擴(kuò)大檢索范圍的手段,具有方便用戶、增強(qiáng)檢索效果的特點(diǎn),但一定要合理使用,否則會(huì)造成誤檢。 是指檢索結(jié)果中單詞的前面幾個(gè)字符要與關(guān)鍵字中截詞符前面的字符相一致的檢索。具體包括:(1)有限后截詞 主要用于詞的單、復(fù)數(shù),動(dòng)詞的詞尾變化等。如books可用book?代表,其中截詞符?(也稱為通配符)可以用來(lái)代替0個(gè)或1個(gè)字符,因此,book?可檢索出包含有book或books詞的記錄;acid??可檢索出含有acid,acidic 和acids的記錄。(2)無(wú)限后截詞 主要用于同根詞。如solubilit用solub?處理,可檢索出含有solubilize,solubilization,soluble等同根詞的記錄。由此可知,在詞根后加一個(gè)?,表示無(wú)限截詞符號(hào)。 中截詞也稱屏蔽詞。一般來(lái)說(shuō),中截詞僅允許有限截詞,主要用于英、美拼寫不同的詞和單復(fù)數(shù)拼寫不同的詞。如organi?ation可檢索出含有organisation和organization的記錄。由此可知,中截詞使用的符號(hào)為?,即用?代替那個(gè)不同拼寫的字符。從以上各例可知,使用截詞檢索具有隱含的布爾邏輯或(OR)運(yùn)算的功能,可簡(jiǎn)化檢索過(guò)程。