跳到主要內容

國立公共資訊圖書館

Menu

讀者服務

本館出版品

訊需求者選擇接續詞彙來源之研究

文:陳佳君(國立臺中圖書館)

【摘要】

  本文旨在探討接續檢索詞彙之演變情形。研究共蒐集有效檢索者37人進行40次檢索,產生411個檢索詞彙及371個接續檢索詞彙。分析發現,各詞彙來源與接續詞彙來源間之關係並非各自獨立,而是相互影響的,尤其是前後兩詞彙傾向選用同一來源;若前後為不同詞彙來源時,則檢索互動來源為接續詞彙之主要來源。本研究冀望藉由研究實際檢索過程,了解接續詞彙的演變情形,以增進資訊檢索系統對檢索者認知決策過程的了解,進而作為設計檢索中介系統之參考。

【Abstract】

  This paper concentrates on the sources of search terms. 37 samples involved in the study, and there are 411 search terms in 40 searches. Sequences of selected search terms were analyzed, and the results indicated that there is some regularity in the transition. This paper found that the succeeding source attended to come from the preceding source. When we consider different source to different source relationships in their own, user interaction is high likely the source of search terms.

關鍵詞:檢索詞彙來源、檢索詞彙、檢索策略、資訊檢索

Keywords:Sources of Search Terms;Search Terms;Search Strategy;Information Retrieval

壹、問題陳述

  在一個逐漸走入資訊化的社會中,隨著電腦網路的普及,具備使用電腦的基本常識似乎已成為不可或缺的生存條件。正因為人與資訊系統的接觸漸趨頻繁,而使具有親和力的資訊檢索系統往往可以很快地獲得使用者的青睞,因此資訊檢索系統設計的良窳便成為檢索者是否使用此系統的關鍵要素。廣義地說,所謂的「資訊檢索系統」是一個介於資訊使用者與資訊總體之間的一種設施。(註1)換言之,資訊檢索系統應該是一種中介體,它可以幫助資訊需求者獲取他所需要的資訊,並滿足需求。問題是,在眾多龐大而複雜的資訊檢索系統中,究竟它應如何協助資訊需求者找尋真正的需要呢?這是一個令人好奇的問題。

  我們都知道語言是人類溝通的主要媒介,但有趣的是人與圖書館各項資訊系統間的互動關係,卻幾乎都是建立在以文字為溝通橋樑的基礎上。事實上,任何資訊檢索系統存在的目的都希望擷取資訊需求者真正所需要的資訊,同時過濾、篩選對需求者無用的資訊。這是我們對資訊檢索系統最高的期望與理想。這個理想的過程應該是,當各種原始資料經過選擇、徵集與概念分析之後,可以經過特定的詞彙轉換,將原始文獻的主、客體濃縮精簡為單筆的書目記錄。這些經過使用者或檢索系統轉譯的詞彙便代表該篇文獻的主要內容。相對地,資訊需求者提出檢索問題後,也同樣經過概念分析與詞彙轉換的程序,才能找到他所需要的資訊。資訊使用者與資訊檢索系統間便藉由這種相似但逆向的轉換過程,並以相同的概念詞彙來達到擷取與過濾資訊的目的。因此,詞彙可以說是資訊使用者與各種資訊處理系統間最重要的溝通媒介。

  一般而言,如果檢索者可以將問題以正確且適當的詞彙表達出來,而系統也可以對應(match)相同概念的詞彙,則檢索者對檢索結果的滿意度應該是百分之百。也就是說,理想的檢索過程應該是一個「直接且精準的處理過程」(one-shot process),且以極為準確無誤的方式處理「提出問題→選擇檢索詞彙→進行檢索→提供答案」等程序。(註2)然而事實卻非如此,我們常看到檢索者因無法確切了解自己的需要,而找不到適當的詞彙來表達自身的資訊需求;另一方面,資訊系統對檢索者選擇詞彙的決策行為又不甚了解,以致檢索者所使用的檢索詞彙常與系統使用之索引詞彙不同,如此的誤差便導致查詢結果令人不滿意。

  自從Cleverdon在其Cranfield I系統評估計畫中開始比較四種索引語言以了解自然語彙與控制語彙之檢索效益後(註3),資訊檢索專家一直致力於改進人為的索引詞彙,希望能避免因使用自然語言而導致檢索詞彙的歧義與含混等問題。長久以來,這方面的成就斐然可觀,例如自動索引法、自然語言的處理等。然而,上述改進系統檢索語言的研究卻無法看出檢索者選擇詞彙的決策過程。直至近年,部分學者才開始嘗試探討檢索者的詞彙選擇行為,例如Fidel、Saracevic及Spink等。上述學者的研究或多或少指出有關檢索詞彙研究的概廓,但似乎在質與量上都無法充份滿足我們想了解檢索者選擇詞彙之決策過程的需求,因此本研究嘗試以實證的方式,探討檢索詞彙之演變過程。

貳、文獻探討

一、檢索詞彙研究的方向與成就

  了解檢索互動過程一直是資訊檢索專家急切探索的問題,而互動過程所使用的主要媒介-檢索詞彙,更是分析檢索過程、改善檢索效益的經典課題。一般而言,檢索詞彙的研究可分為兩個主要的方向:一是依照一定程序求得答案稱之為演算研究途徑(algorithmic approach),另一個方向則是以人的行為為主要研究議題為途徑(human approach)來探索檢索詞彙。演算途徑之研究方式通常會使用出現於問題或文獻中的文字作為開始查詢之詞彙,繼而利用語意網路或詞彙加權等方式產生另一組檢索詞彙。其研究方式著重於明確地表達或測試任何有助於機器選擇詞彙之技術。其次,就研究方法而言,演算途徑之研究方式大量利用數學、邏輯學、和統計學等學科作為研究工具。反之,以人類行為為主的研究方式則是利用認知科學、心理學、語言學、和社會學等學科知識,以了解資訊需求者的檢索行為。因此,人性化的研究方式允許資訊需求者以任何工具和經驗獲取或修正檢索詞彙,強調觀察檢索者之決策過程、檢索行為和任何可能發生於詞彙選擇過程中之變數。(註4)這兩大研究途徑因少有重複之處,故而可相互彌補彼此之不足。因此,這兩種研究途徑必須齊頭並行,才能有助於資訊系統的改革與設計。(註5)

  針對檢索技術之演進,N. J. Belkin將檢索技術分類如下圖所示:(註6)

圖2-1 檢索技術分類表

檢索技術分類表

資料來源:Nicholas J. Belkin and W. Bruce Croft, "Retrieval Techniques," Annual Review of Information Science and Technology Vol.22(1987): 112.

  由上圖可看出早期之檢索技術要求檢索者必須輸入與系統完全相同的詞彙。但後來便逐漸發展出一些檢索功能而大大地增加檢索者選用詞彙的彈性,如切截檢索、布林邏輯等。不過Belkin認為這些檢索技術最大的問題在於其研究基礎立基於操作性的實驗環境,而無法跳脫操控的限制。(註7)因此,無法指引檢索者在何種情況下應該使用哪些檢索技巧進行查詢。

  基本上,檢索互動過程之檢索詞彙研究,較早已眾所週知之索引詞彙評估晚了數十年;後者以Cleverdon所進行之Cranfield第一期、第二期為典型代表。職是之故,或許我們可以說檢索詞彙的研究肇始於資訊檢索系統的評估,(註8)而評估的重點在提升系統功能,並強調各種檢索技術的應用,以期提高檢索效益。繼Cleverdon之後,許多資訊檢索專家不遺餘力地投入檢索詞彙的研究,包括控制詞彙與自然語言的比較、詞彙加權、自動索引與自然語言的處理等等。近來,開始出現以使用者行為為導向的研究,這類調查傾向利用真實存在的大型資料庫進行實際研究,而非經由小型或實驗性之檢索系統進行實驗,因此較之以往的研究更具代表性。

二、檢索詞彙之相關研究

  Saracevic認為無論就整個檢索階段或檢索者與資訊系統、檢索中介者之間的互動而言,選擇專業詞彙都是主要的過程,也是推動整個檢索過程的主要動力。(註9)了解檢索過程一直是資訊系統專家亟欲探索的問題。然而,是否真的可能存在一個典型的檢索過程呢?Saracevic等人曾提出,如果存在所謂「典型之檢索過程」(typical search),則此過程應包含15個指令、3個檢索循環、10個檢索詞彙、13分鐘的準備時間與14分鐘的檢索進行時間。(註10)換言之,在這整個過程中,所有涉入的因素都是我們想了解的對象。

  一個有意義的檢索過程至少可能涉及檢索者、資訊系統及檢索中介者等三要素。對於詞彙的決定,這三要素其實都有決定性的影響,也各有其職司。基本上,資訊需求者是產生檢索詞彙之主要來源,同時也是評估檢索概念、檢索詞彙與檢索結果是否一致之評鑑者。但這並非意謂資訊需求者必須獨立完成檢索過程中與選擇檢索詞彙有關的一切活動。因為檢索中介者必須適時判斷某一詞彙是否適用,同時將資訊需求者所提供的原始關鍵字轉譯為系統所使用的控制詞彙。另一方面,系統索引典所列舉的控制詞彙也提供資訊需求者與檢索中介者選擇檢索詞彙之參考。因此在中介檢索中,資訊需求者可說是潛在檢索詞彙的主要來源,而檢索中介者則是決定是否使用此一詞彙的判斷者。(註11)

  既然檢索中介者扮演了決定詞彙的角色,其檢索行為便成為研究人員另一個探討的方向。Fidel曾探討專業檢索者選擇詞彙之決策過程。結果發現,當檢索者滿意索引典(索引檔)品質時或其可獲性較高時,檢索者傾向使用系統提供之控制詞彙,而索引典品質與可獲性等與資料庫相關之特性就是影響檢索者是否選用敘述語(descriptors)檢索的最重要因素。此外,專業檢索者使用文內字(textwords)及敘述語的比例差異不大,各約為44%及56%。(註12)其中概念型之檢索者多半會選用敘述語作為其檢索詞彙,而操作型檢索者則傾向同時使用敘述語與文內字兩種檢索詞彙。(註13)Spink的一項研究則發現檢索中介者較擅長利用詞彙相關回饋技術,且其詞彙多半來自題名與敘述語欄位(term relvance feedback)。(註14)

  除此之外,Fidel從認知觀點解釋選擇檢索詞彙之決策過程。她認為此決策過程包括檢索者必須把問題分析為單一的檢索概念,而每一個概念需藉由一組詞彙表達,其次檢索者必須找出獲得檢索概念之最佳詞彙。在此過程中,檢索者需執行的重要決策之一就是選擇檢索詞彙的形態(文內字或敘述語),同時必須分辨問題敘述中的詞彙是否是一個「好」的自然語言檢索詞彙?而該詞彙能否對應(mapped)系統之控制詞彙?(註15)Fidel亦認為為使中介專家系統能協助檢索者選擇檢索詞彙,因此有必要建立中介專家系統之專業詞彙知識結構,包括了解每一個詞彙之使用頻率與使用策略等。(註16)

  除了從檢索互動過程了解檢索詞彙外,研究出現於資訊需求者問題敘述的詞彙也有助於我們了解檢索詞彙的選擇行為。例如,有學者利用問題敘述(query)中所出現的詞彙,或利用檢索所得之相關文獻找出其他檢索詞彙再行檢索。因為從問題敘述所獲得的關鍵字,可以再利用系統索引詞彙找出檢索者可能使用的詞彙。(註17)也有學者利用統計、或然率等技術為每一個檢索詞彙給一個加權值,以增加相關文獻被檢索出來的機會。(註18)儘管專家學者企圖以對選用詞彙的加工來改進檢索效益,但Saracevic和Kantor等人卻發現各檢索者對同一問題選用相同詞彙的比例極低,只有27%;而不同檢索者查獲文獻之重複率更低,僅有17%。因此不同檢索者選用詞彙的差異性很大,而17%之低重複率則透露不同檢索者常以不同的方式解讀同一檢索問題,因此導致檢索結果的差異更大。(註19)

  如從認知模式探究檢索詞彙的選擇行為時,詞彙間的語意關係應可預測檢索者可能使用的檢索詞彙。Palmquist和Balakrishnan曾以詞彙聯想(word association)觀點,並參考Belkin之知識異常模式(Anomalous States of Knowledge,ASK),探討詞彙使用的問題,並說明在無法確定資訊需求情況下,以字彙表達檢索問題所可能產生的影響。(註20)另外,Ferber等人則以聯想語意網(associative lexical net)協助檢索者選擇檢索詞彙。Ferber認為以自然語言描述問題可以幫助檢索者產生詞彙並將問題的概念具體化,同時經過檢索者內在檢視(internal examination)後,再輔以系統透過檢索互動所回饋之詞彙,便可經由聯想語意網模擬檢索詞彙的選擇過程。(註21)如果我們再深入探索不同檢索者對同一問題所選用的詞彙是否接近時,會發現其比例極低,且檢索結果的差異性也極大。(註22)相反地,增加檢索詞彙的結果,常會導致花費更多的檢索成本。當然各檢索詞彙所具有的檢索意義並不相同,因此檢索系統應可利用相關回饋等方式,促使檢索者能具體了解最有效與最無效的檢索詞彙。(註23)

  Iivonen也曾做過類似的研究。結果發現,在選用檢索詞彙方面,檢索者本身(intrasearcher)的一致性(53.6%)大於各檢索者間(intersearcher)的一致性(31.2%)。而同一檢索者選擇同一檢索概念之一致性(92.7%)亦大於各檢索者對檢索概念選擇的一致性(87.6%)。(註24)意即同一檢索者對檢索詞彙及檢索概念的選擇一致性均高於各檢索者間之一致性。值得注意的是,檢索者選擇檢索詞彙的一致性(53.6%,31.2%)遠低於選擇檢索概念的一致性(92.7%,87.6%),顯示檢索者分析問題時可能會忽略某些檢索主題間的些微差異,而未深入分析這些差異,但上述些微的差別卻會表現在檢索詞彙的選擇上。此項調查結果顯然極值得吾等重視,因為檢索者和資訊系統間幾乎都是透過檢索詞彙進行互動溝通的,倘若檢索者之檢索概念陳述與詞彙的選擇存在著如此大的差異,則資訊系統便應負起彌補此落差的責任。

  如果我們可以得知檢索者所使用的詞彙來源,便能從這些來源中找出檢索行為的特性。Walker曾提出索引典與系統控制詞彙為最重要的詞彙來源,而以自然語言呈現之書面問題陳述雖是檢索詞彙之主要來源,但通常重要的檢索詞彙如新詞、日常口語(colloquialism)、或是頭字語(acronym)並不會出現在問題陳述或索引典中。(註25)Spink的一項研究則發現檢索者本身所產生的詞彙(即問題陳述與檢索者互動來源之詞彙總合)佔所有檢索詞彙之61%。(註26)其中,又以問題陳述來源之詞彙居多(38%)。至於,非源自檢索者之詞彙比例依次為索引典、詞彙相關回饋、和檢索中介者。(註27)Spink同時發現詞彙來源之選擇並非隨機發生的,各來源間呈現一個動態的詞彙選擇過程,尤其是前後相同來源的詞彙。(註28)

  上述從檢索互動過程、問題的陳述或選用詞彙一致性到詞彙的語意關係、詞彙來源的選用,一一說明了以現今檢索詞彙的研究似乎無法尋得詞彙選擇行為的常規。另外,除了上述研究發現外,相關回饋技術也曾在1960年代廣泛地應用於檢索詞彙的研究;其次,也有學者利用超文技術設計選擇詞彙之檢索介面,稱為BRAQUE(BRowsing And QUEry formulation)計畫。該計畫雖屬實驗性,且僅止於測試階段,但其研究方向卻值得鼓勵。(註29)此外,Blair認為資訊需求者想要檢索出相關文獻,尚必須受到字序(term-ordering)的限制。因為即使資訊需求者提出與索引詞彙相同之關鍵字,但假如這些詞彙屬於邊緣概念之詞彙,最後即使這些詞彙是檢索者提出之關鍵詞彙,其本身亦為索引詞彙,卻可能因資訊需求與索引者對其重要性之認定不同而被資訊需求者捨棄。(註30)換句話說,找出與索引詞彙相同的檢索詞彙並不保證可以查獲某篇相關的文章,尚且需要索引者和資訊需求者對代表該篇文獻概念之關鍵詞彙在字序具有相近的認知。

  綜合言之,檢索詞彙的選擇是一種認知決策過程,努力使此過程更清晰地呈現,將使資訊檢索系統更臻人性化。此外,從研究主題之演變亦可清楚看出資訊檢索之研究方向已逐漸朝向以使用者為重心。早期對索引詞彙之研究與利用相關回饋技術、機率理論、與向量空間等理論所獲得之研究成果,造就了今日所使用之檢索中介系統。冀望今後能有更多探討使用者決策過程與檢索行為之研究,俾以作為未來設計合乎人類認知活動之檢索資訊系統之依據。

參、研究設計與實驗進行

  本研究的主要目的在了解光碟資料庫檢索者接續詞彙來源之演變,因此採用實證研究法,包括利用問卷法、觀察法、與訪問法搜集資料,並以便利性抽樣法(convenience sampling)選取本身具有資訊需求之台大在學大學部、研究所碩、博士班學生。研究地點則配合研究對象的正規活動及行為,因此選定台大心理學系圖書室為實驗地點。另外,也因該圖書室在性質上屬於專門圖書館,使用者的學科背景相似且同質性高,較易看出其檢索行為的特性與傾向。

  心理系圖書室之單機版光碟資料庫包括PsycLIT光碟資料庫期刊類兩片、圖書及會議論文一片(1987年1月至1995年9月)、CLINPSYC(1980年1月至1993年6月)、Psyndex(1977年至1992年3月)等五片,由於此三種光碟資料庫使用相同的檢索語言,同時為顧及行文方便,故將其統稱為PsycLIT光碟資料庫。

  至於研究進行的步驟則分別說明如下:

一、確定檢索詞彙來源之類別

  資訊檢索系統所使用的語言可分為自然語言、人工語言與指令語言等三種(註31),這三種語言可能交互出現於檢索互動過程中,因此,詞彙來源的選擇也就顯得更為複雜。Spink依據檢索過程所出現的互動現象,將檢索詞彙來源分為五類,包括書面問題陳述、互動過程中源自使用者之詞彙、檢索中介者所提供之詞彙、系統索引典提供的詞彙、與瀏覽檢出文獻後所產生的詞彙。(註32)由於本研究實際進行觀察時發現許多詞彙來自系統索引檔,故將原擬定之五類來源增加系統索引檔來源。經整理原始資料後發現,實際使用索引典來源之檢索者僅有一位,且詞彙數只有4個,為求統計分析上之意義,故將索引典來源歸併於索引檔來源中。此兩類來源之所以歸併,其原因乃在於索引典詞彙與索引檔詞彙均是系統提供檢索者選用檢索詞彙時之清單,兩者雖有自然語言與控制語言上的差異,但基本上其功能與呈現方式接近,都是經過整理並依序排列之詞彙來源,故本研究將所出現之4個索引典來源詞彙歸入系統索引檔來源應屬合理。另一方面,索引典與索引檔之重要功能在於兩者皆是系統於檢索過程中提供檢索者選用詞彙之參考來源,故應可歸為同類詞彙來源。以下即分別說明此五類詞彙來源之意義。

 (一)書面問題陳述來源:此項詞彙來源意指研究對象進行檢索前必須填寫書面問題陳述,當研究對象所使用的詞彙曾出現於該書面問題陳述時,則此詞彙的來源為「書面問題陳述來源」。

 (二)檢索互動來源:檢索過程中,選用之檢索詞彙乃源自檢索者與研究者或檢索系統間之互動,最後仍由檢索者自行產生詞彙之來源稱為「檢索互動來源」。

 (三)研究者提供之詞彙來源:進行檢索前或檢索過程中,由研究者建議並經檢索者採用之詞彙,其來源即為「研究者提供之詞彙來源」。

 (四)瀏覽檢出文獻之詞彙來源:研究對象在檢索過程中,因瀏覽檢出文獻而獲得之檢索詞彙,其來源即屬「瀏覽檢出文獻之詞彙來源」。

 (五)系統索引檔來源:研究對象利用系統索引檔或索引典顯示詞彙,並從中選取詞彙進行查詢,此詞彙來源即為「系統索引檔來源」。

二、檢索進行前之說明與填寫檢索問題表

  當研究對象同意參與研究後,隨即填寫一份檢索問題表。一次檢索可以同時查詢多個問題,毋須退出系統重新進入,但必須將各檢索問題明確陳述。同時,研究對象被告知不可選錄(mark)單篇資料轉錄,意即研究對象決定轉錄某篇書目時,必須將該詞彙查獲之所有檢索結果全數轉錄。此外,由於檢索結束後需做文獻內容與檢索問題間之相關程度判斷,故一次轉錄(download)的篇數以不超過50篇為原則。但研究對象如堅持轉錄檢索結果超過五十篇之檢索組,則仍尊重研究對象之決定。檢索進行時,亦不得與他人(除研究者之外)討論有關任何檢索詞彙或策略,但可以翻閱工具書(如字典)或查閱教科書。此外,檢索過程中可以詢問研究者任何有關檢索詞彙與策略上的問題。

三、進行檢索

  研究對象必須親自進行檢索,而研究者採用無結構之參與式觀察法,其優點在於研究者可有較多涉入檢索情境的研究空間。因此,研究者依研究目的將所觀察之有關檢索互動的各種現象與行為一一記錄下來。記錄的重點以該檢索詞彙之來源為主,是為日後來源歸類之主要依據之一。同時,對於瀏覽檢出文獻來源之詞彙,均須經過研究對象的確認。至於檢索過程與檢索結果的取得則利用系統之轉錄功能獲得。由於受限於研究工具與設備,如果檢索過程中發生當機時,則以下述原則處理:研究對象瀏覽檢出文獻時發生當機,若可確定當機前的檢索過程與結果均已轉錄,或當機情況發生於系統執行查詢時,而當時電腦螢幕之檢索過程與結果亦可依序記錄,則上述兩種情況視為有效研究對象。但對於當機後無法取得完整之檢索詞彙者,即視為無效之檢索樣本。最後以研究對象進行檢索時之認知進行相關判斷。

肆、資料整理與分析

  本研究之目的在了解檢索過程中有關選擇詞彙來源之各種變化,因此不同之檢索策略均視為檢索互動行為,故檢索詞彙的整理原則包含各種檢索策略的應用。此外,判斷檢索詞彙來源之標準以該詞彙第一次出現之來源為依據。資料編碼與分析則取自研究對象之書面問題陳述、光碟檢索過程記錄、及研究者實際觀察之記錄。最後由研究對象根據檢索時之認知狀態,判斷各檢出文獻之相關程度。

  至於資料分析與編碼的過程則是,首先列印各次檢索之檢索過程,其次,剔除該檢索過程中被重複使用之詞彙與檢索結果,同時刪除因錯誤行為而產生的檢索詞彙與查詢結果,最後得一依序呈現之檢索詞彙清單。根據此檢索詞彙清單便可進行詞彙來源的歸類。首先將該檢索詞彙清單核對書面問題陳述,如果檢索清單上的詞彙同時出現於書面問題陳述,則其來源即為書面問題陳述;其餘檢索詞彙再根據觀察紀錄區分詞彙來源;由於先前已剔除重複詞彙與檢索結果,故觀察紀錄中所記載之詞彙來源即為該詞彙之真正來源。現將有關檢索詞彙之界定與來源歸類之原則敘述如后:

一、詞彙整理原則

 (一)布林邏輯運算檢索:當檢索者結合兩個以上詞彙進行布林邏輯檢索時,其有效檢索詞彙為檢索者所輸入之完整檢索敘述。例如查詢「AandB」時,系統螢幕會同時出現A與B各自查獲的筆數,如果研究對象未轉錄A或B,而A、B只是顯示檢索結果的必然過程,原則上有效詞彙為檢索運算後的結果(即AandB)。但如果研究對象轉錄A或B其中一筆,則A、B、AandB視為三個有效的檢索詞彙。

 (二)其他檢索:對於詞類變化、切截檢索、縮寫字、複合字均視為有效之檢索詞彙。由於PsycLIT光碟資料庫之期刊類共有兩片,因此對於更換不同收錄年限之光碟片後再以同一詞彙進行查詢之檢索行為均視為同時查詢,故有效詞彙僅有一個,後者之檢索篇數則累加至前次之檢索結果。

二、詞彙來源歸類原則

  檢索詞彙來源的歸類以該詞彙第一次出現時之來源為依據,除研究設計之歸類方法外,若限定欄位檢索之詞彙乃由研究者建議並經檢索者採用,則該詞彙之來源歸為研究者提供之詞彙來源。若檢索者說出主題概念而由研究者提供檢索詞彙,或瀏覽檢出文獻時由研究者建議使用檢出文獻中之詞彙,則此類詞彙之來源均歸為研究者提供之詞彙來源。

  有些出現於書面問題陳述之單一概念詞彙,於進行檢索之初便以布林邏輯運算出現,由於可以判定該研究對象並未與系統產生任何互動行為,故該詞彙的來源是書面問題陳述。若該詞彙雖為該次檢索之第一個詞彙,但先前曾出現被視為無效之檢索詞彙,則因可辨別此詞彙乃是經過檢索互動而產生的,故列為檢索互動來源。

三、資料分析

  資料搜集完整後,利用視窗版「社會科學統計套裝軟體」中對數u性模式(log-linear model)之獨立模式(independence model)和準獨立模式(quasi-independence model)分析檢索詞彙來源之演變。

伍、結果分析

一、接續詞彙來源之數量分析

  所謂接續詞彙乃是指某一個詞彙之下一個檢索詞彙,其與前一個詞彙存在著次序上的關係。此外,由於每次檢索之最後一個字並無所謂之下一個詞彙,故本研究所得之411個檢索詞彙必須扣除各次檢索之最後一個詞彙,因而接續詞彙來源便僅剩371個(即411-40=371)。而此40個尾字在資料處理時均被視為無效值(missing value)。

  從表1可看出,各接續詞彙所使用的來源以檢索互動來源為主,有效百分比為56.3%。比例次之的是書面問題陳述來源,共計出現82字,有效百分比為22.1%。而接續詞彙來源中字數最少的是瀏覽檢出文獻來源,僅有17個,有效百分比為4.6%。整體而言,詞彙來源最多的檢索互動來源,其接續詞彙來源也同樣最多,顯示檢索者較常使用檢索互動來源詞彙,同時不管該詞彙來源是什麼,其接續詞彙較常來自檢索互動來源。此外,書面問題陳述來源為首字的機會大於其他來源之詞彙;因為各次檢索之首字必然不會成為其他詞彙之接續詞彙,因此計算接續詞彙之數量時便驟少許多。相反地,瀏覽檢出文獻來源原有17個,而為其他詞彙之接續詞彙時仍維持17個,顯示瀏覽檢出文獻來源之詞彙並未發生於檢索首字與尾字(因為尾字為無效值,不被列入分析)。

表1 接續詞彙來源之數量分析表

接續詞彙來源 字數 百分比 累計百分比
書面問題陳述來源 82 22.1 22.1
檢索互動來源 209 56.3 78.4
研究者提供之詞彙來源 32 8.6 87.1
瀏覽檢出文獻來源 17 4.6 91.6
系統索引檔來源 31 8.4 100.0
總計 371 100.0 100.0

二、接續詞彙來源之比例分析

  表2為各種接續詞彙來源之比例分析,各接續來源已按照比例高低排序。首先,表中顯示連續使用同一來源之比例偏高,但比例上卻有差別,如檢索互動來源之後繼續選用檢索互動來源之比例達65.2%,而系統索引檔來源更高達75.8%。其餘相同來源之演變(即書面問題陳述來源→書面問題陳述來源,研究者提供之詞彙來源→研究者提供之詞彙來源),亦出現次高比例值。惟瀏覽檢出文獻來源→瀏覽檢出文獻來源的比例偏低,僅12.5%,顯示詞彙來源為瀏覽檢出文獻來源時,其下個詞彙來源又是瀏覽檢出文獻來源的比例遠低於其餘四種相同來源被接續使用之比例。

表2 接續詞彙來源之比例分析表

詞彙來源 接續詞彙來源 字數 百分比
書面問題陳述來源 檢索互動來源 58 51.8%
書面問題陳述來源 44 39.3%
研究者提供之來源 6 5.4%
瀏覽檢出文獻來源 3 2.7%
系統索引檔來源 1 0.9%
檢索互動來源 檢索互動來源 120 65.2%
書面問題陳述來源 31 16.8%
研究者提供之來源 17 9.2%
瀏覽檢出文獻來源 11 6.0%
系統索引檔來源 5 2.7%
研究者提供之來源 檢索互動來源 15 57.7%
研究者提供之來源 8 30.8%
書面問題陳述來源 2 7.7%
瀏覽檢出文獻來源 1 3.8%
系統索引檔來源 0 0%
瀏覽檢出文獻來源 檢索互動來源 11 68.8%
書面問題陳述來源 3 18.8%
瀏覽檢出文獻來源 2 12.5%
研究者提供之來源 0 0%
系統索引檔來源 0 0%
系統索引檔來源 系統索引檔來源 25 75.8%
檢索互動來源 5 15.2%
書面問題陳述來源 2 6.1%
研究者提供之來源 1 3%
瀏覽檢出文獻來源 0 0%

  表2亦顯示,各接續來源比例最高的是系統索引檔來源→系統索引檔來源,約佔七成六,即連續使用系統索引檔來源詞彙的機會比連續使用其餘四種相同來源之機會更高。除相同來源之演變外,表中亦可看出,扣除系統索引檔來源→系統索引檔來源後,其餘四種接續詞彙之來源均以檢索互動來源之比例最高,顯示檢索者使用一詞彙後傾向選用檢索互動來源詞彙。其次,前後詞彙使用相同來源之比例高低依序是系統索引檔來源、檢索互動來源、書面問題陳述來源、研究者提供之詞彙來源、與瀏覽檢出文獻來源,而Spink之研究結果發現前三者之順序為書面問題陳述來源、系統索引典(類似本研究之系統索引檔來源)、檢索互動來源,(註33)雖與本研究所得之來源順序有些微差異,但基本上卻是三個相似之詞彙來源,顯示書面問題陳述來源,檢索互動來源,和系統索引檔來源已是接續詞彙之主要來源,同時也說明檢索互動在整個檢索過程中所扮演關鍵性的角色。

三、檢索詞彙來源與接續詞彙來源之演變關係

  表3顯示詞彙來源與接續詞彙來源之矩陣次數關係。本研究嘗試利用對數-線性模式(log-linear model)中的獨立模式(independence model)和準獨立模式(quasi-independence model),以分析檢索詞彙來源的演變。

  由於詞彙來源分為五類,故詞彙來源與接續詞彙來源之演變關係便形成一個5?*5的矩陣表格。表中將各詞彙來源以簡稱標示,即書面問題陳述,檢索互動,研究者提供,瀏覽檢出文獻,與系統索引檔。各細格(cells)中由上而下呈現四個數字,最上面的值為實際觀察值,也就是各接續來源出現的字數,細格中第二個數值為期望字數,也就是理論上應該出現的字數,其算法如下所示:(註34)

運算式

  簡化即為

運算式

  細格中第三個數值稱為餘數(residuals)或殘差,為觀察值與期望值之差(即第一個數字減去第二個數字的差)。最後一個數值,也就是第四個數字稱為標準殘差(standardize residuals),其算法為將殘差值除以所有觀察值之標準誤(standard error)。(註35)例如,行列之第一個細格顯示使用書面問題陳述來源後接著使用書面問題陳述來源的詞彙數有44個,而其期望字數為(112?*82)/371=24.8,故殘差值為44-24.8=19.2,而該細格之標準殘差則為3.9。

  一般而言,標準殘差值若介於合理機率值1.96之間,則表示表中行、列兩自變數之關係是隨機的(random),也是獨立的(independent)。反之,若標準殘差大於1.96或小於-1.96,則表示此二自變數之間並非各自獨立,而是相互影響的。更進一步地說,當標準殘差值大於1.96時,表示兩自變數間具有正向關係,也就是促長關係(facilitating relation);反之,其值若小於-1.96,則顯示兩自變數將產生負向關係或稱非促長關係(non-facilitating ralation)。(註36)

表3 詞彙來源與接續詞彙來源之演變分析表

時間 時間(T+1)
(T) 書面問題陳述 檢索互動 研究者提供 瀏覽檢出文獻 系統索引檔 總計
書面問題陳述 44 58 6 3 1 112
24.8 63.1 9.7 5.1 9.4
19.2 -5.1 -3.7 -2.1 -8.4
3.9 -.6 -1.2 -.9 -2.7
檢索互動 31 120 17 11 5 184
40.7 103.7 15.9 8.4 15.4
-9.7 16.3 1.1 2.6 -10.4
-1.5 1.6 .3 .9 -2.6
研究者提供 2 15 8 1 0 26
5.7 14.6 2.2 1.2 2.2
-3.7 .4 5.8 -.2 -2.2
-1.6 .1 3.8 -.2 -1.5
瀏覽檢出文獻 3 11 0 2 0 16
3.5 9.0 1.4 .7 1.3
-.5 2.0 -1.4 1.3 -1.3
-.3 .7 -1.2 1.5 -1.2
系統索引檔 2 5 1 0 25 33
7.3 18.6 2.8 1.5 2.8
-5.3 -13.6 -1.8 -1.5 22.2
-2.0 -3.2 -1.1 -1.2 13.4
總計 82 209 32 17 31 371

  表3之皮爾森卡方值(Pearson chi-square)為258.618,可能性卡方比(likelihood ratio chi-square)為156.437,自由度df=16,上述兩項之發生機率均小於.001,達統計上之顯著水準,故拒絕行、列兩自變數獨立存在的假設。因此,檢索者選擇某一詞彙來源到下個詞彙來源之選擇並非隨機的,或可說時間T時之詞彙來源會影響時間T+1時之詞彙來源。換言之,一詞彙來源將明顯地具有某種程度之預測力,且能影響下一個詞彙來源之選擇,此研究結果與Spink之發現不謀而合。(註37)

  表3呈現25對詞彙來源與接續來源之組合配對,其中七組呈現顯著關係,在這七組中有三組大於1.96,四組小於-1.96,即28%之配對組合呈現顯著之相依關係。進一步地說,標準殘差值大於1.96之配對發生於書面問題陳述來源→書面問題陳述來源,研究者提供之詞彙來源→研究者提供之詞彙來源,系統索引檔來源→系統索引檔來源,顯示來源原是書面問題陳述來源、研究者提供之詞彙來源和系統索引檔來源之詞彙,其接續詞彙之來源仍以出現相同之詞彙來源為主;此外,即使檢索互動來源→檢索互動來源,瀏覽檢出文獻來源→瀏覽檢出文獻來源之標準殘差值未大於1.96,但其值卻顯然大於其他各細格內之標準殘差值,因此,各詞彙來源並非隨機出現的,尤其是相同詞彙來源間的演變。

  此外,表3亦顯示標準殘差值小於-1.96之細格有書面問題陳述來源→系統索引檔來源,檢索互動來源→系統索引檔來源,系統索引檔來源→書面問題陳述來源,系統索引檔來源→檢索互動來源,表示此四組中選用前項來源後較不可能接著使用後項詞彙來源。此結果與Spink之研究發現差異不大,均包括書面問題陳述來源→系統索引檔來源、系統索引檔來源→書面問題陳述來源兩組,至於檢索互動來源→系統索引檔來源及系統索引檔來源→檢索互動來源兩組之研究發現與Spink之研究結果不同,可能導因於取樣上的差異所產生的自然結果。(註38)

四、不同接續詞彙來源之演變關係

  由上表3得知某一詞彙來源若為S,則其下一個詞彙來源也傾向使用S來源,也就是檢索者傾向選用同一詞彙來源。然而,是否可能因為此種連續選用同一詞彙來源之檢索行為,才使前後詞彙來源之演變呈現相依關係?因此,仍有必要進一步探討不同接續詞彙來源之選擇是否也出現相互影響的現象?事實上,表4與表3是類似表格,惟表4之前、後相同來源細格內之數值(即斜對角線細格值)均已化為0(稱為結構化歸零,structural zeros)而被刪除。(註39)意即處理表3之細格資料時,對於前後相同來源之詞彙均不加以分析,如此便可獲得表4,此方式稱為準獨立模式(quasi-independence model)(註40),而表3之分析方法則稱為獨立模式(independence model)。(註41)

  由於表3之詞彙總數已扣除各次檢索之尾字,故詞彙總數為371字,而表4又因扣除前後相同來源之詞彙數目,故僅剩172字(371-44-120-8-2-25=172)。至於細格內各數值之結構則同表3,也就是第一個數值是實際觀察值,第二個數值是理論期望值,第三個數值是觀察值與期望值之差,最後一個數值為標準化之殘差值。

表4 不同詞彙來源之演變關係分析表

時間 時間(T+1)
(T) 書面問題陳述 檢索互動 研究者提供 瀏覽檢出文獻 系統索引檔 總計
書面問題陳述 58 6 3 1 68
35.2 9.5 5.9 2.4  
22.8 -3.5 -2.9 -1.4  
3.8 -1.1 -1.2 -.9  
檢索互動 31 17 11 5 184
14.1 8.9 5.6 2.2  
16.9 8.1 5.4 2.8  
4.5 2.7 2.3 1.9  
研究者提供 2 15 1 0 18
4.0 9.3 1.6 .6  
-2.0 5.7 -.6 -.6  
-1.0 1.9 -.5 -.8  
瀏覽檢出文獻 3 11 0 0 14
3.1 7.2 2.0 .5  
-.1 3.8 -2.0 -.5  
-.1 1.4 -1.4 -.7  
系統索引檔 2 5 1 0 8
1.8 4.1 1.1 .7  
.2 .9 -.1 -.7  
.2 .4 -.1 -.8  
總計 38 89 24 15 6 172

  表4顯示,書面問題陳述來源→檢索互動來源,檢索互動來源→書面問題陳述來源,檢索互動來源→研究者提供之詞彙來源,檢索互動來源→瀏覽檢出文獻來源之標準殘差值大於1.96,顯示上述各組之前項詞彙來源,其接續之詞彙來源較可能是後項詞彙來源。另一個值得留意的現象是,表4中並未出現標準殘差值小於-1.96的情況,顯示不同來源間的演變關係只可能是隨機的或是促長關係。前項研究結果與Spink之研究結論相同,即各細格之標準殘差值均未出現小於-1.96,(註42)但本研究卻發現四組大於1.96之細格,即書面問題陳述來源→檢索互動來源、檢索互動來源→問題陳述來源、檢索互動來源→研究者提供之詞彙來源、與檢索互動來源→瀏覽檢出文獻來源等四組。此結果不僅代表這四組不同詞彙來源間之變化關係是促長關係,同時顯示檢索互動來源與其餘四種詞彙來源間的演變關係更為複雜多變。

陸、結論

  本研究係以國立台灣大學PsycLIT光碟資料庫為研究工具,藉以探討資訊需求者檢索詞彙的演變關係。本研究利用問卷法、觀察法與訪問法進行資料搜集,共計進行有效檢索40次,產生411個檢索詞彙及371個接續檢索詞彙。玆將研究之分析結果歸納如下:

一、接續詞彙來源之數量分析

  本研究共計獲得371個接續詞彙,各種接續詞彙來源中以檢索互動來源之接續詞彙數量最多,共計209字,為全部接續詞彙之56%,其次為書面問題陳述來源。兩項接續詞彙來源之總數即佔全部檢索詞彙總數之78%,顯示檢索者傾向使用書面問題陳述來源與檢索互動來源。此外,由檢索詞彙來源與接續詞彙來源之關係得知,書面問題陳述來源較常為檢索之首字,而瀏覽檢出文獻來源之詞彙則從未發生於檢索之首字與尾字。由此可知,檢索者選用詞彙來源之行為應有一定的規律可尋,只是此種規律應有更多之實證研究證明其規則性。

二、接續詞彙來源之比例分析

  一般說來,檢索者使用某一詞彙來源之後會選用哪些詞彙來源?研究發現,連續使用同一種詞彙來源之比例偏高,其中又以系統索引檔來源與檢索互動來源最高;至於書面問題陳述來源與研究者提供之詞彙來源則次之。惟瀏覽檢出文獻來源→瀏覽檢出文獻來源的比例偏低,僅12.5%,顯示詞彙來源為瀏覽檢出文獻來源時,其下個詞彙來源又是瀏覽檢出文獻來源的比例遠低於其餘四種相同來源被接續使用之比例。若前後為不同詞彙來源之詞彙數量中除系統索引檔來源外,其餘四種接續詞彙之來源均以檢索互動來源之比例最高,顯示檢索者使用一詞彙來源後傾向選用檢索互動來源詞彙。

三、檢索詞彙來源與接續詞彙來源之演變關係

  研究分析結果顯示,檢索者由某一詞彙來源到下個詞彙來源之選擇並非隨機的,或可說時間T時之詞彙來源會影響時間T+1時之詞彙來源。進一步地說,如表5所示,原是書面問題陳述來源、研究者提供之詞彙來源和系統索引檔來源之詞彙,其接續詞彙之來源仍以出現相同之詞彙來源為主。但詞彙來源是書面問題陳述來源和檢索互動來源之詞彙,其下一個詞彙之來源較不可能是系統索引檔來源;是系統索引檔來源之詞彙,其接續詞彙之來源便較不可能是書面問題陳述來源和檢索互動來源。

表5 詞彙來源與接續詞彙來源之演變關係摘要表

時間 時間(T+1)
(T) 書面問題陳述 檢索互動 研究者提供 瀏覽檢出文獻 系統索引檔
書面問題陳述      
檢索互動      
研究者提供        
瀏覽檢出文獻        
系統索引檔    

▲:表示兩詞彙來源為促長關係
△:表示兩詞彙來源關係密切,但非促長關係
-:表示兩詞彙來源為非促長關係

四、不同接續詞彙來源之演變關係

  雖然由上述研究結果得知,某一詞彙來源若為S,則其下一個詞彙來源也傾向使用S來源。然而,有必要進一步探討不同接續詞彙來源之選擇是否也會相互影響。研究將前後相同來源之詞彙刪除,重新審視詞彙來源與接續詞彙來源之演變,結果如表6所示,使用書面問題陳述來源後較可能選用檢索互動來源,而檢索互動來源之後,其可能使用之來源依序是書面問題陳述來源,研究者提供之詞彙來源與瀏覽檢出文獻來源等。因此證明檢索詞彙來源的選擇是複雜多變的,但卻有其規則可循,尤其是檢索互動來源與其餘四種來源的變化關係。

表6 不同詞彙來源之演變關係摘要表

時間 時間(T+1)
(T) 書面問題陳述 檢索互動 研究者提供 瀏覽檢出文獻 系統索引檔
書面問題陳述      
檢索互動  
研究者提供        
瀏覽檢出文獻        
系統索引檔        

▲:表示兩詞彙來源為促長關係
X:表示不列入處理之資料

  綜合言之,一個理想的資訊檢索系統,它所具備的詞彙應該可以指出文獻與檢索問題中具有相同概念的事物,並透過詞彙間語意關係(如相關詞、狹義詞或廣義詞)的呈現,說明這些概念之間關係的遠近親疏。因此,詞彙不僅透露文獻及資料的內容,同時也表達、陳述檢索者的檢索問題,以使資訊系統順利地執行檢索與查詢。(註43)雖然各種超文(hypertext)系統不斷地研發改進,但在資訊系統與檢索技術尚未有革命性改變的今日,詞彙的使用仍是人與資訊檢索系統間互動的最主要媒介。

  對於這項溝通媒介的了解,應以解析檢索者的行為為基礎,包括重視選擇詞彙之決策過程,並繼續檢索行為之調查,如各種檢索互動行為的實證調查,包括瀏覽行為、錯誤行為、停頓行為、選擇行為、及相關判斷行為等研究。同時並以認知觀點探討使用者之資訊尋求行為,包括分類概念的建立、記憶與學習形態、及語意因素的影響等。(註44)經由透徹地了解使用者行為,才能建構圖書館服務的整體藍圖。

  當然,檢索中介者也必須加強本身選擇檢索詞彙的能力,並推廣控制詞彙觀念與索引典使用,因為控制詞彙可以解決自然語言之歧義(ambiguity)與含混(vagueness)兩大問題。其次,注重資訊檢索中有效之文獻表達(documentation representation)也是一項不可或缺的前置工作,因為文獻表達涉及作者、資訊處理者(人/機)與資訊需求者三者間對詞彙的選擇與運用。換言之,除了必須了解檢索者所使用的詞彙外,尚須具有語言學的基本知識,尤其是語言的使用與意義理論(meaning theory)的應用,(註45)這些知識都將有助於文獻分析者能完整而不失真地表達文獻所有的內容。

  另一方面,由於電腦通訊技術的發達,使得網路成為學術研究者不可或缺的工具,再加上圖書館中各種人工檢索系統(如卡片目錄)大多已轉換成電子檢索的型態,如線上公用目錄、光碟網路資料庫、線上資料庫等,故而,資訊檢索者的檢索行為已與人工檢索時代不同;更因為資訊載體的發展而突顯研究檢索者行為的重要性。這些隨著科技發展而改變使用者檢索行為的資訊媒體,使得資訊檢索行為的研究變得極其重要。首當其衝應了解的便是資訊需求者與檢索系統間的共通語言-檢索詞彙的研究。因此,在終端使用者逐日增多的趨勢下,了解檢索者選擇詞彙的決策過程應有助於改進資訊檢索介面的設計,並協助提供一個具有親和力(user-friendly)的中介檢索系統。

  了解選擇檢索詞彙來源的決策行為是研究檢索互動的基礎,但不可諱言地,國外有關檢索詞彙選擇的實證研究極為缺乏。觀之國內的情況,對選擇檢索詞彙行為的相關研究幾乎是付之闕如,這種現象無異突顯出進行檢索詞彙研究的重要性與迫切性。我們都希望有擁有一部極為傑出的資訊檢索系統,但我們更希望能多了解檢索者的資訊尋求行為,這些研究與調查是必要的,也是最基礎的工程。

【備註】

  • 註1:蔡明月,<線上資訊檢索-理論與應用>(台北市:台灣學生,民國80年),頁2。
  • 註2:Amanda Spink and Tefko Saracevic, "Dynamics of Search Term Selection during Mediated Online Searching," In Proceedings of the 56th Annual Meeting of the American Society for Information Science Vol.30 (1993): 63.
  • 註3:Cyril Cleverdon, "The Cranfield Tests on Index Language Devices," Aslib Proceedings 19:6(1967):173-194.
  • 註4:同註2。
  • 註5:同前註,頁63-64。
  • 註6:Nicholas J. Belkin and W. Bruce Croft, "Retrieval Techniques," Annual Review of Information Science and Technology Vol.22 (1987): 112.
  • 註7:同前註,頁129。
  • 註8:C. Pablo R. Dubious, "Free Text vs. Controlled Vocabulary: A Reassessment," On-line Review 11:4(August 1987): 243.
  • 註9:Tefko Saracevic, Hartmut Mokros and Louise Su, "Nature of Interaction Between Users and Intermediaries in Online Searching: A Qualitative Analysis," In Proceedings of the 53th Annual Meeting of the American Society for Information Science Vol. 27 (1990): 49-51.
  • 註10:Tefko Saracevic and Paul Kantor, "A Study of Information Seeking and Retrieving. III. Searchers, Searches, and Overlap," Journal of The American Society for Information Science 39:3(1988): 199.
  • 註11:Stephen P. Harter, Online Information Retrieval: Concepts, Principles, and Techniques(Orlando, Florida: Academic Press, 1986.), 150.
  • 註12:Raya Fidel, "Searchers' Selection of Search Keys: II. Controlled Vocabulary or Free-Text Searching," Journal of The American Society for Information Science 42:7 (1991): 501-506.
  • 註13:Raya Fidel, "Towards Expert Systems for the Selection of Search Keys," Journal of The American Society for Information Science 35:4 (1986): 42.
  • 註14:Amanda Spink, "Term Relevance Feedback and Mediated Database Searching: Implication for Information Retrieval Practice and System Design," Information Processing & Management 31:2 (March/April 1995):169-170.
  • 註15:Raya Fidel, "The Selection of Search Keys," In Expert Systems in Libraries, edited by Rao Aluri and Donald E. Riggs ( Norwood, New Jersey: Ablex Publishing, 1990),156-159.
  • 註16:Raya Fidel and Efthimis N. Efthimiadis, "Terminological Knowledge Structure for Intermediary Expert Systems," Information Processing & Management 31:1 (January/February 1995): 15-27.
  • 註17:C. J. Van Rijsbergen, D. J. Harper, and M. F. Porter, "The Selection of Good Search Terms," Information Processing & Management 17:2 (1981): 77-91.
  • 註18:S. E. Robertson and K. Sparck Jones, "Relevance Weighting of Search Terms," Journal of The American Society for Information Science 27:3 (May/June 1976): 129-146.
  • 註19:同註10,頁203-204。
  • 註20:Ruth Ann Palmquist and Bhaskaran Balakrishnan, "Using a Continuous Word Association Test to Enhance a User's Description of an Information Need: A Quasi-Experimental Study," In Proceedings of the 51th Annual Meeting of The American Society for Information Science Vol.25 (1988): 160-163.
  • 註21:Reginald Ferber, Manfred Wettler, and Reinhard Rapp, "An Associative Model of Word Selection in the Generation of Search Queries," Journal of The American Society for Information Science 46:9 (October 1995): 685,697.
  • 註22:Trudi Bellardo and Tefko Saracevic, "Online Searching and Search Output : Relationships between Overlap, Relevance, Recall and Precision," In Proceedings of the 50th Annual Meeting of The American Society for Information Science. Vol.24 (1987) : 11.
  • 註23:Stephen P. Harter, "Search Term Combinations and Retrieval Overlap: A Proposed Methodology and Case Study," Journal of The American Society for Information Science 41:2(March 1990): 143-144.
  • 註24:Mirja Iivonen, "Consistency in The Selection of Search Concepts and Search Terms," Information Processing & Management 31:2(March/April 1995): 180-185.
  • 註25:Geraldene Walker and Joseph Janes, Online Retrieval: A Dialogue for Theory and Practice(Englewood, Colorado : Libraries Unlimited, 1993), 115-116.
  • 註26:同註14,頁161-171。
  • 註27:Amanda Spink and Tefko Saracevic, "Where Do Search Terms Come From? " In Proceedings of the 13th National Online Meeting. Vol.13(1992): 363-373.
  • 註28:同註2。
  • 註29:Nicholas J. Belkin, P. G. Marchetti, and C. Cool, "BRAQUE: Design of An Interface to Support User Interaction in Information Retrieval," Information Processing & Management 29:3(May/June 1993): 325-344.
  • 註30:David C. Blair, Language and Representation in Information Retrieval(New York: Elsevier Science Publishing Company, 1990), 18-19.
  • 註31:同註11,頁22。
  • 註32:同註27,頁365-366。
  • 註33:同註2,頁72。
  • 註34:Marija J. Norusis, SPSS Advanced StatisticsTM 6.1. (Chicago : SPSS Inc. ,1994): 153-154.
  • 註35:同前註,頁207。
  • 註36:同註2,頁67-68。
  • 註37:同註2,頁67。
  • 註38:同註2,頁68。
  • 註39:同註40,頁189。
  • 註40:同上註。
  • 註41:同註40,頁152。
  • 註42:同註2,頁68。
  • 註43:Stephen P. Harter, Online Information Retrieval : Concepts, Principles, and Techniques (Orlando, Florida : Academic Press, 1986), 22.
  • 註44:Elizabeth T. Hewins, "Information Need and Use Studies," Annual Review of Information Science and Technology vol. 25 (1990): 164.
  • 註45:同註30,頁vii-viii。
讀者登入
回頂部