文档详情

知识呈现的方法.doc

发布:2018-02-24约1.14万字共11页下载文档
文本预览下载声明
Knowledge representation methods 知識呈現的方法 (此章描述人們希望以簡單搜尋的方式來組織及配置知識。 儲存在數位圖書館資料的數量使我們在搜尋資訊面臨困窘。疑問回收時不是搜尋不到就是得到上千個答案,使用者在某些知識的館藏裡被淹沒,他們對於該如何做感到困惑,幾年來一直企圖藉由主題(subject)組織資料,以提供人們尋找資料的方法。對圖書館員而言,特定位元的物理位置與其無關,但是館藏的智力組織仍然很重要。 若有個知識呈現組織讓我們使用,並且使用者知道此組織,同時能夠正確的把疑問放入,主題檢索將可以明確的回收。這仍是個不同層度混合的需求及品質檢查的需求。但我們可以想像,至少我們能解決主題之款目設置的問題。 知識呈現是否能在語言處理之外討論仍未明確。有兩位著名的語言學家Edward Sapir和Benjamin Lee Whorf提出Sapir-Whorf理論,該理論認為「語言會束缚思想」。他們認為文化上的差異會妨礙不同人依他們的語言來思考事物,除了語言的呈現外,沒有思想摘要的獨立呈現。大部分人工智力研究者否定Sapir-Whorf理論,他們相信大腦裡有某種摘要知識的呈現,在我們說和寫時可以轉換成語言形式,並且可用正確的嚴密結構直接呈現。Holy Grail(聖盃)即為知識呈現的最佳結構之一。 摘要知識結構的證據部份來自失語病(aphasia)的研究,它是一失去溝通能力,尤其是大腦受損的結果。此研究始於1870年普法戰爭的災禍,兩種失語病(分別為傷害大腦的Broca區及Wernicke區)被注意到有藥物差異。Broca區失語病是指缺乏造句功能,對於將字組合成句子有困難;Wernicke區失語病則為缺乏語意,他們能夠流暢地組織字詞,但不能製造修辭上明顯的論辯證明。在Wernicke區思考意義,及在Broca區形成語言是個討戰,但這非指引我們大腦可能運用的意義呈現結構。 實際上任何知識呈現組織是不可能達成所有目的的,組織越細節,對同份文件兩種不同的人越不可能有相同處理方式;組織越不細節,解決能力越低且更少利用。Tom landauer等人(1983)作「給概念命名」的實驗,要求人們將圖片或概念和單一個字作連結。在此實驗發現,為獲得85%的答案需要用到六個字,因此在要求人們分類概念是不可能產生獨一且可信賴的答案,甚至專業者也無法完全達成。 完全字彙是個舊有的夢想,雖然它源於一個些微不同的問題。在文藝復興時期之前大部分學者都以拉丁文寫作,他們能夠閱讀彼此的著作。隨著方言文學的提升,學者們對於他們無法閱讀想讀之書感到不快樂。自從拉丁文被遺棄後,他們認為或許人工語言將成為咒是思想的共通語言。一個例子就是Essay Towards a Real Charcter and Philosophical Language of Bishop Wilkins(1668)。還有其他如成就早於Wilkins的Leibniz。 5.1 Library classification圖書館分類法 若知識分類皆能由圖書館員來作,或許它能夠連貫地完成。第一步則是定義描述各主題的名詞性實詞之正式清單。 各分類法的歷史沿革 美國國會圖書館在1812年以前都是使用培根(Bacon)分類法,而後在1814換成傑佛遜(Jefferson)分類法,見table 5.1。 大英博物館使用14標題法(14 headings)直到1808,見table 5.2。 十九世紀末期,有兩個重要分類系統出現。 (1)1876年出版的杜威十進位分類法(the Dewey system by Melvil Dewey); (2)1879年的卡特擴展分類系統(the new library of congress classification by Charles Cutter)。 歐洲國家常使用國際十進位分類法(Universal Decimal classification),在實質上或精神上都和杜威法相似,保留杜威法的十大類和主要小類,將4號「語言」併入8號「文學」大類。 其他獨立的分類法,如Harvard等。 其他網路搜尋系統(Web search system)。例如雅虎,見課本figure 5.2,在兩萬個目錄標題下有二十萬個網站目錄。藉由層次(level)、類型(genre)、文件格式(document format)、資源(source)來分類,線上分類的唯一新元素是依「目的」來做分類,如求職、興趣等。 杜威法V.S.美國國會分類法(the library of congress classification)(又稱卡特法、擴展法)的差異: 卡特和杜威在分類表結構上有所不同,杜威法採用數字,依次分成十大類,底下十小類,再下又有十大項;卡特則利用2
显示全部
相似文档