极速飞艇开奖历史|极速飞艇彩票
社科網首頁|客戶端|官方微博|報刊投稿|郵箱 中國社會科學網

中國文學網

數字人文研究的發展趨勢

史睿

  當代學者必須面對這樣的現實:我們正處在一個傳統媒介文獻和數字文獻交錯并行的時代,這個時代的學者必須同時具備處理兩種文獻的能力才能從事學術研究。
  
  傳統媒介文獻大家都非常熟悉,不再臚列;數字文獻大致可分為三類:傳統紙本文獻的數字影像、數字編碼的全文文本、結構化的數據庫或知識庫。處理傳統媒介文獻,人類已經積累了數千年的經驗,而處理數字文獻則是一個新命題。
  
  研究如何利用數字文獻以解答人文學術問題,并探求如何,可稱為數字人文研究。這是一個嶄新的跨學科的研究領域,從事這個領域的學者往往來自傳統人文學科、圖書情報學、語言學、計算機學等學科,有著不同的學術背景,他們固然對于這個領域各有貢獻,但不同學科之間的鴻溝仍然難以逾越。
  
  其實傳統人文學術為我們提供了多種知識管理解決方案,最新的解決方案可能就蘊涵在古老的文獻之中,我們今天應該善加繼承、利用。需要特別強調的是,電子文獻不會天然比傳統媒介有優勢,其至少存在兩個方面的缺陷,一是文本準確率,一是檢索的查全率、查準率。紙本文獻必須達到萬分之一以下的差錯率才能出版,而目前既有電子文獻遠低于這個水平。又,利用檢索工具書,紙本文獻可以達到很高的查全率和查準率,目前還沒有哪種數據庫或知識庫超過紙本文獻既有的水平。人文學者有責任總結人類既有的知識管理策略和人文學術方法論,并積極普及推廣,同時也要積極學習統計學、計算語言學、計算機科學和網絡技術,提出更為明確的應用需求,尋求成熟而適用的方法以實現智能化的數字人文方法;而科學家們也要破除傲慢的現代中心觀和科學主義偏見,積極學習并繼承人類社會積累了數千年的有效知識。
  
  關于數字人文研究的基礎理論,筆者19年前發表了《論中國古籍的數字化與人文學術研究》(《北京圖書館館刊》1999年第2期,第28-35頁),十二年前發表《索引與知識發現》(《中國索引》2006年第1期,第2-9頁)和《古籍數字資源的知識庫建設解析》(《數字圖書館論壇》2006年第12期,第1-4頁,與程佳羽合作),這些文章提出數字人文研究的基礎是建立通用的詞匯級的本體,轉化、集成傳統文獻檢索工具,建立基于本體的神經網絡式的知識管理系統,提供語義網的智能知識服務。
  
  最近幾年越來越多的同行認同我的觀念,但我當年思考的問題目前還沒有引起人文學術研究領域的重視,尚未形成共識,故有必要著文申述。筆者認為,數字人文研究應有兩個層面的基本要素:即知識本體和知識網絡,用傳統詞匯概括,相當于“辭典”和“索引”。知識本體如同辭典,是指一個不可再分的意義的規范表達形式及其權威解釋;知識網絡如同索引和索引的綜合體,包括各種類型檢索工具,例如范疇索引、主題詞表、人物關系索引(傳記索引、交往索引、世系表)、年表、地圖、書目等等,知識網絡把這些索引中的同一意義的標目提取出來,加以綜合歸納,形成反映知識自身關聯的網絡,人文學者可以循此網絡進行無限的知識運算,包括聚類、篩選、比較、統計、推理。
  
  對傳統媒體承載的知識進行以上兩方面的加工,我們就能實現關鍵詞級的知識管理,真正突破傳統媒體的限制,學術研究就變得更為便利和深入。傳統媒體的限制是指舊媒體將知識分割于不同的物理載體之中,比如說這本書的知識很難與另一本書的同類知識關聯,這種檢索工具很難跟另一種檢索工具互通,而學術研究則要求盡可能地聯系各方知識,便于重新組合和運算。學者重組知識的能力越強,創造力也就越強。計算機和網絡把我們帶入一個新媒體時代,所有知識都變成比特,而比特之間并無物理區隔,已連為一體了。我們處理這些信息的辦法是相同的,且范圍更廣、計算更快、應用更方便,只是問題在于怎么管理它們,怎么制訂一個標準把它統合起來。
  
  近代學術史于此給予我們啟迪:上世紀30年代開始,哈佛燕京學社在北京建立引得編纂處(今北京大學校內),這是現代學術史上極具關鍵性的大事件。當時不僅引得編纂處出版了系列古籍索引,還有中法漢學研究所的系列“通檢”,以及國立北平圖書館的《國學論文索引》《清代文集篇目分類索引》《石刻題跋索引》,稍后出版的有譚其驤主編的《中國歷史地圖集》。這些引得、通檢、索引、地圖看起來是普通的學術出版物,實際是中國學術現代性轉型的重要表現。此前的學術研究依賴個人的記憶、功力和視野,有了上述這些索引工具,便能聚合學術共同體的成就,形成有序有效的社會知識積累和傳播,中國從此跨入了現代學術的大門。
  
  中國學術界今天面臨的情況跟上世紀30年代引得編纂處時代的情況完全一樣,正處在向新學術轉變與跨越的門檻上,即利用新媒體、新技術實現更為深入新穎的知識重組,甚至代替學者的部分重復性和基礎性工作。而且有意思的是,目前北京大學中國古代史研究中心、臺北“中央研究院”歷史語言研究所、哈佛大學燕京學社三個機構在燕京大學舊地正在實施的“中國歷代人物資料數據庫”項目(簡稱CBDB),正如同新媒體時代的新“引得”事業。
  
  看起來好像我們經過一個歷史循環,又到了一個新的起點,我們從地理原址這個起點重新出發,再次謀求突破和飛躍。更為重要的是,今天世界學術格局和上世紀二三十年代有著顯著的不同:當初中西學術的差異是近代學術與前近代學術之間的差異,我們只有跟隨學習;而如今中西的人文學術研究都面臨著新媒體、新技術帶來的機遇和挑戰,顯然站在了同一起跑線上,如何應對,中西雙方可以咸有貢獻,而并不需要跟隨西方亦步亦趨,反而可以基于中文文獻的特征提出更優的解決方案,推動人文學術的發展。
  
  當人類更多使用這樣的新媒體進行人文學術研究的時候,我們可以發現,這建立了更為平等的知識學習渠道,無論身處何地,都最便捷地學到人類世代積累的知識,不再因為信息渠道受阻——例如沒有條件獲取承載知識的圖書、期刊——而喪失學習機會;同時,這將人文學者從簡單的資料匯總、篩選和推理中解放出來,提高了學術研究的門檻,督促學者從事更為思辨性和創造性的研究。
  
  預測到這樣的前景和挑戰,我們人文學者要有必要的準備,既要充分利用已有的數字人文成果,避免研究中信息缺失和知識缺失的陷阱,墊高殖厚學術研究的基礎;又要在傳統媒體上發表學術成果之外,全力支持網絡基礎設施建設,將自己的成果轉移并記錄到可資人類永久地、平等地利用的知識體系之中,以求學術的永續發展。
  

极速飞艇开奖历史 色子大小玩法 计算快三大小软件 福建时时官网 北京pk10直播 客户管理app 一木棋牌下载 后三组选包胆简单玩法 贝斯特全球最奢游戏手机app 6码倍投 重庆时时开彩结果下载