中國社會科學網 | 王賀：從數字人文到機器人人文，我們将失去什麼？

發布者：邵明傑發布時間：2020-12-21浏覽次數：200

現在也許是讨論數字人文可能面臨的問題的時候了。為使讨論進一步聚焦，此處僅以筆者的研究經驗為例，先看看一般理解的數字人文究竟是什麼。事實上，在近年關于晚清至當代文獻的研究之外，筆者一直嘗試數字人文與現代文學研究結合的可能，陸續寫過一些相關文章，參與了多個數據庫的建設（如2018年3月由“學術地圖發布平台”網站發布筆者第一部個數字人文作品《曹禺西北之行圖》）。許多相熟或素未謀面的朋友，便由此認定數字人文是紙質文獻的數字化或關于數字文獻史料的研究，其實這是一種誤會。

　　如果我們可以将1949年起羅伯托·布薩神父（Fr Roberto Busa）與IBM公司合作為托馬斯·阿奎那的《神學大全》編制拉丁文詞彙索引視為數字人文起源之一的話，那麼數字人文的曆史至今已有半個多世紀了。其間，數字人文的發展大緻經曆了三個階段。第一階段是紙質文獻的數字化；第二階段是配合相應的平台、工具等，将已經數字化了的文獻資料作更進一步的處理，特别是量化分析和可視化技術的運用更加深了這一印象；第三階段則無疑是人文學術與計算科學、數據科學的深度融合（D.M.Berry：Understanding Digital Humanities，Palgrave Macmillan，2012）。當然，在第一階段中已潛藏着一種人文學術“計算轉向”（computational turn）的趨勢，也因此，數字人文早期的術語是“人文計算”（humanities computing），用以強調計算機技術在人文研究中的運用。

　　随着互聯網技術的迅猛發展，數字或者數據代替紙質文獻，成為人文學術生産中越來越重要的資料，同時越來越多的人文學者意識到使用數字技術、方法是為了更好地理解人文學術。因此，數字人文或數據人文等概念相繼被提出（如2014年英國著名的布萊克威爾出版公司将其定期出版的《人文計算年鑒》更名為《數據人文》），特别是“Digital Humanities”一語，不胫而走，風靡全球。迄今相關的科系、研究中心，也已在哈佛大學、倫敦大學國王學院等歐美知名高校建立，并提供從本科生到博士生的一整套完整的人才培養方案，數字人文也因此成為一個極具活力的前沿學術領域。正如包弼德教授（Peter K. Bol）在數字人文國際高峰論壇暨上海師範大學數字人文研究中心成立大會上的緻辭中所言，數字人文中心不僅是一個研究中心，同時也是一個教學中心，一個學術交流、協作中心。

　　數字人文在中國的發展，雖早在十餘年前已開始，但直到近一兩年才真正成為一種學術潮流、學術時尚，既成為圖書館學、情報學、檔案學等學科的“學術熱點”，也在文學、史學、文獻學、語言學、藝術史研究等不同領域不斷引起人們探讨的熱情。盡管就其一般性的學術水平而言，中國的數字人文目前可能還處于上述所談第一、第二階段，但不出意外，在廣闊的數字人文場域中，數字文學、數字史學、數字文獻學、計算檔案學、計算語言學（語料庫語言學）、數字藝術等新的分支領域未來都将取得一定的發展。

　　最近人工智能技術的發展及其在全球範圍内社會生活各場景中的廣泛應用，也引起了批評家們的關注。在一般性的數字人文研究之外，檢讨技術、算法帶給文學、藝術與日常生活的宰制性和技術霸權，追問機器人是否可以被視作人、是否具有人性及其話語權等重要議題，也相繼被提出。由此，“機器人人文”成為另一個引人關注的場域，一個似乎可以取代數字人文、也顯得更加時尚的概念。事實上，從卡雷爾·恰佩克（Karel Capek）的科幻小說《羅素姆萬能機器人》首度展開對機器人的文學想象，到2016年仿生機器人索菲亞（Sophia）獲得沙特阿拉伯公民身份這一特殊事件及其傳遞出的象征意義，都讓人和機器人、人工智能的關系成為科學家與人文學者難以繞開的話題，尤其是随着大規模機器人群體的誕生，機器人社會的出現，遊走于現實與網絡之間的“賽博人”“後人類”社會似乎已不再是天方夜譚，而是相去不遠的未來。

　　對于人文學者來說，在人工智能技術的刺激下，諸多新的問題撲面而來。諸如微軟機器人小冰出版的詩集，是否可以被視作和人一樣的作品？清華“九歌—人工智能詩歌寫作系統”自動生産出的詩作，或許不是傳統意義上的一首好詩，但僅就其能夠完全根據我們的需要進行批量生産這一方面而言，是否已經可以說明傳統詩歌的能量、魅力在今天仍能夠被我們再一次激活，抑或已消耗殆盡、淪落為一種“裝飾藝術”？又如，面對機器人新聞寫作和由機器人深度參與的部分網絡文學文本時，其獨創性、文學性又該被如何界定？

　　此外，人工智能技術也與數字人文的關系極為密切，在很大程度上已經介入了數字人文的發展中。中華書局、書同文等企業開發的在線古籍校勘整理系統，就使用了人工智能的核心技術——機器學習，更不用說自然語言處理、語義網分析、知識圖譜、神經網絡等分支技術在曆史人文大數據環境中的成功應用，已是目前數字人文領域最受關注的方面。這一切似乎都向我們表明，包括人工智能這一前沿技術在内的數字技術、方法，已經成為人文學者必須掌握的工具或至少是輔助研究工具，而且将改變我們的學術習慣、生态。有學者甚至認為數字人文是一場新的學術革命。

　　但事實是否如此？在筆者看來，不僅傳統學術仍具有強大的生命力和創新發展的可能（參見拙文《“數字人文”與傳統學術》），而且數字人文和機器人人文盡管都是數字時代人文學術回應時代、社會重大關切而做出的某種适應和改變，固然可以幫助我們在某些方面理解舊的問題、驗證舊的結論、提出新的問題，重啟我們對主體、身體、人性、心靈、權利等一系列重要命題的思考，但就其長遠發展而言，或許也有将人文學術帶向“計算批評”，從而愈益科學化、喪失人文性的危險。

　　雖然“人文性”是一個難以準确定義的概念，但我們至少應該承認：與自然科學相比，人文學術的結論可能很難是唯一的、固定的、放之四海而皆準的，許多很難經得起重複驗證，也根本沒有什麼技術操作方案、程序可供驗證。人文學者的研究成果，往往因學者個體的性格、禀賦、學術訓練和特定的審美旨趣、意識形态偏向等，呈現出千差萬别的特點。但是，假如我們對于所有問題使用同一個數據庫（語料庫）、同一套計算機程序和分析工具，經過同樣的數據挖掘、分析作業之後，會得出相同的結論，這樣的人文學術研究還是我們需要的嗎？它是否會窄化人文學術的诠釋和想象空間？是否會将原本與博學、審思、明辨結合在一起的充滿個性的人文學術，降格為一種純粹的技術、實驗操作而危害“人文性”本身的發展？是否會導向對技術和算法的崇拜？這不能不引起我們的憂思。

　　更不必提，可能“還有很多學人，仍切盼着一個時常可以關閉電腦、遠離網絡的世界，無數個可以潛心研讀、圈點、勾畫、校閱，與書籍及作者思接千載、心遊萬仞的時刻，而非深陷于‘論文機器’‘學院動物’狀态不能自拔。這種閱讀、思考的狀态，有時呈現為‘按照目錄的方式，将某一主題的文獻逐一閱讀’，有時則純粹代表了第三種閱讀方式——漫無目的的閱讀（desultory reading），而後者的存在提醒我們，不妨享受‘非職業閱讀’、沉思、奇思妙想的樂趣。按照亞裡士多德、培根、夏目漱石、魯迅等人的理論，學術研究也好，藝文創作也罷，本來就是閑暇、餘裕的結果，而閑暇‘是一種精神的現象’‘一種靈魂的狀态’‘強調一種内在的無所憂慮，一種平靜，一種沉默，一種順其自然的無為狀态’”（《“數字人文”視野中的目錄之學》）。但數字時代的來臨，對人文學術工作帶來了一定的消極影響：不僅傳統的閱讀、寫作的技藝在走向衰落，學術成果的衰減期由原來的數年、數十年激變為今天的數天，而且更重要的是，當我們熟練地使用着數據庫、數字工具、算法輸出一套所謂的人文學術研究成果時，又可以在多大程度上慰藉我們或已開始幹枯的心靈世界、救贖原本動蕩不安的靈魂？

　　也正因此，筆者以為，數字人文也好，機器人人文也罷，不僅它們的重心、基座是人文，它的航向也應該是人文，是面向人文的一種可能的（最終并不一定成功的）研究取向、路徑，而不是相反，将其研究結果變成數字學術以至數字經濟的一個個精緻的、制式化的産品（甚至“草率的學術快餐”）。如果明知我們要付出的代價可能是犧牲其固有的、豐富的“人文性”，那麼一旦開始選擇這樣的研究取向、路徑，也就注定了我們的感覺是半信半疑的，腳步是蹒跚的，眼神是遊弋、閃爍的，說話的腔調是不那麼擲地有聲的。

　　當然，試驗新的學術取向，或創造可能的新學術，雖然并不一定比保守傳統更高明，但總歸是一種新的嘗試。借用魯迅先生的話來說，“希望是本無所謂有，無所謂無的。這正如地上的路；其實地上本沒有路，走的人多了，也便成了路”。

　　（作者系上海師範大學數字人文研究中心副教授）

導航

中國社會科學網 | 王賀：從數字人文到機器人人文，我們将失去什麼？