<legend id="7c2kw"></legend>
  • <strong id="7c2kw"></strong>

    1. <ruby id="7c2kw"><option id="7c2kw"></option></ruby>
      <center id="7c2kw"></center>
    2. <progress id="7c2kw"></progress>

      全球快報:用科技手段激活古籍瑰寶

      時(shí)間: 2023-06-28 09:03:59 來(lái)源: 人民日報

      打開(kāi)瀏覽器,登錄“智慧古籍平臺”,可在線(xiàn)查閱4.4萬(wàn)篇古籍,除了著(zhù)述、篇目詳情等基本內容外,還有著(zhù)者小傳、人物行跡、世系圖及社會(huì )網(wǎng)絡(luò )關(guān)系圖等延伸信息,全面立體地展現古籍內容,滿(mǎn)足讀者一站式查詢(xún)、閱讀與研究需求。

      這是由浙江大學(xué)徐永明教授及其團隊打造的人機交互式智慧數據共享平臺,將中國古典文獻和研究成果圖譜化、智能化,打造了集瀏覽、查詢(xún)、研究、欣賞于一體的古籍大數據平臺,通過(guò)科技賦能,讓古籍知識變得“觸手可及”。


      (資料圖)

      科技賦能,推動(dòng)古籍資源“上線(xiàn)”

      在浙江大學(xué)文學(xué)院,記者見(jiàn)到技術(shù)團隊負責人徐永明時(shí),他正專(zhuān)心致志地坐在電腦前,忙著(zhù)審核已完成校對的古籍篇目并準備上線(xiàn)發(fā)布……

      “目前平臺已上線(xiàn)著(zhù)述總字數約700萬(wàn)字?!闭f(shuō)罷,徐永明招呼記者上手體驗。在“智慧古籍平臺”,古籍內容按“著(zhù)述導覽”“篇目導覽”“著(zhù)者導覽”等板塊分類(lèi)呈現,界面設計古典雅致、功能齊全,令人眼前一亮……

      “平臺引入知識圖譜理念,綜合運用大數據進(jìn)行計量統計、定位查詢(xún)、聚類(lèi)查詢(xún)等,讓讀者輕松便利地獲取古籍知識?!毙煊烂鬟呇菔具吔榻B,點(diǎn)擊“篇目導覽”按鈕,即可進(jìn)入文本閱讀界面,“文本閱讀是本平臺的特色功能,為提高文本的真實(shí)性和準確性,平臺提供了古籍圖片與古籍數字化文本一一對應的功能?!?/p>

      不僅如此,“智慧古籍平臺”還有許多其他亮點(diǎn):為降低閱讀時(shí)查閱相關(guān)資料的頻率,平臺提供了關(guān)鍵字詞釋義功能,文本中重要信息及疑難詞按照人名、地名、職官、時(shí)間、典故等不同類(lèi)型以不同顏色顯示,點(diǎn)擊即可查看釋義;借助地理信息系統軟件,結合在線(xiàn)地理信息系統,古籍中留存的地理信息實(shí)現了可視化,點(diǎn)擊著(zhù)者詳情,即可查看所鏈接的人物行跡圖……

      而提及地理信息可視化,不得不提徐永明團隊的另一個(gè)平臺——“學(xué)術(shù)地圖發(fā)布平臺”,其中匯集了李白、蘇軾等500多位中華歷史名人的行跡圖、《全元詩(shī)》作者分布圖等各類(lèi)學(xué)術(shù)地圖……“其實(shí)這個(gè)平臺比‘智慧古籍平臺’還要早一些,是中國首個(gè)綜合性學(xué)術(shù)地圖平臺?!彼榻B,平臺迄今已發(fā)布1600余幅地圖,共有70余個(gè)國家100萬(wàn)讀者的訪(fǎng)問(wèn)量。

      綜合利用這兩個(gè)平臺,徐永明團隊將文史數據與數字地圖相結合,極大地增強閱讀體驗,旨在豐富讀者對古籍知識的綜合認知。

      為解決技術(shù)難題,文科背景出身的徐永明自學(xué)編程

      在徐永明看來(lái),完善豐富的前端體驗少不了強大的后臺技術(shù)支持,“比如,要將古籍圖像中的文字轉換成文本格式,就需要OCR識別,即‘光學(xué)字符識別’技術(shù),平臺現用的OCR技術(shù)能較為精確地識別版刻古籍,準確率達到90%以上?!彼蛴浾呖破掌饋?lái),再如,借助計算機學(xué)習技術(shù),平臺采用的“機器古籍標點(diǎn)技術(shù)”,可根據特定算法為古籍文本自動(dòng)標注現代中文標點(diǎn)符號,準確率也穩定在90%以上。

      “但正所謂‘隔行如隔山’,僅靠我一人無(wú)法建起這個(gè)平臺,需要許多相關(guān)專(zhuān)業(yè)人員的支持?!彼榻B,作為項目負責人,從2020年項目立項以來(lái),他找來(lái)浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院、地球科學(xué)學(xué)院和校圖書(shū)館等相關(guān)學(xué)院和部門(mén)老師,組建起一支20余人的技術(shù)團隊。

      這期間,曾遇到不少難點(diǎn),“比如,前期需要不斷跟第三方公司磨合,解決前、后臺頁(yè)面設計、框架布局、功能模塊等問(wèn)題;到了后期,我們更換了合作方,又得重新磨合,主要解決地域導覽、編輯器、職官圖譜、智能OCR服務(wù)引入等相關(guān)問(wèn)題?!毙煊烂髡f(shuō)。

      緣何要研發(fā)這樣的古籍知識大數據平臺?徐永明坦言,這跟自己早年的經(jīng)歷有關(guān)。上世紀90年代末期,他曾在浙江圖書(shū)館古籍部工作過(guò)一段時(shí)間,目睹了讀者來(lái)看古籍善本有多不方便,比如只能抄錄,復制的話(huà)也要經(jīng)過(guò)許可,且費用很貴。

      在他讀博期間,國內還沒(méi)有出全文檢索的《四庫全書(shū)》電子產(chǎn)品。那時(shí),他寫(xiě)作博士論文材料,都是靠自己翻閱原書(shū),一條一條抄錄。這些經(jīng)歷讓徐永明深深地感到,紙質(zhì)文獻難以保存傳播,古籍信息存在“孤島化”“碎片化”現象,“如今,數字技術(shù)發(fā)展日新月異,我們便琢磨著(zhù)能否將大數據技術(shù)與古籍進(jìn)行深度融合,為傳承中華優(yōu)秀傳統文化探索新的可能?!?/p>

      在“學(xué)術(shù)地圖發(fā)布平臺”開(kāi)發(fā)階段,面對界面不美觀(guān),操作不方便,功能有限,經(jīng)常出現程序故障等問(wèn)題,文科背景出身的徐永明開(kāi)始了他的自學(xué)Python(計算機編程語(yǔ)言)開(kāi)發(fā)之路。在他的朋友圈,他時(shí)常發(fā)布學(xué)習編程的動(dòng)態(tài)、用Python完成的各種小成果、自己編寫(xiě)的代碼,等等。

      面對海量數據,徐永明善于利用團隊的力量,“過(guò)去整理古籍,主要是個(gè)體作業(yè),以書(shū)為單位,不能修改、不可關(guān)聯(lián),效率不高?!彼f(shuō),“現在,我們將古籍整理任務(wù)通過(guò)勤工儉學(xué)、暑期社會(huì )實(shí)踐等形式,遴選相關(guān)專(zhuān)業(yè)學(xué)生、專(zhuān)家,在線(xiàn)上線(xiàn)下一同參與,努力發(fā)揮集體的智慧?!?/p>

      幫助讀者掃除古代文獻閱讀障礙,推動(dòng)古籍閱讀普及化,激活學(xué)者的研究成果

      浙江大學(xué)中國古代文學(xué)專(zhuān)業(yè)的博士生郝亞潔認領(lǐng)了新任務(wù):對《徐文長(cháng)文集》《吟香室詩(shī)草》等古籍的OCR校對結果進(jìn)行二次審核。

      “根據平臺不同時(shí)期的需求,我的工作內容側重點(diǎn)都有不同?!焙聛啙嵔榻B,比如,在平臺建設初期,同學(xué)們主要負責數據上傳整理,“數據一般以一部文集為單位,需要制作目錄文件把文集的文字內容按照篇目和影像一一對應?!焙笃?,郝亞潔則負責OCR識別和機器標點(diǎn)校對后的人工審核等工作。

      全程參與“智慧古籍平臺”建設,讓郝亞潔受益匪淺……在她眼中,徐永明是治學(xué)嚴謹的導師,自己從平臺維護中收獲良多?!氨热?,之前學(xué)過(guò)的Python計算機編程語(yǔ)言,就苦于沒(méi)機會(huì )實(shí)踐;現在的校對環(huán)節中,用Python代碼檢查不僅幫了我大忙,更體會(huì )到了什么叫‘活學(xué)活用’?!?/p>

      平臺運行至今獲得各方好評,但徐永明坦言,“智慧古籍平臺”建設任重道遠,想要把浩如煙海的中華古籍資源利用起來(lái),還有很長(cháng)的路要走?!拔覀兊某踔院芎?jiǎn)單,就是想為讀者掃除古代文獻閱讀障礙,推動(dòng)古籍閱讀普及化,激活學(xué)者的研究成果,突破學(xué)術(shù)壁壘,將前沿的學(xué)術(shù)研究成果轉化為社會(huì )大眾共享的文化資源,同時(shí)改變‘數據在中國,數據庫在國外’的現象?!?/p>

      面向未來(lái),徐永明團隊定下了新目標:利用“智慧古籍平臺”進(jìn)一步推進(jìn)古籍數據資源的整合和開(kāi)放共享,用智慧化手段為中國古代典籍資源爭取“主動(dòng)權”,讓古籍資源從“活下來(lái)”真正轉變?yōu)椤盎钇饋?lái)”?。ū緢笥浾?江 南 竇瀚洋)

      關(guān)鍵詞:

      責任編輯:QL0009

      為你推薦

      關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

      版權所有 © 2020 跑酷財經(jīng)網(wǎng)

      所載文章、數據僅供參考,使用前務(wù)請仔細閱讀網(wǎng)站聲明。本站不作任何非法律允許范圍內服務(wù)!

      聯(lián)系我們:315 541 185@qq.com

      精品成人精品无码区_欧亚乱色熟女一区二区_91在线精品国产丝袜超清_色欲久久久久综合网
      <legend id="7c2kw"></legend>
    3. <strong id="7c2kw"></strong>

      1. <ruby id="7c2kw"><option id="7c2kw"></option></ruby>
        <center id="7c2kw"></center>
      2. <progress id="7c2kw"></progress>