2019
09/24
10:55
大數(shù)據(jù)以容量大、類型多、存取速度快、應(yīng)用價(jià)值高為主要特征。在大數(shù)據(jù)時(shí)代,每個(gè)人的工作都會涉及到大量的數(shù)據(jù),通過人力或現(xiàn)行處理工具,在合理的時(shí)間和成本范圍內(nèi),難以實(shí)現(xiàn)對相關(guān)數(shù)據(jù)的有效選取、管理、分析和處理,需要專門的知識庫和知識服務(wù)系統(tǒng)作為支撐。知識服務(wù)是文獻(xiàn)服務(wù)和信息服務(wù)的深化,是信息管理、知識管理與組織學(xué)習(xí)綜合集成的一種服務(wù)。大數(shù)據(jù)知識服務(wù)是為適應(yīng)信息服務(wù)業(yè)智慧化、協(xié)作化和泛在化的發(fā)展趨勢而衍生的,是一種基于網(wǎng)絡(luò)以解決結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)多維度處理的信息服務(wù)新模式,它充分利用各種資源,采用一定技術(shù)工具提取與挖掘知識的發(fā)現(xiàn)過程,強(qiáng)調(diào)用戶參與和群體協(xié)同,是面向不同知識層次的服務(wù),在服務(wù)過程中強(qiáng)調(diào)知識分享和知識創(chuàng)新。在互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代,知識成為生產(chǎn)力的關(guān)鍵要素。傳統(tǒng)的信息服務(wù)已經(jīng)不能滿足用戶需求,信息技術(shù)支撐下的知識服務(wù)將在當(dāng)代信息社會中扮演重要角色。
一、林業(yè)大數(shù)據(jù)整合與知識庫建設(shè)
數(shù)據(jù)資源是大數(shù)據(jù)知識服務(wù)發(fā)展最重要的驅(qū)動因素。中國林科院科信所1985年開始從事林業(yè)科技文獻(xiàn)數(shù)據(jù)庫建設(shè),系統(tǒng)收集和整理國內(nèi)外與林業(yè)相關(guān)的主要科學(xué)數(shù)據(jù)和文獻(xiàn)資料,建成了80多個(gè)擁有自主知識產(chǎn)權(quán)的林業(yè)科技信息數(shù)據(jù)庫群。1998年建成并開通的《中國林業(yè)信息網(wǎng)(www.lknet.ac.cn)》,已運(yùn)營20年,是林業(yè)行業(yè)大型綜合性網(wǎng)站,已成為林業(yè)行業(yè)中信息量最大的權(quán)威性行業(yè)網(wǎng)站。實(shí)現(xiàn)了林業(yè)信息資源的匯聚,建成了林業(yè)行業(yè)的云數(shù)據(jù)中心。同時(shí),大力引進(jìn)國內(nèi)外林業(yè)數(shù)字化資源,截止目前,中國林業(yè)數(shù)字圖書館共引進(jìn)了26個(gè)國內(nèi)外林業(yè)數(shù)據(jù)庫,其中全文數(shù)據(jù)庫23個(gè),文摘庫3個(gè),建成了中國知網(wǎng)、重慶維普、萬方數(shù)據(jù)和超星等7個(gè)鏡像站點(diǎn)和網(wǎng)絡(luò)版授權(quán)訪問資源。通過購買、采集、自建等多種方式,匯聚整合了一定規(guī)模的林業(yè)專業(yè)資源,構(gòu)建了“集中+分布”的林業(yè)大數(shù)據(jù)知識倉儲。建成了統(tǒng)一資源整合服務(wù)平臺,解決異構(gòu)林業(yè)數(shù)字資源的整合和檢索問題,為用戶提供“一站式”檢索服務(wù)。
近年來,在中國工程院的支持下,建成了中國工程科技知識中心的林業(yè)分中心—林業(yè)專業(yè)知識服務(wù)系統(tǒng)。該系統(tǒng)以林業(yè)工程及相關(guān)學(xué)科的科學(xué)數(shù)據(jù)和文獻(xiàn)資源為主,在已建林業(yè)數(shù)據(jù)庫資源的基礎(chǔ)上進(jìn)行數(shù)據(jù)的規(guī)范化加工,整合林業(yè)行業(yè)豐富的科學(xué)數(shù)據(jù)和信息資源,完成了4大類45個(gè)數(shù)據(jù)庫1100多萬條數(shù)據(jù)的整合工作,建成了林業(yè)科技大數(shù)據(jù)知識倉儲,構(gòu)建了林業(yè)領(lǐng)域的知識詞庫系統(tǒng)。林業(yè)主題詞和同義詞庫系統(tǒng)按林業(yè)學(xué)科組織,包括國家、中國行政區(qū)劃、林業(yè)機(jī)構(gòu)的全稱、縮寫、歷史名稱變更以及樹種、花卉、動物、植物、昆蟲、病蟲害、主要林業(yè)術(shù)語等的異名詞和別名等。按照上位詞、下位詞、同義詞、英文名、拉丁名組織,實(shí)現(xiàn)語義檢索,形成知識圖譜。
二、林業(yè)知識服務(wù)平臺構(gòu)建
大數(shù)據(jù)時(shí)代的知識服務(wù)需要集成化的知識服務(wù)平臺支撐。知識服務(wù)平臺是大數(shù)據(jù)時(shí)代知識服務(wù)的基礎(chǔ)設(shè)施,需要進(jìn)行科學(xué)的規(guī)劃和設(shè)計(jì),搭建合適的平臺架構(gòu),選擇合理的建設(shè)模式,適應(yīng)知識服務(wù)的領(lǐng)域和規(guī)模要求。
林業(yè)知識服務(wù)平臺是一個(gè)基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)獲取、存儲、組織、分析、資源和服務(wù)共享與協(xié)作的智慧平臺,采用Elastic Search分布式全文搜索引擎技術(shù)和Spring MVC框架,搭建了系統(tǒng)服務(wù)器集群,系統(tǒng)具有林業(yè)知識的深度搜索、學(xué)科導(dǎo)航、知識鏈接、大數(shù)據(jù)分析、知識圖譜和可視化分析等服務(wù)功能,實(shí)現(xiàn)了基于語義關(guān)聯(lián)的林業(yè)知識發(fā)現(xiàn)服務(wù)。
“林業(yè)搜索”檢索系統(tǒng)致力于幫助用戶精準(zhǔn)發(fā)現(xiàn)、獲取與沉淀學(xué)術(shù)精華,提供強(qiáng)大的檢索、實(shí)時(shí)分組和統(tǒng)計(jì)分析能力,通過一次操作可得到多次聚合的結(jié)果,自動排序。依托主題詞表,構(gòu)建了多維度、多層次、內(nèi)容深度關(guān)聯(lián)的知識組織脈絡(luò);支持檢索結(jié)果的細(xì)化分層和多維聚類,幫助用戶在海量資源中快速定位最佳匹配結(jié)果。為用戶從整體上掌握學(xué)術(shù)發(fā)展趨勢,洞察知識之間錯(cuò)綜復(fù)雜的交叉關(guān)系,發(fā)現(xiàn)高價(jià)值學(xué)術(shù)文獻(xiàn),激發(fā)創(chuàng)新靈感提供高效而權(quán)威的學(xué)習(xí)和研究工具。系統(tǒng)支持統(tǒng)一檢索、高級檢索外、特色是同義詞、上位詞、下位詞檢索功能。實(shí)現(xiàn)檢索結(jié)果的實(shí)時(shí)文獻(xiàn)計(jì)量統(tǒng)計(jì)和可視化展示,檢索結(jié)果能夠以曲線圖、柱狀圖、餅圖等多種方式展示。動態(tài)生成和展示檢索主題的相關(guān)圖譜。包括:主題詞圖譜、相關(guān)關(guān)鍵詞圖譜、相關(guān)著者圖譜、相關(guān)機(jī)構(gòu)圖譜、著者圖譜、機(jī)構(gòu)圖譜等。
中國林業(yè)信息網(wǎng)、林業(yè)專業(yè)知識服務(wù)系統(tǒng)等10多個(gè)網(wǎng)站共享統(tǒng)一的數(shù)據(jù)庫資源和用戶身份認(rèn)證系統(tǒng),實(shí)現(xiàn)了林業(yè)各平臺數(shù)據(jù)的有效打通和共享。各平臺有獨(dú)立WEB服務(wù)器對外運(yùn)行,底層數(shù)據(jù)資源共享數(shù)據(jù)庫服務(wù)器資源,保持?jǐn)?shù)據(jù)更新與維護(hù)的一致性。網(wǎng)站、微信公眾號和移動端統(tǒng)一對外提供信息服務(wù)。
三、林業(yè)知識服務(wù)模式優(yōu)化和創(chuàng)新
大數(shù)據(jù)知識服務(wù)強(qiáng)調(diào)以用戶需求為導(dǎo)向、由用戶需求驅(qū)動,核心是滿足不同用戶的信息需求。知識服務(wù)產(chǎn)品開發(fā)要根據(jù)不同知識內(nèi)容、不同用戶、不同應(yīng)用場景,選擇不同的知識產(chǎn)品形式和運(yùn)營模式。
(1)基于語義關(guān)聯(lián)的知識發(fā)現(xiàn)服務(wù)
林業(yè)專業(yè)知識服務(wù)系統(tǒng)采取公共用戶、手機(jī)實(shí)名注冊用戶、入網(wǎng)用戶和授權(quán)IP用戶4類進(jìn)行分級分類管理。國家林業(yè)局、主要林業(yè)高等院校和科研院所已團(tuán)體入網(wǎng)的授權(quán)IP用戶,系統(tǒng)會自動檢測并登錄,共享網(wǎng)上林業(yè)數(shù)據(jù)資源,為用戶提供了全面、便捷、智能多維度的林業(yè)知識服務(wù)。
(2)面向特定需求的個(gè)性化定制服務(wù)
林業(yè)統(tǒng)計(jì)數(shù)據(jù)可視化分析系統(tǒng),對國內(nèi)外林業(yè)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行可視化分析和地圖展示,滿足了不同用戶的信息需求。包括:中國森林資源清查數(shù)據(jù)、中國濕地資源調(diào)查數(shù)據(jù)、荒漠化和沙化調(diào)查數(shù)據(jù)、中國石漠化調(diào)查數(shù)據(jù)、野生大熊貓調(diào)查數(shù)據(jù)、野生動植物資源調(diào)查數(shù)據(jù)、世界森林資源數(shù)據(jù)、世界森林碳匯數(shù)據(jù)、國際重要濕地?cái)?shù)據(jù)、世界林產(chǎn)品貿(mào)易數(shù)據(jù)、中國自然保護(hù)區(qū)數(shù)據(jù)、中國林業(yè)產(chǎn)業(yè)類數(shù)據(jù)、中國森林災(zāi)害類數(shù)據(jù)、中國林業(yè)投資類數(shù)據(jù)、中國林業(yè)生態(tài)工程類數(shù)據(jù)、中國鄉(xiāng)村林業(yè)類數(shù)據(jù)等。
林業(yè)GIS應(yīng)用,接入天地圖矢量地圖、天地圖遙感影像,實(shí)現(xiàn)底圖切換管理。共享接入林業(yè)專題圖、各類林業(yè)統(tǒng)計(jì)數(shù)據(jù)的GIS展示和統(tǒng)計(jì)分析、各類矢量型林業(yè)特色機(jī)構(gòu)的GIS定位、查詢與展示(包括:國家公園、國家森林城市、國家森林公園、國家濕地公園、國家地質(zhì)公園、世界遺產(chǎn)名錄、國際重要濕地名錄等)。
(3) 基于深度融合的林業(yè)情報(bào)分析服務(wù)
開展世界林業(yè)發(fā)展動態(tài)跟蹤、林產(chǎn)品進(jìn)出口數(shù)據(jù)分析和專利預(yù)警分析研究,形成了一系列研究報(bào)告。建成世界林業(yè)科技發(fā)展動態(tài)跟蹤分析平臺,實(shí)時(shí)監(jiān)測120多個(gè)國家及國際組織的最新林業(yè)政策、科技前沿、專利技術(shù)和林產(chǎn)品貿(mào)易等方面的最新動態(tài)信息, 開展世界林業(yè)發(fā)展動態(tài)跟蹤分析服務(wù)。
運(yùn)用數(shù)據(jù)挖掘技術(shù)和可視化技術(shù),從海量、異構(gòu)、分散的專利數(shù)據(jù)中挖掘和分析隱含的規(guī)律和發(fā)展趨勢,實(shí)時(shí)監(jiān)測和分析國內(nèi)外林業(yè)重點(diǎn)領(lǐng)域的專利動態(tài)變化,增強(qiáng)知識產(chǎn)權(quán)預(yù)警能力和應(yīng)急機(jī)制,為政策制定、技術(shù)創(chuàng)新提供信息支撐。選擇林業(yè)行業(yè)容易遭到國外專利壁壘的重點(diǎn)林產(chǎn)品領(lǐng)域,以及林業(yè)科技創(chuàng)新前沿領(lǐng)域。采用定量和定性分析相結(jié)合的方法,聘請行業(yè)專家參與,根據(jù)數(shù)據(jù)分析結(jié)果結(jié)合專家意見,形成研究結(jié)果。已完成40多個(gè)技術(shù)領(lǐng)域的專利分析研究,出版專利分析報(bào)告8部。
(4)針對特定主題的專題知識服務(wù)
專題頁面定制功能模塊,快速生成專題知識應(yīng)用。通過后臺配置與某一專題相關(guān)的關(guān)鍵詞、學(xué)科分類和數(shù)據(jù)庫等要素,實(shí)現(xiàn)專題數(shù)據(jù)的自動抽取和聚類。 可靈活配置專題頁面的布局和樣式,圖文并茂地展示該專題的數(shù)據(jù)資源。 采用數(shù)據(jù)挖掘技術(shù),實(shí)現(xiàn)了專題各類數(shù)據(jù)資源的有效打通、統(tǒng)一管理、知識關(guān)聯(lián)和可視化展示。一個(gè)專題也是一個(gè)獨(dú)立網(wǎng)站,每日晚上同步更新。一帶一路、鄉(xiāng)村振興、木材安全、知識產(chǎn)權(quán)、院士專題和中國林科院機(jī)構(gòu)知識庫等專題知識應(yīng)用上線運(yùn)行。
一帶一路林業(yè)專題從林業(yè)專業(yè)知識服務(wù)系統(tǒng)中實(shí)時(shí)抽取和整合了一帶一路沿線65個(gè)國家的林業(yè)數(shù)據(jù)資源,包括:動態(tài)、文獻(xiàn)、樹種、濕地、森林資源和林產(chǎn)品貿(mào)易等數(shù)據(jù),專題數(shù)據(jù)量達(dá)到52萬多條。
快速構(gòu)建機(jī)構(gòu)知識庫。從林業(yè)專業(yè)知識服務(wù)系統(tǒng)中實(shí)時(shí)抽取和整合了中國林科院建院60年來的產(chǎn)出成果,包括:期刊論文、SCI收錄論文、學(xué)位論文、科技成果、獲獎(jiǎng)成果、推廣成果、申請專利、制定標(biāo)準(zhǔn)、軟件著作權(quán)、授權(quán)植物新品種、林科專家等數(shù)據(jù),并進(jìn)行數(shù)據(jù)統(tǒng)計(jì)和可視化分析,建成了中國林科院機(jī)構(gòu)知識庫。針對任何一個(gè)機(jī)構(gòu)、學(xué)科團(tuán)隊(duì)、知名專家均可快速構(gòu)建自己的知識庫和網(wǎng)站,實(shí)現(xiàn)自動采集、更新和可視化分析。
四、林業(yè)知識服務(wù)特色產(chǎn)品
開通“林業(yè)知識服務(wù)”微信公眾號,跟蹤世界林業(yè)科技前沿,每周發(fā)布原創(chuàng)的林業(yè)科技前沿文章。關(guān)注“林業(yè)知識服務(wù)”微信公眾號,可使用我們面向用戶開發(fā)的2個(gè)知識服務(wù)特色產(chǎn)品:林業(yè)搜索APP應(yīng)用和樹木識別微信小程序。
(1)林業(yè)搜索APP應(yīng)用
采用微信公眾號接口技術(shù),開發(fā)了基于安卓系統(tǒng)和蘋果系統(tǒng)的移動端應(yīng)用—林業(yè)搜索,提供移動設(shè)備的“一站式”檢索服務(wù)。包括推薦、位置、成果、標(biāo)準(zhǔn)、專利、期刊、動態(tài)、專家、機(jī)構(gòu)、術(shù)語、法規(guī)、植物新品種、動植物資源、林木良種等12類數(shù)據(jù)資源。提供統(tǒng)一搜索、知識鏈接和原文獲取(標(biāo)準(zhǔn)、專利)。移動端(林業(yè)搜索)與網(wǎng)站底層數(shù)據(jù)同步更新,用戶可在線檢索網(wǎng)站數(shù)據(jù)庫中的數(shù)據(jù),每日更新,免費(fèi)獲取,使用更為便捷和高效。
(2)樹木識別微信小程序
以海量植物分類圖片為基礎(chǔ),采用人工智能技術(shù),通過機(jī)器學(xué)習(xí)自建模型圖庫實(shí)現(xiàn)樹木植物的精準(zhǔn)識別,只需拍攝樹木、花卉等植物的花、莖、果、葉等部位,即可快速識別植物。能識別中國野生及栽培植物3000屬,近5000種,幾乎涵蓋身邊所有常見花草樹木,把最完整的樹木植物信息呈現(xiàn)給用戶,為用戶提供實(shí)時(shí)信息服務(wù)。
五、展望
近年來,林業(yè)行業(yè)充分利用大數(shù)據(jù)、虛擬現(xiàn)實(shí)、云計(jì)算、數(shù)據(jù)挖掘與可視化技術(shù),整合林業(yè)行業(yè)豐富的科學(xué)數(shù)據(jù)和信息資源,構(gòu)建了林業(yè)科技大數(shù)據(jù)知識服務(wù)平臺,為林業(yè)科技創(chuàng)新和轉(zhuǎn)型升級提供了信息支持,取得了一定成效。未來林業(yè)知識服務(wù)的主要任務(wù)和前景主要體現(xiàn)在以下幾個(gè)方面:
(1)推進(jìn)林業(yè)科學(xué)數(shù)據(jù)資源開放共享
加強(qiáng)林業(yè)基礎(chǔ)數(shù)據(jù)的采集和整合,建設(shè)林業(yè)基礎(chǔ)知識庫系統(tǒng),推進(jìn)林業(yè)科學(xué)數(shù)據(jù)資源的開放共享。建立國家林業(yè)科技報(bào)告制度,匯集國家林業(yè)科學(xué)研究過程中的各類科學(xué)數(shù)據(jù)和科研報(bào)告,形成統(tǒng)一匯交和整合服務(wù)平臺,保持科研工作的連續(xù)性。探索開展基于大數(shù)據(jù)的用戶行為分析研究工作。
(2)建設(shè)國家林業(yè)科技信息共享平臺
以高效服務(wù)科技創(chuàng)新和現(xiàn)代林業(yè)建設(shè)為目標(biāo),運(yùn)用現(xiàn)代信息技術(shù)優(yōu)化林業(yè)科技信息管理與服務(wù)平臺,整合林業(yè)行業(yè)高等院校、科研院所的各類文獻(xiàn)和數(shù)字資源,建設(shè)數(shù)字化、網(wǎng)絡(luò)化、智能化和可視化的國家林業(yè)科技信息共享平臺,促進(jìn)林業(yè)科技信息資源的合理配置、開放共享和高效利用。建立以科研用戶為中心、面向全國林業(yè)行業(yè)的數(shù)字資源網(wǎng)絡(luò)服務(wù)體系,提供面向科研一線的林業(yè)數(shù)字資源保障與服務(wù),面向個(gè)性化需求的分布式知識化信息服務(wù),實(shí)現(xiàn)國外80%、國內(nèi)95%以上各類林業(yè)科技文獻(xiàn)資源的數(shù)字化共享,提高林業(yè)行業(yè)的科技文獻(xiàn)保障和信息服務(wù)水平。
(3)建設(shè)國家林業(yè)科技成果轉(zhuǎn)化應(yīng)用平臺
篩選優(yōu)秀林業(yè)科技成果、林業(yè)專利和授權(quán)林業(yè)植物新品種,建立林業(yè)科技成果轉(zhuǎn)化應(yīng)用項(xiàng)目庫,建成國家林業(yè)科技成果和知識產(chǎn)權(quán)交易服務(wù)平臺,實(shí)現(xiàn)供需對接,項(xiàng)目評估和動態(tài)交易,提高林業(yè)科技成果的轉(zhuǎn)化運(yùn)用能力和水平,推動林業(yè)產(chǎn)業(yè)轉(zhuǎn)型升級。
在大數(shù)據(jù)和人工智能技術(shù)的驅(qū)動下,知識服務(wù)將更加注重與用戶潛在需求之間的智能響應(yīng),將以更智慧的方式進(jìn)行知識傳播和決策服務(wù)。以林業(yè)專業(yè)知識服務(wù)平臺為基礎(chǔ),我們將不斷推動林業(yè)科技大數(shù)據(jù)整合和知識服務(wù)創(chuàng)新,全面推動知識服務(wù)與科技創(chuàng)新的深度融合,推動知識服務(wù)向智能化、便捷化、個(gè)性化和多樣化發(fā)展。