- 相關(guān)推薦
面向?qū)@碾娮有畔a(chǎn)品TBT預(yù)警研究論文
摘 要:本文面向?qū)@M(jìn)行文本挖掘,通過(guò)主題詞抽取確定技術(shù)熱點(diǎn)及其技術(shù)發(fā)展趨勢(shì),通過(guò)技術(shù)發(fā)展趨勢(shì)進(jìn)行TBT預(yù)警,通過(guò)實(shí)例驗(yàn)證說(shuō)明是一種有效地TBT預(yù)警方法,也是文本挖掘技術(shù)在TBT預(yù)警領(lǐng)域的補(bǔ)充和擴(kuò)展。
關(guān)鍵詞:專利 文本挖掘 TBT預(yù)警
根據(jù)世界知識(shí)產(chǎn)權(quán)組織(WIPO)的統(tǒng)計(jì),90%~95%的研發(fā)成果包含在專利文獻(xiàn)中,專利文獻(xiàn)公開的技術(shù)有80%以上未出現(xiàn)在其他技術(shù)文獻(xiàn)中,全世界90%以上的發(fā)明創(chuàng)造信息都是首先通過(guò)專利文獻(xiàn)反映出來(lái)。專利作為技術(shù)信息最有效的載體,囊括了全球90%以上的最新技術(shù)情報(bào),相比一般技術(shù)刊物所提供的信息早5年~6年,而且內(nèi)容翔實(shí)準(zhǔn)確。技術(shù)標(biāo)準(zhǔn)化存在的一個(gè)現(xiàn)象是,技術(shù)標(biāo)準(zhǔn)越來(lái)越與專利技術(shù)聯(lián)系在一起,專利被不斷包容進(jìn)技術(shù)標(biāo)準(zhǔn)中,這無(wú)論是在作為正式標(biāo)準(zhǔn)的法定標(biāo)準(zhǔn)還是事實(shí)標(biāo)準(zhǔn)都是如此。專利文本挖掘就是利用文本挖掘技術(shù)從特定領(lǐng)域的專利中發(fā)現(xiàn)潛在的、合理的、對(duì)決策有價(jià)值的知識(shí)。
一、專利文本挖掘在TBT預(yù)警中的應(yīng)用
文本挖掘是利用一系列的數(shù)據(jù)挖掘技術(shù),從大量的無(wú)結(jié)構(gòu)的文本數(shù)據(jù)中發(fā)現(xiàn)潛在的、可能的數(shù)據(jù)模式及內(nèi)在聯(lián)系,獲得對(duì)用戶有價(jià)值的知識(shí)。文本挖掘在生物醫(yī)學(xué)、郵件過(guò)濾、專利分析,輿情監(jiān)測(cè)等領(lǐng)域有廣泛的應(yīng)用研究。本文利用文本挖掘技術(shù)對(duì)進(jìn)口國(guó)專利進(jìn)行分析,及時(shí)發(fā)現(xiàn)進(jìn)口國(guó)技術(shù)的動(dòng)向,是TBT預(yù)警中的有效方法。
二、專利文本挖掘TBT預(yù)警過(guò)程
面向?qū)@奈谋就诰蚣蠢梦谋就诰蚣夹g(shù)的對(duì)大量的專利進(jìn)行分析,從而獲得潛在的、可能的數(shù)據(jù)模式及內(nèi)在聯(lián)系,獲得對(duì)用戶有價(jià)值的知識(shí)。本文運(yùn)用Text Mining for Clementine對(duì)收集到的大量專利文獻(xiàn)進(jìn)行文本挖掘,基本步驟如下:
1.專利數(shù)據(jù)收集、篩選:專利數(shù)據(jù)收集是根據(jù)具體的需求從原始專利數(shù)據(jù)庫(kù)中抽取并匯總成與文本挖掘任務(wù)有關(guān)的源文本數(shù)據(jù)的過(guò)程。根據(jù)本文的實(shí)際需要,確定專利檢索地區(qū)、申請(qǐng)區(qū)間。選定進(jìn)口國(guó)比較有權(quán)威性的專利庫(kù)作為數(shù)據(jù)收集的來(lái)源。
2.主題詞抽取:用Text Mining for Clementine中的Text Extraction node抽取專利文獻(xiàn)的主題詞,以含有該主題詞的專利數(shù)量排序,這樣可以清晰顯示哪些主題詞在專利文檔中占的比例最高。
3.技術(shù)熱點(diǎn)確定:主題詞在專利文檔中所占的百分比作為技術(shù)熱度,技術(shù)熱度越高,則設(shè)置技術(shù)性貿(mào)易壁壘的可能性越大。
4.技術(shù)趨勢(shì)分析:將各個(gè)時(shí)間點(diǎn)的技術(shù)熱度放在時(shí)間軸上分析其變化趨勢(shì),依此來(lái)預(yù)測(cè)將來(lái)的關(guān)注度變化,如果持續(xù)走高,則可認(rèn)為必然會(huì)成為新的技術(shù)性貿(mào)易壁壘,做出預(yù)警。
三、以美國(guó)專利文獻(xiàn)數(shù)據(jù)庫(kù)為例進(jìn)行專利文本挖掘
1.專利信息收集
選定具有權(quán)威性的USPTO Patent Databases(美國(guó)專利商標(biāo)局USPTO網(wǎng)上專利文獻(xiàn)數(shù)據(jù)庫(kù))作為數(shù)據(jù)源,收集2007年1月至12月的關(guān)于電子信息產(chǎn)品的所有專利,本文通過(guò)對(duì)2007年各個(gè)月份的專利文獻(xiàn)進(jìn)行文本挖掘,確定電子信息產(chǎn)品領(lǐng)域技術(shù)熱點(diǎn),得出技術(shù)趨勢(shì)圖,根據(jù)技術(shù)發(fā)展趨勢(shì)的走向判斷實(shí)施TBT可能性,以2007年1月的專利文獻(xiàn)為例進(jìn)行挖掘。
2.主題詞抽取
利用Text Mining for Clementine中的Text Extraction node對(duì)2007年1月的關(guān)于電子信息產(chǎn)品專利進(jìn)行主題詞抽取,結(jié)果如圖1所示,在2007年1月,關(guān)于計(jì)算機(jī)類產(chǎn)品、電子設(shè)備類產(chǎn)品、通訊類產(chǎn)品的專利分別約占總數(shù)的55.36%、39.88%、10.12%,關(guān)于能量問(wèn)題、噪聲問(wèn)題的專利分別約占總數(shù)的13.10%、13.10%,說(shuō)明在未來(lái)時(shí)期,設(shè)置技術(shù)性貿(mào)易壁壘的可能性比較大,應(yīng)該通知相關(guān)企業(yè)密切關(guān)注。
3.技術(shù)熱點(diǎn)確定
通過(guò)以上分析,根據(jù)主題詞在文檔中所占的百分比即為技術(shù)熱度,可確定2007年1月技術(shù)熱點(diǎn)涉及計(jì)算機(jī)類產(chǎn)品、電子設(shè)備類產(chǎn)品、通訊類產(chǎn)品、能量問(wèn)題和噪聲問(wèn)題。
4.技術(shù)變化趨勢(shì)分析
按照以上步驟對(duì)2007年后11個(gè)月的數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)computer 、energy和noise為共有的主題詞,將這12個(gè)月的技術(shù)熱點(diǎn)進(jìn)行統(tǒng)計(jì)分析。
5.TBT警情分析
將各個(gè)時(shí)間點(diǎn)的熱點(diǎn)技術(shù)關(guān)注度放在時(shí)間軸上分析其變化趨勢(shì),依此來(lái)預(yù)測(cè)將來(lái)的關(guān)注度變化,如果持續(xù)走高,則可認(rèn)為必然會(huì)成為新的技術(shù)性貿(mào)易壁壘。
從計(jì)算機(jī)類產(chǎn)品、energy和noise的技術(shù)趨勢(shì)圖可以看出,在2007年12個(gè)月中,關(guān)于計(jì)算機(jī)類產(chǎn)品、energy和noise的技術(shù)一直在增長(zhǎng),相關(guān)的專利技術(shù)比較多,持續(xù)的時(shí)間長(zhǎng),可預(yù)見在未來(lái)相當(dāng)長(zhǎng)的時(shí)間內(nèi),計(jì)算機(jī)類產(chǎn)品、energy和noise的相關(guān)技術(shù)備受關(guān)注,認(rèn)為其可能會(huì)成為新的技術(shù)性貿(mào)易壁壘標(biāo)準(zhǔn)。根據(jù)以上分析,向計(jì)算機(jī)產(chǎn)品企業(yè)發(fā)送預(yù)警信息。認(rèn)為電子信息產(chǎn)品能耗方面和噪聲方面會(huì)成為新的技術(shù)性貿(mào)易壁壘標(biāo)準(zhǔn),對(duì)電子信息產(chǎn)品能效標(biāo)準(zhǔn)提出新的要求。
參考文獻(xiàn):
[1]劉玉琴 汪雪鋒:基于文本挖掘技術(shù)的專利質(zhì)量評(píng)價(jià)與實(shí)證研究[J].2007
[2]翟東升 王明吉:專利地圖在技術(shù)性貿(mào)易壁壘預(yù)警中的應(yīng)用.圖書與情報(bào),2006(1)
[3]馮曉青:企業(yè)技術(shù)標(biāo)準(zhǔn)與專利戰(zhàn)略研究[J]. 科學(xué)管理研究,2007(4)
[4]Yuen-Hsien Tseng Chi-Jen Lin Yu-i Lin:Text mining techniques for patent analysis[J].Information Processing and Management,2007
【面向?qū)@碾娮有畔a(chǎn)品TBT預(yù)警研究論文】相關(guān)文章:
面向產(chǎn)品的供給鏈本錢核算體系構(gòu)建研究10-21
面向產(chǎn)品創(chuàng)新的供給鏈性能評(píng)價(jià)體系研究06-24
電子信息安全交換研究論文05-27
旅行社產(chǎn)品的不可專利性及其對(duì)策研究07-08
面向旅游產(chǎn)品開發(fā)的旅行社供應(yīng)商管理研究06-26
新型電子信息標(biāo)志系統(tǒng)的開發(fā)研究論文06-23
電子信息加密保存與運(yùn)行維護(hù)研究論文09-29