- Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究 推薦度:
- 相關(guān)推薦
Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用.
[摘要] 電子商務(wù)網(wǎng)站天天都會(huì)產(chǎn)生大量的數(shù)據(jù),運(yùn)用數(shù)據(jù)挖掘技術(shù)可以從這些數(shù)據(jù)中發(fā)現(xiàn)對(duì)市場(chǎng)分析及猜測(cè)非常有益的信息。本文討論了Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用。[關(guān)鍵詞] 數(shù)據(jù)挖掘Web數(shù)據(jù)挖掘電子商務(wù)
網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫(kù)技術(shù)飛速發(fā)展,電子商務(wù)顯示出越來(lái)越強(qiáng)大的生命力,同時(shí)各種基于互聯(lián)網(wǎng)的貿(mào)易Web站點(diǎn)也面臨越來(lái)越激烈的競(jìng)爭(zhēng)。如何了解到顧客盡可能多的愛(ài)好和價(jià)值取向,為顧客提供更優(yōu)質(zhì)的服務(wù)成為電子商務(wù)發(fā)展迫切要解決的題目。而電子商務(wù)網(wǎng)站的顧客在Web上的行為都會(huì)產(chǎn)生大量數(shù)據(jù)信息,不僅包括本次交易信息而且還有利用搜索引擎,以及在站點(diǎn)內(nèi)進(jìn)行瀏覽的相關(guān)數(shù)據(jù)。利用數(shù)據(jù)挖掘技術(shù)可以有效地幫助企業(yè)分析這些數(shù)據(jù),優(yōu)化Web站點(diǎn)拓?fù)浣Y(jié)構(gòu),指導(dǎo)企業(yè)調(diào)整營(yíng)銷策略,給客戶提供動(dòng)態(tài)的個(gè)性化的高效率服務(wù)。
一、Web數(shù)據(jù)挖掘
Web數(shù)據(jù)挖掘(Web Data Mining),是數(shù)據(jù)挖掘技術(shù)在Web環(huán)境下的應(yīng)用,是從大量的Web文檔集合和在站點(diǎn)內(nèi)進(jìn)行瀏覽的相關(guān)數(shù)據(jù)中發(fā)現(xiàn)潛伏的、有用的模式或信息。它是一項(xiàng)綜合技術(shù),涉及到Internet技術(shù)、人工智能、計(jì)算機(jī)語(yǔ)言學(xué)、信息學(xué)、統(tǒng)計(jì)學(xué)等多個(gè)領(lǐng)域。對(duì)應(yīng)于不同的Web數(shù)據(jù),Web挖掘也分成三類:Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘和Web使用模式挖掘。
Web使用模式挖掘(Web Usage Mining)是對(duì)用戶訪問(wèn)Web時(shí)在服務(wù)器方留下的訪問(wèn)記錄進(jìn)行挖掘,它通過(guò)挖掘Web日志文件及客戶交易數(shù)據(jù)來(lái)發(fā)現(xiàn)有意義的用戶訪問(wèn)模式和相關(guān)的潛伏用戶群。其主要特點(diǎn)是對(duì)用戶信息數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助貿(mào)易決策的關(guān)鍵性數(shù)據(jù)。
盡管Web挖掘的形式和研究方向?qū)映霾桓F,但隨著電子商務(wù)的興起和迅猛發(fā)展,Web挖掘的一個(gè)重要應(yīng)用方向?qū)⑹请娮由虅?wù)系統(tǒng)。電子商務(wù)是數(shù)據(jù)挖掘技術(shù)最恰當(dāng)?shù)膽?yīng)用領(lǐng)域,由于電子商務(wù)可以很輕易滿足數(shù)據(jù)挖掘所必須的因素:豐富的數(shù)據(jù)源、自動(dòng)收集的可靠數(shù)據(jù),并且可將挖掘的結(jié)果轉(zhuǎn)化成貿(mào)易行為,貿(mào)易投資可以及時(shí)評(píng)價(jià)。其中與電子商務(wù)關(guān)系最為密切的是Web使用模式挖掘。
二、電子商務(wù)中Web挖掘的數(shù)據(jù)源
在Web上可以用來(lái)作為數(shù)據(jù)挖掘分析的數(shù)據(jù)量比較大,而且類型眾多,總結(jié)起來(lái)有以下幾種類型的數(shù)據(jù)可用于Web數(shù)據(jù)挖掘技術(shù)產(chǎn)生各種知識(shí)模式。
1.服務(wù)器數(shù)據(jù)
客戶訪問(wèn)站點(diǎn)時(shí)會(huì)在Web服務(wù)器上留下相應(yīng)的日志數(shù)據(jù),這些日志數(shù)據(jù)通常以文本文件的形式存儲(chǔ)在服務(wù)器上。一般包括sever logs、error logs、cookie logs等。
2.查詢數(shù)據(jù)
它是電子商務(wù)站點(diǎn)在服務(wù)器上產(chǎn)生的一種典型數(shù)據(jù)。例如,對(duì)于在線客戶也許會(huì)搜索一些產(chǎn)品或某些廣告信息,這些查詢信息就通過(guò)cookie或是登記信息連接到服務(wù)器的訪問(wèn)日志上。
3.在線市場(chǎng)數(shù)據(jù)
這類數(shù)據(jù)主要是傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)里存儲(chǔ)的有關(guān)電子商務(wù)站點(diǎn)信息、用戶購(gòu)買信息、商品信息等數(shù)據(jù)。
4.Web頁(yè)面
主要是指HTLM和XML頁(yè)面的內(nèi)容,包括本文、圖片、語(yǔ)音、圖像等。
5.Web頁(yè)面超級(jí)鏈接關(guān)系
主要是指頁(yè)面之間存在的超級(jí)鏈接關(guān)系,這也是一種重要的資源。
6.客戶登記信息
客戶登記信息是指客戶通過(guò)Web頁(yè)輸進(jìn)的、要提交給服務(wù)器的相關(guān)用戶信息,這些信息通常是關(guān)于用戶的人口特征。在Web的數(shù)據(jù)挖掘中,客戶登記信息需要和訪問(wèn)日志集成,以進(jìn)步數(shù)據(jù)挖掘的正確度,使之能更進(jìn)一步的了解客戶。
三、Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用
利用Web數(shù)據(jù)挖掘技術(shù)可以在站點(diǎn)上挖掘出來(lái)的知識(shí)模式有以下幾個(gè):路徑分析、關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)、序列模式的發(fā)現(xiàn)、分類規(guī)則的發(fā)現(xiàn)、聚類分析等。Web數(shù)據(jù)挖掘在電子商務(wù)中的具體應(yīng)用有以下幾點(diǎn):
1.發(fā)現(xiàn)潛伏客戶
用戶在網(wǎng)站上的瀏覽行為反映了用戶的愛(ài)好和購(gòu)買意向。對(duì)一個(gè)電子商務(wù)網(wǎng)站來(lái)說(shuō),了解、關(guān)注在冊(cè)客戶群體非常重要,但從眾多的訪問(wèn)者中發(fā)現(xiàn)潛伏客戶群體也同樣非常關(guān)鍵。假如發(fā)現(xiàn)某些客戶為潛伏客戶群體,就可以對(duì)這類客戶實(shí)施一定的策略使他們盡快成為在冊(cè)客戶群體。對(duì)一個(gè)電子商務(wù)網(wǎng)站來(lái)說(shuō)也許就意味著訂單數(shù)的增多、效益的增加。
2.提供優(yōu)質(zhì)個(gè)性化服務(wù),進(jìn)步客戶忠誠(chéng)度
在電子商務(wù)中,傳統(tǒng)客戶與銷售商之間的空間間隔對(duì)客戶來(lái)說(shuō)己經(jīng)不復(fù)存在,客戶從一個(gè)電子商務(wù)網(wǎng)站轉(zhuǎn)換到競(jìng)爭(zhēng)對(duì)手那邊,只需點(diǎn)擊幾下鼠標(biāo)即可。網(wǎng)站的內(nèi)容和層次、用詞、標(biāo)題、獎(jiǎng)勵(lì)方案、服務(wù)等任何一個(gè)地方都有可能成為吸引客戶、同時(shí)也可能成為失往客戶的因素。通過(guò)對(duì)客戶訪問(wèn)信息的挖掘,就能知道客戶的瀏覽行為,從而識(shí)別用戶的忠實(shí)度、喜好、滿足度,了解客戶的愛(ài)好及需求,動(dòng)態(tài)地調(diào)整Web頁(yè)面以滿足客戶的需要。在Internet上的電子商務(wù)中一個(gè)典型的序列,恰好就代表了一個(gè)購(gòu)物者以頁(yè)面形式在站點(diǎn)上導(dǎo)航的行為,所以可運(yùn)用數(shù)據(jù)挖掘中的序列模式發(fā)現(xiàn)技術(shù)進(jìn)行挖掘。
3.改進(jìn)站點(diǎn)設(shè)計(jì)
對(duì)Web站點(diǎn)的鏈接結(jié)構(gòu)的優(yōu)化可從三方面來(lái)考慮:
(1)通過(guò)對(duì)Web Log的挖掘,發(fā)現(xiàn)用戶訪問(wèn)頁(yè)面的相關(guān)性,從而對(duì)密切聯(lián)系的網(wǎng)頁(yè)之間增加鏈接,方便用戶使用。
(2)利用路徑分析技術(shù)判定在一個(gè)Web站點(diǎn)中最頻繁的訪問(wèn)路徑,可以考慮把重要的商品信息放在這些頁(yè)面中,改進(jìn)頁(yè)面和網(wǎng)站結(jié)構(gòu)的設(shè)計(jì),增強(qiáng)對(duì)客戶的吸引力,進(jìn)步銷售量。
(3)通過(guò)對(duì)Web Log的挖掘,發(fā)現(xiàn)用戶的期看位置。假如在期看位置的訪問(wèn)頻率高于對(duì)實(shí)際位置的訪問(wèn)頻率,可考慮在期看位置和實(shí)際位置之間建立導(dǎo)航鏈接,從而實(shí)現(xiàn)對(duì)Web站點(diǎn)結(jié)構(gòu)的優(yōu)化。
4.聚類客戶
很多企業(yè)都對(duì)企業(yè)的客戶、市場(chǎng)、銷售、服務(wù)與支持信息進(jìn)行深層次發(fā)掘和分析,對(duì)客戶價(jià)值進(jìn)行分類,發(fā)現(xiàn)新的市場(chǎng)機(jī)會(huì),增加收進(jìn)和利潤(rùn)。在電子商務(wù)中客戶聚類是一個(gè)重要的方面。通過(guò)分組具有相似瀏覽行為的客戶并分析組中客戶的共同特征,可以幫助電子商務(wù)的組織者更好地了解自己的客戶,及時(shí)調(diào)整頁(yè)面及頁(yè)面內(nèi)容使商務(wù)活動(dòng)能夠在一定程度上滿足客戶的要求,向客戶提供更適合、更面向客戶的服務(wù),使商務(wù)活動(dòng)對(duì)客戶和銷售商來(lái)說(shuō)更具意義。
四、結(jié)束語(yǔ)
運(yùn)用Web數(shù)據(jù)挖掘技術(shù)對(duì)電子商務(wù)網(wǎng)站上的各種數(shù)據(jù)源進(jìn)行挖掘,發(fā)現(xiàn)相關(guān)的一些知識(shí)模式,可以指導(dǎo)企業(yè)更好地運(yùn)作站點(diǎn)和向客戶提供更優(yōu)質(zhì)的個(gè)性化的服務(wù),有效進(jìn)步貿(mào)易站點(diǎn)的競(jìng)爭(zhēng)力。
【Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用.】相關(guān)文章:
Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究03-07
Web結(jié)構(gòu)挖掘在電子商務(wù)網(wǎng)站結(jié)構(gòu)優(yōu)化中的應(yīng)用03-21
數(shù)據(jù)挖掘在旅游電子商務(wù)中應(yīng)用論文11-28
談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用03-21
Web 2.0技術(shù)在電子商務(wù)中的應(yīng)用03-21
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站中的應(yīng)用03-28
數(shù)據(jù)挖掘在CRM中的應(yīng)用分析03-22