初探電子商務(wù)在大數(shù)據(jù)時代下的數(shù)據(jù)管理論文
大數(shù)據(jù)時代的到來改變了人們對數(shù)據(jù)的認(rèn)識和態(tài)度,電子商務(wù)作為大數(shù)據(jù)產(chǎn)生的主要來源之一,其發(fā)展?fàn)顟B(tài)及趨勢越來越被人們所關(guān)注。電子商務(wù)數(shù)據(jù)每年增長約60%,但數(shù)據(jù)利用卻不足5%,人們迫切希望通過數(shù)據(jù)的力量來解決一些發(fā)展道路上遇到的瓶頸問題。數(shù)據(jù)的價值逐漸被人們所重視,數(shù)據(jù)的客觀性、真實(shí)性、可靠性為電子商務(wù)的數(shù)據(jù)服務(wù)提供了堅實(shí)的“物質(zhì)基礎(chǔ)”,繼而發(fā)展成為一種產(chǎn)業(yè)。那么大數(shù)據(jù)時代進(jìn)行數(shù)據(jù)存儲方式、讀取方式、分析方式的創(chuàng)新以及增加數(shù)據(jù)服務(wù)模式已經(jīng)成為大勢所趨,本文正是對上述問題進(jìn)行初步研究。
一、數(shù)據(jù)存儲方式
隨著Web2.0時代的到來,傳統(tǒng)的數(shù)據(jù)存儲模式已經(jīng)不能夠應(yīng)付規(guī)模龐大的數(shù)據(jù)流。存儲設(shè)備的成本增加,數(shù)據(jù)洪期的不預(yù)定型,結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)混雜等因素讓存儲不得不做出徹底的變革。
為了減少存儲成本,提高存儲容量和存儲空間利用率,人們利用虛擬化技術(shù)對存儲設(shè)備進(jìn)行改造,將所有存儲空間作為一個資源池,可以自由的配置存儲設(shè)備空間。虛擬化技術(shù)主要利用軟件實(shí)現(xiàn)對存儲資源的控制,根據(jù)實(shí)際需要可以將軟件安裝在相應(yīng)的硬件設(shè)備之上。為提高一些性能較為低下的設(shè)備利用率,可以通過網(wǎng)絡(luò)將這些設(shè)備連接起來,作為數(shù)據(jù)存儲的載體。例如San系統(tǒng),集群系統(tǒng)。San系統(tǒng)與集群系統(tǒng)都可以實(shí)現(xiàn)數(shù)據(jù)共享和訪問,并可以對存儲空間進(jìn)行自由的擴(kuò)展,但是San系統(tǒng)可以支持不同客戶端的操作系統(tǒng),擴(kuò)展范圍更加廣泛,運(yùn)用更加靈活。
San網(wǎng)絡(luò)存儲由服務(wù)器、存儲、互連組成,利用光纖通道實(shí)現(xiàn)對存儲設(shè)備的管理,既可以實(shí)現(xiàn)服務(wù)器到存儲的數(shù)據(jù)傳輸,也可以實(shí)現(xiàn)服務(wù)器到服務(wù)器的數(shù)據(jù)通信。San網(wǎng)絡(luò)采用雙環(huán)方式及數(shù)據(jù)遠(yuǎn)程備份,增加了數(shù)據(jù)安全性。San對于磁盤進(jìn)行虛擬化,可以讓磁盤同步存儲數(shù)據(jù),加速了磁盤讀/寫操作的效率。
二、數(shù)據(jù)讀取方式
現(xiàn)階段,電子商務(wù)的數(shù)據(jù)存儲方式大多依靠廣泛使用的關(guān)系型數(shù)據(jù)庫。關(guān)系型數(shù)據(jù)庫采用關(guān)系模型,在結(jié)構(gòu)上更容易理解,而其使用的數(shù)據(jù)庫操作語言SQL也廣泛被人們所接受。由于其對數(shù)據(jù)類型等多方面的嚴(yán)謹(jǐn)性,減少了使得數(shù)據(jù)庫的維護(hù)量,提高了數(shù)據(jù)管理效率。
然而,隨著電子商務(wù)的飛速發(fā)展,數(shù)據(jù)量的'巨增,給關(guān)系數(shù)據(jù)庫的I/O端口造成了很大的壓力。其次,在對數(shù)據(jù)的查詢操作上,尤其是一些大表的嵌套查詢,效率非常低。由于龐大的數(shù)據(jù)量,對數(shù)據(jù)庫的維護(hù)造成了一定影響,數(shù)據(jù)庫無法動態(tài)擴(kuò)展其存儲空間及提高其負(fù)載能力。數(shù)據(jù)庫升級和往往要進(jìn)行停機(jī)維護(hù),導(dǎo)致業(yè)務(wù)的中斷。
近年來,非關(guān)系型數(shù)據(jù)庫及分布式存儲的出現(xiàn)可以解決傳統(tǒng)關(guān)系型數(shù)據(jù)庫存在的問題。NoSQL數(shù)據(jù)庫是為了解決大規(guī)模數(shù)據(jù)集的管理,包括對數(shù)據(jù)的存儲及并發(fā)控制。而數(shù)據(jù)的多樣化,非結(jié)構(gòu)化等難題,給大數(shù)據(jù)處理及分析帶來了挑戰(zhàn)。現(xiàn)在NoSQL類型有很多,且各自擁有各自的技術(shù)優(yōu)勢,數(shù)據(jù)管理者要結(jié)合自己的需求選擇好合適的NoSQL數(shù)據(jù)庫,才能體現(xiàn)非關(guān)系型數(shù)據(jù)庫具備的優(yōu)勢。NoSQL數(shù)據(jù)庫主要分為:鍵值存儲數(shù)據(jù)庫,列存儲數(shù)據(jù)庫,文檔型數(shù)據(jù)庫,圖形數(shù)據(jù)庫等。NoSQL數(shù)據(jù)庫并沒有一個統(tǒng)一的架構(gòu),兩種NoSQL數(shù)據(jù)庫之間的不同,甚至遠(yuǎn)遠(yuǎn)超過兩種關(guān)系型數(shù)據(jù)庫的不同。NoSQL沒有高低之分,只能合理地使用NoSQL到適合的場合,才能充分發(fā)揮NoSQL的優(yōu)勢。
現(xiàn)在比較常用的NoSQL數(shù)據(jù)庫主要是Redis,Leveldb, Mongodb,HBase。HBase作為Hadoop的子項(xiàng)目,適合于非結(jié)構(gòu)化的數(shù)據(jù)存儲。HBase的一大特點(diǎn)是基于列的模式,這樣可以增強(qiáng)數(shù)據(jù)庫的擴(kuò)展性,提高數(shù)據(jù)庫的存儲效率。而且,HBase作為分布式數(shù)據(jù)庫可以在廉價服務(wù)器上搭建起規(guī)模龐大且結(jié)構(gòu)化的存儲集群。
三、數(shù)據(jù)分析方式
大數(shù)據(jù)時代下,人們對數(shù)據(jù)的態(tài)度有了很大改變,對數(shù)據(jù)的研究由追尋因果向數(shù)據(jù)相關(guān)性轉(zhuǎn)變。然而,對于電子商務(wù)來說,需求關(guān)系的分析是電商市場一個重要因素,仍然不可或缺。電子商務(wù)數(shù)據(jù)包含了客戶的基本信息、消費(fèi)信息、商家的產(chǎn)品信息、金融交易信息等結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)。對電子商務(wù)數(shù)據(jù)的分析可分為幾個方面:
(1)流量數(shù)據(jù)分析,包含了對電子商務(wù)網(wǎng)站的流量,點(diǎn)擊率等數(shù)據(jù)的分析。流量的大小可以反映商品的推廣程度,但是,為檢測一些為提高點(diǎn)擊率的惡意、虛假行為,需要對流量來源等數(shù)據(jù)進(jìn)行分析,確保點(diǎn)擊率能真實(shí)反映產(chǎn)品推廣程度。網(wǎng)站到達(dá)率,二跳率,pv/ip值等數(shù)據(jù)都可反映商品宣傳的效果。
(2)網(wǎng)站數(shù)據(jù)分析,網(wǎng)站數(shù)據(jù)最能直接反映商品推廣效率,商品質(zhì)量及商品銷售情況等重要信息。各式各樣的電商產(chǎn)品琳瑯滿目,客戶往往會陷入難以抉擇的尷尬局面,難以達(dá)成交易。通過對網(wǎng)站數(shù)據(jù)的分析,可以更好的了解客戶的真實(shí)需求和偏好,并制定相應(yīng)的營銷策略,更好的將商品推銷至客戶。
(3)信用數(shù)據(jù)分析,無論是客戶還是商家,信用都代表了其交易的真誠度和可靠性。信用主要以交易量及交易評價作為依據(jù)。面對日益競爭激烈的電商市場,商家為了提高自身的銷售額,難免采用一些不正當(dāng)手段,通過構(gòu)造虛假評論信息來提升自己和打擊對手。通過對評價數(shù)據(jù)的分析,可以判斷其評價的真實(shí)性,避免了一些商家通過炒作來提高自身信用和客戶惡意評價等行為帶來的影響。
四、數(shù)據(jù)服務(wù)模式
大數(shù)據(jù)時代下,數(shù)據(jù)分析所利用的數(shù)據(jù)不再是通過簡單的抽樣得到的樣本,而是要將整體數(shù)據(jù)作為分析來源。以大數(shù)據(jù)的分析手段,得到分析結(jié)果。盡管相較于傳統(tǒng)方法,大數(shù)據(jù)分析需要消耗更多的時間和資源,然而,往往一些孤僻、異常的數(shù)據(jù)才是問題出現(xiàn)的根本原因,而原有的抽樣方式很有可能將此類數(shù)據(jù)遺漏,影響到最終的分析結(jié)果。
通常,數(shù)據(jù)服務(wù)提供可視化界面,展現(xiàn)數(shù)據(jù)的統(tǒng)計分析結(jié)果。對于大數(shù)據(jù)的統(tǒng)計分析,需要呈現(xiàn)出更多,更廣的事務(wù)特征。例如,某些電商推出的十年賬單查詢服務(wù),引起了社會廣泛的反響。如今,隨著大數(shù)據(jù)分析技術(shù)的革新,數(shù)據(jù)服務(wù)模式也在不斷增加,大數(shù)據(jù)輔助決策和預(yù)測事物發(fā)展的特點(diǎn)引發(fā)了人們利用數(shù)據(jù)來研究事物發(fā)展規(guī)律的極大興趣,使得研究結(jié)果更具有客觀性和可靠性。
【初探電子商務(wù)在大數(shù)據(jù)時代下的數(shù)據(jù)管理論文】相關(guān)文章:
3.大數(shù)據(jù)時代下我國審計行業(yè)的發(fā)展論文
4.管理會計在大數(shù)據(jù)時代的發(fā)展論文
5.電子商務(wù)下的國際貿(mào)易創(chuàng)新初探論文
6.Web數(shù)據(jù)挖掘在電子商務(wù)的應(yīng)用論文