談?wù)劵谥С窒蛄繖C(jī)集成的電子商務(wù)環(huán)境下客戶信用評估模型
導(dǎo)語:隨著我國電子商務(wù)行業(yè)發(fā)展腳步的不斷加快,對客戶信用的評估也引起了企業(yè)的高度重視,其不僅關(guān)系著電子商務(wù)活動的順利開展,而且對企業(yè)可持續(xù)發(fā)展目標(biāo)的實現(xiàn)也具有重要意義。
在電子商務(wù)飛速發(fā)展的今天,參與到電子商務(wù)活動中的人也越來越多。為了能夠給電子商務(wù)活動的開展?fàn)I造一個良好的氛圍,國家相關(guān)部門對與電子商務(wù)相關(guān)的配套設(shè)施和法律法規(guī)等進(jìn)行了不斷優(yōu)化與完善,但由于執(zhí)行力度不夠,從而導(dǎo)致仍有很多問題制約了電子商務(wù)的發(fā)展,信用問題就是其中最主要的一項。通過對基于支持向量機(jī)集成的電子商務(wù)環(huán)境下客戶信用評估模型的研究,可以為日后電子商務(wù)客戶信用的評價工作提供一定的參考依據(jù),進(jìn)而更好的促進(jìn)我國電子商務(wù)行業(yè)的可持續(xù)發(fā)展。
1 基于模糊積分支持向量機(jī)集成
1.1 Bagging個體生成
Bagging個體生成主要是以可重復(fù)采樣為基礎(chǔ),對訓(xùn)練集的`選取通常是在原始訓(xùn)練集中隨機(jī)抽取產(chǎn)生的,訓(xùn)練集的規(guī)模與原始訓(xùn)練集相當(dāng),訓(xùn)練集允許重復(fù)選取。這樣一來,同一示例就會在不同的訓(xùn)練集中出現(xiàn),同樣也會有一部分示例沒有出現(xiàn)的情況。隨著訓(xùn)練集選取內(nèi)容的不斷增加,Bagging分類器集成的差異度也會隨之增加,從而促進(jìn)了泛化能力的進(jìn)一步提升。
1.2 基于模糊積分的結(jié)論生成
模糊積分基本理論是基于支持向量機(jī)集成的客戶信用評價模型的基本理論。所謂模糊積分理論,主要指的是設(shè)X為一有限集合,若集合函數(shù)g:2X→[0,1]滿足g(X)=1、g(A)≤g(B),那么我們便將g視為一個模糊測度。如果g在滿足上述條件的基礎(chǔ)上,還滿足等式g(AUB)=g(A)+g(B)+λg(A)g(B),那么我們就將其稱為測度或Sugeno,記為gλ。在模糊積分理論下,對模糊積分的計算,首先需要明確模糊密度。通常情況下,模糊密度的產(chǎn)生是由專家設(shè)定的,也可以通過訓(xùn)練數(shù)據(jù)產(chǎn)生。
2 模糊密度確定方法
通過模糊積分理論的介紹我們能夠看出,在基于模糊積分的多分類集成中,對于各個子支持向量分類器重要性的模糊密度值的確定是非常重要的。鑒于此,本文采用混淆矩陣的方法來對評估模型中所涉及的模糊密度值進(jìn)行確定,用子分類器各自的訓(xùn)練集對各個子分類器進(jìn)行測試,進(jìn)而得到與之相對應(yīng)的混淆矩陣。比如說一個K類分類問題,對于子分類器SVCK,其混淆矩陣可以定位為,該矩陣的有效利用可以將順利獲取到各個支持向量機(jī)的模糊密度,為利用模糊積分進(jìn)行支持向量機(jī)集成奠定了堅實的基礎(chǔ)。
3 實證分析
3.1 支持向量機(jī)集成過程
本次實驗是在Libsvm軟件上進(jìn)行的,驗證平臺和操作系統(tǒng)分別是256MB內(nèi)存在AMD Athlon 1800+和Windows 2000。具體實驗過程共分為6個步驟:(1)通過Bagging方法的應(yīng)用,選取支持向量分類器的訓(xùn)練集,并對其進(jìn)行相應(yīng)的訓(xùn)練;(2)根據(jù)各分類器的訓(xùn)練結(jié)果輸出模型;(3)采取上文介紹的方法對模糊密度進(jìn)行確定;(4)當(dāng)給定一個測試樣本,得到各子支持向量分類器對該測試樣本的類概率輸出;(5)根據(jù)計算模糊積分,集成各子支持向量機(jī);(6)確定測試樣本的最終類別。通過上述6個步驟的合理操作,便可以實現(xiàn)支持向量機(jī)的有效集成。
3.2 樣本數(shù)據(jù)的選擇處理
本文所選取的是某電子商務(wù)公司400家客戶的數(shù)據(jù)資料,其中322家客戶的數(shù)據(jù)資料結(jié)果顯示為“狀態(tài)良好”,剩下的78家客戶的信用狀況則相對較差,很容易出現(xiàn)違約現(xiàn)象。由于這兩類客戶的數(shù)據(jù)資料存在很大差距,如果直接將其用于SVM的學(xué)習(xí),那么勢必會降低最優(yōu)分類面的準(zhǔn)確性。如果將其應(yīng)用到未來的預(yù)測工作中,必將帶來較大誤差。鑒于此,為了能夠進(jìn)一步確保樣本數(shù)據(jù)處理的有效性,對樣本數(shù)據(jù)進(jìn)行預(yù)處理是非常重要的。本次實驗中所采取的預(yù)處理方法主要是在322家狀態(tài)良好的客戶中抽取80家,與78家信用狀態(tài)差的客戶構(gòu)成一個規(guī)模為158家客戶的樣本集,并在此基礎(chǔ)上將該樣本集分為訓(xùn)練樣本集和測試樣本集兩個部分。此外,為了更好的將SVMs的泛化能力充分體現(xiàn)出來,在確保兩類樣本數(shù)量相近的前提下,隨機(jī)抽取一部分作為訓(xùn)練樣本集,剩下的一部分則用于檢驗?zāi)P偷姆夯芰Α?/p>
3.3 實證結(jié)果分析
本次實驗在多類別分類方面采用的是一對一策略,在158個訓(xùn)練集上訓(xùn)練出5個SVMs。各子支持向量分類器使用RBF核函數(shù),每個SVM通過10重交叉驗證的方法來選擇相應(yīng)的參數(shù),進(jìn)行了10次實驗。表1給出的是訓(xùn)練樣本精度,從表1中我們能夠看出,應(yīng)用該模型可以對客戶信用進(jìn)行分類,并可以達(dá)到最佳的精度。由此可見,與傳統(tǒng)的客戶信用評價方法相比,基于支持向量機(jī)集成的電子商務(wù)環(huán)境下的客戶信用評估模型具有更好的泛化能力,同時應(yīng)用起來簡單有效?梢灶A(yù)見,在未來的時間里,該評估模型在電子商務(wù)行業(yè)的發(fā)展中,勢必會得到更加廣泛的應(yīng)用。
4 結(jié)語
綜上所述,隨著我國電子商務(wù)行業(yè)發(fā)展腳步的不斷加快,對客戶信用的評估也引起了企業(yè)的高度重視,其不僅關(guān)系著電子商務(wù)活動的順利開展,而且對企業(yè)可持續(xù)發(fā)展目標(biāo)的實現(xiàn)也具有重要意義。從本文的分析我們能夠看出,基于支持向量機(jī)集成的電子商務(wù)環(huán)境下客戶信用的評估模型,不僅簡單有效,而且具有更好的泛化能力,能夠?qū)⒖蛻舻男庞谜鎸嵉姆从吵鰜,為電子商?wù)活動的開展提供參考。
【談?wù)劵谥С窒蛄繖C(jī)集成的電子商務(wù)環(huán)境下客戶信用評估模型】相關(guān)文章:
1.支持向量機(jī)的英語教學(xué)質(zhì)量評價論文
2.電子商務(wù)環(huán)境下客戶關(guān)系管理的現(xiàn)狀與提升對策論文
5.電子商務(wù)環(huán)境下對會計職業(yè)的沖擊
6.電子商務(wù)環(huán)境下旅游業(yè)發(fā)展