- 相關(guān)推薦
數(shù)字檔案館建設(shè)面臨的難題
【內(nèi)容提要】數(shù)字檔案館是數(shù)字信息時(shí)代檔案?jìng)鬟f和利用的新途徑。數(shù)字檔案館與傳統(tǒng)檔案館相比有著極大的優(yōu)越性,然而它也存在著不少缺陷。在數(shù)字檔案館的建設(shè)中面臨著諸多不容樂(lè)觀難以解決的問(wèn)題,對(duì)此我們要有清醒的認(rèn)識(shí)。本文提出了數(shù)字檔案館建設(shè)所面臨的10個(gè)方面的問(wèn)題!娟P(guān) 鍵 詞】數(shù)字檔案館/問(wèn)題
【 正 文】
隨著現(xiàn)代信息技術(shù)的迅速發(fā)展和大量電子文件的產(chǎn)生,數(shù)字檔案館的研究和建設(shè)成為我國(guó)檔案界關(guān)注的熱點(diǎn)。數(shù)字檔案館與傳統(tǒng)檔案館相比,有著豐富的數(shù)字化資源、海量的存儲(chǔ)、便捷的檢索、快速的傳輸、高度的開(kāi)放、信息的共享等優(yōu)點(diǎn),使傳統(tǒng)的檔案館望塵莫及。然而,它也不可避免地存在一些缺陷和不足,有的甚至可能是致命的缺陷。因此,我們應(yīng)該清醒地認(rèn)識(shí)到數(shù)字檔案館存在的缺陷,數(shù)字檔案館的建設(shè)還存在著諸多的難點(diǎn)和問(wèn)題亟待深入研究解決。如果對(duì)存在的問(wèn)題視而不見(jiàn),或掉以輕心,必將給未來(lái)的檔案事業(yè)留下巨大而無(wú)法彌補(bǔ)的遺憾。
1 數(shù)字檔案的憑證價(jià)值問(wèn)題
檔案的基本價(jià)值有兩方面,憑證價(jià)值和參考價(jià)值,而尤以憑證價(jià)值最為重要,雖然,“目前人們對(duì)數(shù)字化檔案具有參考價(jià)值這一點(diǎn)已無(wú)疑義,然而,由于一系列技術(shù)和立法問(wèn)題還未解決,數(shù)字化檔案目前還不具備法律憑證效力”[1]這無(wú)疑使數(shù)字檔案的作用大打折扣。因此,確認(rèn)數(shù)字檔案的憑證價(jià)值就成為數(shù)字檔案館建設(shè)中無(wú)法回避的難題。目前,主要存在以下幾方面的問(wèn)題:
1.1 認(rèn)識(shí)上的問(wèn)題。數(shù)字檔案不具備“白紙黑字”的直觀性,必須依賴特定的計(jì)算機(jī)設(shè)備加以解讀。數(shù)字檔案完全脫離了以往人人對(duì)檔案“原件”的認(rèn)識(shí),從而引起人們對(duì)其原始性、可靠性的懷疑。而且,有些數(shù)字檔案即使載體保存完好,內(nèi)容亦可能在無(wú)形中丟失,它不像紙質(zhì)檔案那樣載體與內(nèi)容“一損俱損,一榮俱榮”。數(shù)字檔案與以往其他載體的檔案都不一樣,從甲骨檔案到簡(jiǎn)牘檔案再到紙質(zhì)檔案,只是載體的耐久性有差別,并沒(méi)有改變其直觀性,而數(shù)字檔案的非人工識(shí)讀性與其他載體的檔案有著質(zhì)的區(qū)別。要確認(rèn)數(shù)字檔案的憑證價(jià)值,恐怕不僅僅是改變觀念的問(wèn)題,要真正認(rèn)識(shí)數(shù)字檔案,確認(rèn)其憑證價(jià)值,可能還需要走很長(zhǎng)的路。
1.2 技術(shù)上的問(wèn)題。數(shù)字檔案是高新技術(shù)的產(chǎn)物,它給人們帶來(lái)極大便利的同時(shí),也給人們留下了困惑與難題。其一,數(shù)字檔案具有易復(fù)制、修改、刪除的特點(diǎn),使得檔案“原件”的概念變得難以確認(rèn)。其二,計(jì)算機(jī)硬、軟件技術(shù)不斷更新?lián)Q代,迫使數(shù)字檔案必須不斷適應(yīng)新的“生存環(huán)境”,不斷地變換載體、格式,因而無(wú)法通過(guò)載體、格式的鑒定來(lái)判定其原始性。其三,數(shù)字檔案不再具有特定的字跡,人們可以根據(jù)需要以不同的字體、字號(hào)將其輸出,傳統(tǒng)的字跡鑒定技術(shù)無(wú)法分辨數(shù)字檔案的原始性。其四,數(shù)字檔案對(duì)背景信息和元數(shù)據(jù)具有很強(qiáng)的依賴性!半娮游募谋尘靶畔⒊3Ec文件內(nèi)容信息相分離保存,一旦失去背景信息,文件的內(nèi)容即便仍有意義,但也不再具有憑證價(jià)值。元數(shù)據(jù)是電子文件、電子檔案所特有的,“元數(shù)據(jù)由于其隱含性而易被忽視,而元數(shù)據(jù)一旦丟失或破壞,電子文件的原始性就會(huì)改變。”[2]
1.3 管理制度上的問(wèn)題。“傳統(tǒng)檔案之所以具有憑證價(jià)值,在一定程度上取決于嚴(yán)格的管理制度”,而目前“從電子文件的生成到歸檔都缺乏十分規(guī)范的程序化管理,缺乏嚴(yán)格而科學(xué)的標(biāo)準(zhǔn)體系和業(yè)務(wù)管理制度,一些標(biāo)準(zhǔn)、制度雖已制定,但全面推行尚需時(shí)日”[3]而且也有一定的難度。
2 數(shù)字檔案信息的長(zhǎng)期存取問(wèn)題
數(shù)字檔案信息的長(zhǎng)期存取問(wèn)題是數(shù)字檔案館建設(shè)的一個(gè)具體而又棘手的難題!皳(jù)報(bào)道,美國(guó)航空航天局在20年前發(fā)射的‘海盜’火星探測(cè)器上的計(jì)算機(jī)中,已經(jīng)有20%的數(shù)據(jù)完全丟失,還有大約4000卷的統(tǒng)計(jì)數(shù)據(jù)因存儲(chǔ)的格式模糊無(wú)法讀出,程序員也無(wú)法保證將其恢復(fù)”。[4]數(shù)字檔案信息長(zhǎng)期存取所面臨的主要問(wèn)題有:
2.1 存儲(chǔ)的介質(zhì)材料!艾F(xiàn)代介質(zhì)的存儲(chǔ)設(shè)備還不可能解決計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)問(wèn)題”。[5]一般說(shuō)來(lái),磁盤(pán)的壽命是3~5年,光盤(pán)也不過(guò)30年左右,與能保存千年以上的紙質(zhì)載體相比,其壽命相差甚遠(yuǎn),而且它還要受到溫度、磁場(chǎng)、記錄存儲(chǔ)格式、硬件配置等多方面的影響,10年前還經(jīng)常使用的5.25英寸的軟盤(pán),現(xiàn)在已經(jīng)沒(méi)有一臺(tái)普通電腦可以讀出來(lái)。
2.2 機(jī)讀語(yǔ)言格式!坝(jì)算機(jī)語(yǔ)言平均每三個(gè)月就會(huì)問(wèn)世一種,而語(yǔ)言之間的互換大部分存在問(wèn)題。很難想象,若干年以后,我們用現(xiàn)行的機(jī)器語(yǔ)言描述的數(shù)據(jù),還能百分之百的還原”。[6]
2.3 對(duì)設(shè)備的依賴。數(shù)字檔案必須依賴于計(jì)算機(jī)設(shè)備才能讀出,這個(gè)特征對(duì)其長(zhǎng)期存取帶來(lái)很多問(wèn)題:“如設(shè)備發(fā)生故障、系統(tǒng)癱瘓,電子文件就讀不出來(lái);電子文件對(duì)其它設(shè)備環(huán)境的不兼容性,使其只能在某種設(shè)備上處理,而不能在其它設(shè)備上處理;不同軟件環(huán)境形成的電子文件存貯在載體上,有時(shí)難以互換;電子文件加密后,不解密就無(wú)法識(shí)別;技術(shù)設(shè)備更新時(shí),不及時(shí)解決格式轉(zhuǎn)換問(wèn)題,也無(wú)法讀取等等”。[7]
3 數(shù)字檔案的失真問(wèn)題
“檔案數(shù)字化工作的生命線在于其能夠保持檔案原貌”。[8]然而,“就目前的研究水平而言,還難以保質(zhì)保量地完成館藏檔案數(shù)字化的任務(wù)。如已研制出的OCR掃描輸入技術(shù),其平均識(shí)別率是95%。這對(duì)于追求最大程度真實(shí)性的檔案來(lái)說(shuō)無(wú)疑是致命弱點(diǎn)”。[9]數(shù)字化的主要方式是掃描加工,在這一過(guò)程中造成數(shù)字檔案失真的原因還有以下幾個(gè)方面:其一,技術(shù)參數(shù)選擇不當(dāng)。針對(duì)不同色調(diào)、紙質(zhì)和字跡,有時(shí)需調(diào)整不同的技術(shù)參數(shù),如分辨率、明暗度、對(duì)比度等,選擇不當(dāng)會(huì)直接影響掃描的質(zhì)量,造成信息丟失、圖像模糊或產(chǎn)生額外信息,客觀上造成檔案原貌的改變。其二,工作失誤。檔案掃描是大量的重復(fù)勞動(dòng),難免有時(shí)失誤。如掃錯(cuò)檔案或打錯(cuò)順序,或存錯(cuò),或在建索引時(shí)鏈接錯(cuò)誤等,如不及時(shí)發(fā)現(xiàn),將直接導(dǎo)致數(shù)字化檔案失真。其三,轉(zhuǎn)換過(guò)程中的失真。在進(jìn)行數(shù)字檔案的遷移或在提供利用時(shí),往往需要將掃描后形成的圖像文件轉(zhuǎn)換成另一種格式的文件,如果格式選擇不當(dāng),同樣會(huì)導(dǎo)致數(shù)據(jù)發(fā)生變化。
4 數(shù)字檔案信息的安全問(wèn)題
安全問(wèn)題是計(jì)算機(jī)網(wǎng)絡(luò)世界最為頭痛的難題,也是數(shù)字檔案館中的重大難題之一。數(shù)字檔案館雖然被稱之為“館”,但它的存在更仿佛是一個(gè)巨大的沒(méi)有警察的自由市場(chǎng),給不法分子帶來(lái)可乘之機(jī),主要表現(xiàn)為:其一,計(jì)算機(jī)病毒。網(wǎng)絡(luò)信息安全的最主要的敵人就是計(jì)算機(jī)病毒。“國(guó)外有人估計(jì),現(xiàn)在計(jì)算機(jī)病毒的傳染每?jī)蓚(gè)月增加1倍。網(wǎng)絡(luò)病毒的泛濫已對(duì)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)構(gòu)成嚴(yán)重的威脅”。[10]其二,計(jì)算機(jī)黑客。由于網(wǎng)絡(luò)的加密性和匿名性,使入侵者難以被發(fā)現(xiàn)。黑客對(duì)信息資源的攻擊,不僅僅是好奇和自我挑戰(zhàn),程序設(shè)計(jì)高手可以篡改系統(tǒng)控制參數(shù)。其三,有竊取行為的間諜活動(dòng),窺視其機(jī)密信息進(jìn)行復(fù)制或擴(kuò)散。其四,有意破壞,摧毀系統(tǒng)的信息處理功能或破壞電子通訊裝置。其五,人為或偶然事故造成的威脅。如工作人員操作失誤而產(chǎn)生的不可預(yù)知的事件、網(wǎng)絡(luò)系統(tǒng)軟件硬件的故障、電子系統(tǒng)故障引發(fā)的系統(tǒng)問(wèn)題等,所有這些,都使數(shù)字檔案信息的安全變得十分“脆弱”。
5 數(shù)字檔案館建設(shè)的諸多技術(shù)問(wèn)題
數(shù)字檔案館完全是高新技術(shù)、電子設(shè)備和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)支撐起來(lái)的產(chǎn)物,離開(kāi)了高新技術(shù)的支撐,就沒(méi)有了數(shù)字檔案館。但是高新技術(shù)也給數(shù)字檔案館帶來(lái)了致命的弱點(diǎn),真是“成也蕭何,敗也蕭何”。諸多的技術(shù)問(wèn)題成為制約數(shù)字檔案館建設(shè)的難點(diǎn)。
5.1 數(shù)字化設(shè)備技術(shù)條件。網(wǎng)絡(luò)系統(tǒng)中的硬件技術(shù)之一是必須有足夠的帶寬,以保證快捷地傳輸文本、語(yǔ)音、圖像、影像檔案,以便實(shí)現(xiàn)多網(wǎng)互連、高速互訪,實(shí)現(xiàn)跨平臺(tái)、跨系統(tǒng)、跨語(yǔ)種的互相轉(zhuǎn)換和鏈接。毫無(wú)疑問(wèn),足夠的帶寬條件和用戶對(duì)網(wǎng)絡(luò)信息傳輸?shù)男枨髮⒁恢笔且粚?duì)矛盾體。
5.2 技術(shù)難題。數(shù)字檔案館是以信息源、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)為基礎(chǔ)的,其相關(guān)技術(shù)是較復(fù)雜較先進(jìn)并且不斷發(fā)展的,它幾乎囊括了計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)所需要解決的所有問(wèn)題,技術(shù)密集。如數(shù)字化圖像的存儲(chǔ)與壓縮、數(shù)據(jù)組織技術(shù)、信息檢索技術(shù)、多語(yǔ)言平臺(tái)互換互訪技術(shù)、海量信息存儲(chǔ)與調(diào)配技術(shù)等,既是計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的難關(guān),也是制約數(shù)字檔案館建設(shè)發(fā)展的難題。此外,“數(shù)字檔案館的建設(shè)和運(yùn)行需要解決一些特殊問(wèn)題,為此必須開(kāi)發(fā)應(yīng)用一系列新技術(shù),如:身份認(rèn)定、智能檢索、信息隱蔽、數(shù)字水印、電子簽章、操作跟蹤、信息加密等,其中有很多技術(shù)有創(chuàng)新性”。[11]這些技術(shù)也都是不容易解決的問(wèn)題。
5.3 技術(shù)過(guò)時(shí)問(wèn)題。在飛速發(fā)展的IT業(yè)中,電腦硬件、操作系統(tǒng)、應(yīng)用軟件及存儲(chǔ)載體等不斷地被新產(chǎn)品所替代,IT產(chǎn)品是真正的“短命鬼”。雖然絕大多數(shù)新產(chǎn)品承諾向下兼容,但其兼容的“代”數(shù)在跨越若干年后,舊的數(shù)字信息就很難被新的硬件設(shè)備和軟件系統(tǒng)讀出!凹夹g(shù)過(guò)時(shí)”的陰影一直會(huì)籠罩著數(shù)字信息。專(zhuān)家們提出的解決方案是數(shù)據(jù)遷移,但遷移卻存在著一個(gè)致命弱點(diǎn),就是每次遷移總會(huì)丟失一定的相關(guān)信息,這些丟失的信息積累起來(lái)會(huì)造成數(shù)字檔案信息無(wú)法準(zhǔn)確恢復(fù)原貌。
6 數(shù)字檔案館建設(shè)的標(biāo)準(zhǔn)化問(wèn)題
數(shù)字檔案館建設(shè)的目的是要使地區(qū)檔案館、全國(guó)檔案館乃至全世界的檔案館連成一個(gè)整體,以實(shí)現(xiàn)檔案信息資源共享。這個(gè)整體性的數(shù)字檔案館事實(shí)上是一種基于網(wǎng)絡(luò)環(huán)境下的數(shù)字化檔案信息資源共享的社會(huì)檔案館系統(tǒng),是一個(gè)面向?qū)ο蟮姆植际降木W(wǎng)狀結(jié)構(gòu)模式,是由一個(gè)個(gè)相對(duì)獨(dú)立的數(shù)字檔案館實(shí)體組成的。要對(duì)這分散在各地的數(shù)字檔案信息資源進(jìn)行組織控制,就必須要有彼此兼容的硬件環(huán)境,要有一致的文件格式、統(tǒng)一的著錄標(biāo)引標(biāo)準(zhǔn)、數(shù)據(jù)描述標(biāo)準(zhǔn)、元數(shù)據(jù)標(biāo)準(zhǔn)、全文數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)等等,這些標(biāo)準(zhǔn)也僅僅是幾個(gè)主要的標(biāo)準(zhǔn)!岸鴮(shí)際上,在數(shù)字檔案館建設(shè)中,標(biāo)準(zhǔn)化是一個(gè)體系,是一個(gè)系統(tǒng),因此對(duì)于我們來(lái)說(shuō),如何結(jié)合我國(guó)實(shí)際,迅速建立起一個(gè)適合我國(guó)數(shù)字檔案館建設(shè)的標(biāo)準(zhǔn)化體系是擺在我們面前的一個(gè)迫切需要解決的新問(wèn)題”。[12]然而,要解決這個(gè)問(wèn)題并不容易,我們面臨著很多問(wèn)題:其一,一個(gè)嚴(yán)峻的事實(shí)是我國(guó)檔案信息系統(tǒng)沒(méi)有相應(yīng)的具體標(biāo)準(zhǔn)可遵循;其二,有些標(biāo)準(zhǔn)規(guī)范要超出檔案工作的范圍,如綜合數(shù)據(jù)處理格式就需滿足跨行業(yè)、跨部門(mén)的要求。如何統(tǒng)一是一個(gè)很麻煩的問(wèn)題;其三,與整個(gè)檔案工作的標(biāo)準(zhǔn)相銜接的問(wèn)題;其四,與國(guó)際通用標(biāo)準(zhǔn)的接軌問(wèn)題;其五,由于計(jì)算機(jī)技術(shù)更新速度非?欤看渭夹g(shù)設(shè)備的更新,都會(huì)對(duì)原標(biāo)準(zhǔn)產(chǎn)生相應(yīng)的影響,因而必須不斷適時(shí)修訂標(biāo)準(zhǔn)。
7 數(shù)字檔案館建設(shè)的投入與產(chǎn)出問(wèn)題
數(shù)字檔案館建設(shè)存在著投入與產(chǎn)出不協(xié)調(diào)的問(wèn)題。如果我們把數(shù)字檔案館與數(shù)字圖書(shū)館作比較,會(huì)對(duì)這個(gè)問(wèn)題看得更清楚。數(shù)字檔案館建設(shè)投入的費(fèi)用是巨大的,而且它的建設(shè)費(fèi)用要遠(yuǎn)遠(yuǎn)高于數(shù)字圖書(shū)館的建設(shè)費(fèi)用。由于圖書(shū)有復(fù)本,許多圖書(shū)館保存的圖書(shū)都一樣。因而國(guó)家圖書(shū)館和省市圖書(shū)館的部分圖書(shū)數(shù)字化后,其他圖書(shū)館特別是中小型圖書(shū)館完全可以坐享其成,不必再花費(fèi)資金重復(fù)建設(shè)。而檔案館則不行,全國(guó)各個(gè)檔案館保存的檔案幾乎都是孤本,因而檔案館在用于檔案數(shù)字化的費(fèi)用上要比圖書(shū)館多,如,僅檔案館進(jìn)行數(shù)字化檔案目錄的“工作量約是圖書(shū)館的35倍”。[13]但是檔案館的利用人次與圖書(shū)館讀者的人數(shù)相比卻少得多,“以北京市檔案館和國(guó)家
【數(shù)字檔案館建設(shè)面臨的難題】相關(guān)文章:
網(wǎng)格技術(shù)的發(fā)展與數(shù)字圖書(shū)館建設(shè)12-07
淺析數(shù)字化圖書(shū)館的建設(shè)03-22
圖書(shū)館數(shù)字化建設(shè)實(shí)證分析03-21
數(shù)字化圖書(shū)館建設(shè)的深度剖析03-22
文學(xué)經(jīng)典面臨挑戰(zhàn)03-20