e3 Kenneth Laudon 管理信息系統 v11
6.4 管理數據資源
建立數據庫只是一個開始。為了使公司的數據精確、可靠,公司需要專門的制度與程序管理數據。
6.4.1 建立信息制度
每個企業,不論大小,都需要信息政策。公司的數據是重要資源,不能任人隨意改變,那麼就必須規定如何組織和保存數據,以及哪些人可以查看、更改數據。
信息政策 (information policy)規定了分享、傳播、獲取、規範、分類和儲存信息的規則,規定了有關確定用戶和公司單位有權分享數據的程序和責任,規定了信息可被分配的地方,規定了更新和維護信息的人員。例如,信息政策通常會規定只有僱用人員和人力資源部的特定人員才有權力查看及更改比較敏感的員工數據,如員工工資或社會保障號,並且這些部門必須保證此數據的準確度。如果是小公司,信息政策一般由老闆或經理設定實施。但如果是大型企業,信息作為企業資源來管理和規劃,通常需要專門的數據管理 (data administration)職能部門。數據管理部門的職責包括制定信息政策,進行數據規劃,負責邏輯數據庫設計和數據字典開發,並監督系統管理員和用戶對數據的使用。
我們也可能聽說用數據治理 (data governance)來形容這些任務。數據治理,由IBM提出,指管理企業數據的可用性、完整性以及安全性的政策和程序,其中特別強調隱私、安全、數據質量和符合政府規定。
大型企業在企業信息系統內部還需要專門的數據庫設計與管理部門,負責定義與組織數據庫的結構和內容,以及數據庫的維護。通過與用戶的密切配合,數據庫設計團隊建立物理數據庫、數據元之間的邏輯關係、數據訪問規則和程序等。這個職能稱為數據庫管理 (database administration)。


6.4.2 確保數據質量
設計完好的數據庫與信息政策確保有公司需要的數據。但是,人們需要採取其他措施以確保企業數據庫中的數據準確可靠。
如果某客戶的電話號碼或者賬戶餘額有誤怎麼辦呢?如果數據庫中產品標價有誤或者對同一產品銷售系統與庫存系統不一致會產生怎樣的影響呢?不準確、沒有及時更新或者與其他資源不一致的信息將導致錯誤的決定,召回產品和財務損失。而如果在刑事司法和國家安全數據庫中出現上述信息,如本章案例分析中,甚至會導致不必要地監視或拘留。根據福里斯特研究公司的研究,美國20%的郵件和商業包裹因為姓名或地址錯誤被退回。加德納集團曾報告《財富》1000強公司的數據庫中超過25%的關鍵數據不準確或不完整,包括錯誤的條形碼、不準確的產品描述、有誤的庫存說明、錯誤的財務數據、有誤的供應商信息以及不準確的員工信息。(Gartner,2007)
想想在同一天收到幾份相同的郵遞廣告。這很有可能是因為你的姓名多次記錄在某數據庫。可能你的姓名拼寫有誤,可能你僅某次使用姓和中間姓名,或信息記錄在紙質文檔中但掃描存儲在系統中時出現錯誤,因為這些不一致的信息,數據庫將你識記為不同的個人,因此才會收到寄給laudon、lavdon、lauden或landon的額外郵件。
如果數據庫設計完好,建立面向企業的數據規範,重複或不一致數據的數量將大大降低。大部分數據質量問題,如姓名拼寫錯誤、數字顛倒、代碼錯誤或遺失,其根源在於數據輸入時的失誤。當公司將其業務擴大到網絡,允許客戶和供應商在網站添加數據以直接更新內部系統時,此類錯誤的發生率會大大增加。
在使用新的數據庫之前,企業要確認、更正錯誤數據,並在數據庫啟用後提供編輯數據的程序。數據質量分析通常首先進行數據質量審核 (data quality audit),即在信息系統中進行數據準確性和完整性方面的結構化調查,它可以在整個數據文件範圍內或數據文件範本內調查,也可以調查終端用戶對數據質量的看法。
數據清理 (data cleansing)指刪除更正數據庫中錯誤、不完整、格式有誤或多餘的數據。數據清理不僅僅更正錯誤,同樣加強來自各個單獨信息系統不同數據間的一致性。專門的數據清理軟件能夠自動檢測數據文件,更正錯誤數據,並用全企業一致的格式整合數據。