e3 Kenneth Laudon 管理信息系統 v11

6.3 使用數據庫改善經營業績,提高決策水平

許多企業使用本公司的數據庫跟蹤其基本交易,例如支付供應商、處理訂單、跟蹤客戶、支付員工薪水,但是同時他們需要數據庫提供的信息,這樣公司能更有效地經營業務,管理者和員工都能更好地做出決策。如果一家公司想要了解哪件產品最暢銷,或者誰是最有利可圖的客戶,答案就在數據之中。

例如,洛杉磯的一家餐館連鎖店Louise’s Trattoria通過分析客戶使用信用卡付款的數據瞭解到,它的大部分客戶受過高等教育,喜歡美酒,對這些客戶來說,質量比價格更重要。根據這一信息,這家連鎖店推出素菜,增加海鮮品種並且提供價格更高的酒,同時價格提高10%。

大公司有獨立功能的大型數據庫或者大型系統,如製造、銷售、財務、仍需要特殊的功能和工具分析大量的數據和處理來自多個系統的數據。這些功能包括數據倉庫、數據挖掘和通過網絡處理內部數據庫的工具。

6.3.1 數據倉庫

假設我們想了解有關現在整個公司的運作、趨勢和變化的精簡可靠的信息。但是如果我們在一家大公司工作,獲得這些信息可能會很困難,因為數據通常儲存在各個獨立的系統之中,如銷售、製造或是財務系統。我們所需要的某些數據可能儲存在銷售系統,而另外一些則儲存在製造系統。很多這些系統年代久遠,使用過時的數據管理技術或者文件系統,用戶很難處理其中的數據信息。在本章的開篇案例中,惠普曾遇到過這些問題。

我們可能不得不花費大量的時間整理、收集所需要的數據,或者被迫依據不完整信息做決策。如果想了解有關運行趨勢方面的信息,我們可能也會在搜尋過去的記錄時遇到困難,因為在大部分的企業裡只有當前的數據記錄才是一搜即得。數據倉庫正是解決這些問題。

1.數據倉庫

數據倉庫是儲存對整個企業的決策者有潛在利益的當前和歷史數據的數據庫。數據產生於多個核心業務交易系統,如銷售系統、客戶賬戶系統和製造系統,可能還包括來自網絡交易的數據。數據倉庫鞏固和規範來自不同業務數據庫的信息,這樣這些信息就可以在整個企業用於分析管理和制定決策。

圖6-14描繪了數據倉庫是如何工作的。數據庫為所有用戶提供所需的數據,但是用戶不能修改數據。數據庫同時提供了一系列特設、標準化的查詢工具、分析工具和圖形報告工具。很多公司利用內部用戶使得數據倉庫的信息能夠廣泛地為整個公司的人所用。

圖6-14 數據倉庫的構成

組織互動專欄說明IRS(internal revenue service)作為一個強大的工具如何幫助制定決策,提高業務效率。

2.數據集市

公司常建立面向全企業的、為整個組織服務中央數據倉庫,或者創建相對較小的分散數據倉庫,稱之為數據集市 (data mart)。數據集市,作為數據倉庫的子集,單獨存儲整個數據系統中整理過的或高度集中的一部分數據,供特定的用戶群體使用。例如,一間公司可能創建市場營銷和銷售的數據集市來處理客戶信息。數據集市通常關注某單一、特定領域或者行業,與面向全企業的數據倉庫相比,通常能夠以更低的代價更快速地創建起來。

6.3.2 商業智能、多維數據分析以及數據挖掘

當用戶獲得數據並將其存儲在數據倉庫和數據集市中後,就能對其做進一步的分析。用戶可以使用一系列工具分析這些數據,從中認清新模式、關係和觀點,以此引導決策的制定。這些用來穩固、分析和為獲取大量數據提供通道的工具被稱之為商業智能 (business intelligence,BI)。商業智能主要的工具包括數據庫查詢和報告軟件,多維數據分析工具(聯機分析處理)和數據挖掘。

當我們將智能應用到人的身上時,我們常想到的是人們結合已有知識與新信息,為完成任務或適應不同環境而採取不同行動的能力。同樣,商業智能為公司提供收集信息,獲得客戶、競爭者和內部運作的信息,以及改變決策以獲取更大利潤和其他商業目標的工具。

例如,在博彩行業中居第二位的Harrah’s Entertainment就一直在分析其客戶的數據信息,這些數據來自人們使用公司旗下的老虎機、賭場和賓館。市場部利用這些數據,根據特定客戶對公司長久價值建立了一個詳細的博彩文件。這個文件用來指導管理上的一些決策,如怎樣找出最有利可圖的客戶以鼓勵他們更多投資,如何利用潛在的高回報吸引更多的客戶。商業智能大大地提高了Harrah’s的利潤,已經成為公司的商業戰略。

圖6-15說明商業智能是如何工作的。公司的運作數據庫跟蹤商業運作中的交易,數據庫中的數據隨後儲存在數據倉庫。管理者運用商業智能工具找出數據模式及意義,通過分析數據,做出更相關、更明智的商業決策。

圖6-15 商業智能

這一部分將介紹最重要的一些商業智能技術和工具,更多有關商業智能的應用將在第12章中詳細介紹。

1.聯機分析處理

假設,某公司在東部、西部和中部地區分別銷售四種不同的產品——螺母、螺栓、墊圈和螺釘。如果我們想知道某問題非常確切的答案,如在過去的一個季度中墊圈的銷售量,可以通過查詢銷售數據庫就能輕易找到答案了。但是如果我們想知道在每個銷售地區墊圈的實際銷售量,並與預期的銷售量相比較呢?

要獲得這樣的信息,需要聯機分析處理 (online analytical processing,OLAP)。OLAP支持多維數據分析。使用多維數據分析,用戶可以用不同方法分析同一數據。信息的每一方面——產品、價格、成本、地區或是銷售期限都代表著一個不同的維度。因此,產品經理可以使用多維數據分析工具來查詢6月份東部地區的墊圈銷售量,並將其與同地區5月份的銷售量,與上一年同時期同地區的銷售量,及與銷售預期相比較。即使數據儲存在非常龐大的數據庫中,如多年的銷售記錄數據庫,用戶仍能夠通過OLAP從網上快速獲得這些特定問題的答案。

圖6-16 多維數據模型

圖6-16表示的是創建一個有關產品、地區、實際銷售量和預期銷售量的多維數據模型。代表實際銷售量的矩陣堆疊到代表預測銷售量的矩陣頂部,形成一個正六面體。如果將此正六面體旋轉90度,就能看到產品與實際和預期銷售量的關係;如果將此正六面體再旋轉90度,就能看到地區與實際和預期銷售量的關係;如果將此正六面體從原始角度旋轉180度,就能看到產品、地區和預測銷售量三者的關係。立方體可以嵌套立方體內建立更復雜的數據關係。公司可以在相關聯的數據庫中使用專門的多維數據庫或工具對數據進行多維分析。

2.數據挖掘

傳統的數據庫只能查詢諸如“2007年2月裝運了多少403號產品?”這類問題的答案。聯機分析處理或是多維分析支持查詢更復雜的信息,比如,比較在過去兩年中產品403每一季度、每一地區的實際銷售量與預期銷售量。當用戶使用OLAP和以查詢為導向的數據分析時,用戶需要明確他們所要尋找的信息。

數據挖掘在探索驅動下,通過尋求大型數據庫間隱藏的模式與關係,從中得出指導後期決策制定的法則,而這是通過聯機分析處理無法得到的。這些模式和法則可以用來指導決策的制定以及預測這些決策帶來的效果。能夠從數據挖掘中獲得的信息類型包括:關聯信息、順序信息、分類信息、串聯信息和預測信息。

·關聯信息是指與單一活動相聯繫的事件。例如,超市購買模式的調查顯示,當顧客購買玉米片時,65%的情況下顧客會同時購買一瓶可樂;但當在促銷活動中,85%的可樂將售出。經理將從這一信息中得知促銷活動能獲得更高的利潤,這樣有助於其更好的制定計劃。

·順序信息是指某段時間裡相聯繫的一系列事件。我們會發現,比如,如果售出了一棟房子,65%的情況下在兩個星期之內會售出一臺冰箱,45%的情況下售出房子的一個月之內會售出一臺烤箱。

·分類信息指的通過審查現有已分類的信息和根據一系列的準則描述某信息歸類於哪一組的模式。例如,信用卡或電話公司可能擔心喪失穩定客戶。通過分類,公司便能夠找出那些喜歡更換公司的客戶特徵,經理根據分類中的模式能夠預測哪些客戶喜歡更換公司,並實施相應的策略留住客戶。

·串聯信息,當組別還沒分類時,工作方法和分類差不多。數據挖掘工具能夠在數據間發現不同的分類,比如,將銀行卡歸類到相似的組別或根據客戶統計和客戶個人投資種類,將數據庫分區。

·雖然這些應用中包含了預示的方法,但預測信息使用了不同的預示方法,它利用現有的一系列價值來預測將會產生怎樣的其他價值。例如,通過預測,經理可能在數據中發現評估連續變量的未來價值,如銷售數據的模式。

這些系統能對模式或趨勢進行高層次的分析,但是如果需要,仍然可以得到細節方面的信息。數據挖掘無論在商業領域的業務,還是在政府、科學工作中都能得到應用,其最廣泛的應用之一是在點對點營銷策劃中或確認最有利可圖的客戶時提供有關詳細分析客戶數據的模型。

例如,澳大利亞的Virgin Mobile使用數據倉庫和數據挖掘提高客戶對其忠誠度,增加服務種類。數據倉庫中的數據來自企業系統、客戶關係管理系統和客戶結算系統這些大型數據庫。管理人員利用數據挖掘,通過客戶購買的手機、每個分店的銷售量和活動、客戶對新產品和服務的反應、客戶流失率,以及從每個客戶身上得到的收益等信息分析新客戶特徵。

預測性分析 (predictive analysis)使用數據挖掘技術、歷史數據和對未來狀況的假設,預測如顧客對某報價有所反應的或購買某一產品的可能性等事件的結果。例如,The Body Shop International plc美國分公司利用目錄、網絡和零售客戶數據庫,使用預測性分析,預測哪些客戶更傾向於使用目錄購買。利用此信息,公司羅列更精準,更有目標性的郵寄列表以便獲得對郵寄目錄最大的響應率並獲利。

3.文本挖掘和網絡挖掘

商業智能工具主要處理在數據庫和文件中結構化的數據。但是,對公司而言,超過80%的有用信息卻是未經結構化處理的數據,其大部分以文本文件的形式存在。電子郵件、備忘錄、呼叫中心留言、問卷調查、法律案件、專利說明和服務報告表對決策者來說,都是找出模型、判斷趨勢的有用信息。現在,企業可以利用文本挖掘工具來分析這些數據。利用這些工具我們可以從大量未結構化處理的數據集中提取關鍵因素,發現模型和關係,總結數據。我們還可以通過文本挖掘分析服務中心的電話記錄,找出主要的服務與維修問題。

賓夕法尼亞州的空氣產品與化學公司(Air Products and chemicals)利用文本挖掘 (text mining)來確定哪些文件需要特別的保留程序以便符合《薩班斯-奧克斯利法案》的規定。該公司存儲了萬億字節未經結構化處理的數據,這其中還不包括電子郵件。利用由Inxight Software出品的軟件SmartDiscovery將這些數據分類,公司就能對某一類文件而不是個人文件應用公司規則。如果發現某文件中記錄的業務違反《薩班斯-奧克斯利法案》的規定,公司也能保證文件保存符合此法案中有關數據保存的要求。

網絡是另一個有用信息豐富的資源,其中一些信息可提供判斷顧客行為的模式、趨勢和洞察力。這種從萬維網上發現、分析有用模式和信息的方式稱為網絡挖掘 (Web minning)。公司可利用網絡挖掘來了解客戶行為,評估某網頁的有效性,或量化營銷活動的成功。例如,利用Google Trends和Google Insights搜索,跟蹤在Google搜索中使用過的詞語與詞組,我們就能知道人們感興趣的事物和最暢銷的商品。

網絡挖掘通過內容挖掘、結構挖掘和用法挖掘在數據中尋找模型。網絡內容挖掘是指從網頁中提取信息的過程,包括網頁中的文本、圖像、音頻和視頻數據。網絡結構挖掘提取某網站中結構方面的數據。例如,某文件的連接暗示此文件的受關注度廣泛,而由某文件引出的連接則可能暗示此文件中包含話題的種類繁多。網絡用法挖掘提取無論何時在網頁上的操作而存儲下來的用戶互動數據。用法數據記錄了當用戶瀏覽網頁或進行網絡交易時用戶的行為,並將這些數據存儲在服務器日誌上。公司通過分析這些數據能決定某特定顧客對公司的價值,產品間交叉的營銷策略和促銷活動的有效性,等等。

6.3.3 數據庫與Web

你是否嘗試使用網絡下訂單,或查看某產品目錄?如果是,那你就可能在使用與企業內部數據庫相連的網站。現在很多公司都在利用網絡使客戶與合作者能使用部分該公司的內部數據庫。

例如,某顧客利用網絡瀏覽器從網上商店的數據庫中搜索產品價格信息。圖6-17說明了該顧客如何通過網絡進入商店內部數據庫。該用戶利用網絡瀏覽軟件,使用他的客戶端電腦登錄公司零售網站後,通過瀏覽器以HTML命令與Web服務器進行通信,發出數據查詢要求。

圖6-17 內部數據庫與互聯網的連接

通常後臺數據庫無法解釋HTML命令,因此Web服務器會把HTML命令發給專門的軟件,將其翻譯成SQL命令。在客戶機/服務器環境下,DBMS位於數據庫服務器 (database server)上。DBMS接收到SQL命令後,從數據庫中返回所需的數據。Web服務器再把數據以HTML的形式發送給用戶。

圖6-17中聯繫Web服務器與DBMS的中間件是負責處理所有的應用程序服務器,包括在Web服務器和後臺的應用程序或數據庫之間的事務處理和數據訪問。應用程序服務器從Web服務器接收指令,根據這些指令運行業務邏輯,並建立與後臺應用程序或數據庫之間的連接。應用服務器可以是一臺專用的計算機,也可以是一系列的腳本程序。腳本程序是指在Web服務器上使用通用網關接口(common gateway Interface,CGI)處理數據的程序。

使用Web連接企業內部數據庫有一系列好處。首先,網絡瀏覽軟件比查詢工具要好用得多;其次,連接內部數據庫的網絡界面不需要或需要很少的改變;在原始系統上增加一個網絡界面要比重新設計並製作一個供用戶使用的系統要花費得少得多。

通過網絡進入企業數據庫創造了效率、機會和商業模式。ThomasNet.com提供最新的60多萬個工業產品供應商的在線產品目錄,產品包括化學制品、金屬、塑料、橡膠和汽車用品。這家公司原來命名為Thomas Register向客戶郵寄此類信息的大量紙質目錄,而現在信息在網站上向客戶公佈,公司系統也不再像以前那麼臃腫龐大。其他一些公司也利用網絡進入企業數據庫創造了新的商機。