隨著社會(huì)的進(jìn)步和信息通信技術(shù)的發(fā)展,信息系統(tǒng)在各行業(yè)、各領(lǐng)域快速拓展。這些系統(tǒng)采集、處理、積累的數(shù)據(jù)越來越多,數(shù)據(jù)量增速越來越快,以至用“海量、爆炸性增長”等詞匯已無法形容數(shù)據(jù)的增長速度。
2011年5月,全球知名咨詢公司麥肯錫全球研究院發(fā)布了一份題為《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個(gè)新領(lǐng)域》的報(bào)告。報(bào)告中指出,數(shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對(duì)于大數(shù)據(jù)的運(yùn)用預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來。2012年3月29 日,美國政府在白宮網(wǎng)站上發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》,表示將投資2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,增強(qiáng)從大數(shù)據(jù)中分析萃取信息的能力。
什么是大數(shù)據(jù)?
“大數(shù)據(jù)”到底有多大?根據(jù)研究機(jī)構(gòu)統(tǒng)計(jì),僅在2011年,全球數(shù)據(jù)增量就達(dá)到了1.8ZB(即1.8萬億GB),相當(dāng)于全世界每個(gè)人產(chǎn)生200GB以上的數(shù)據(jù)。這種增長趨勢仍在加速,據(jù)保守預(yù)計(jì),接下來幾年中,數(shù)據(jù)將始終保持每年50%的增長速度。
縱觀人類歷史,每一次劃時(shí)代的變革都是以新工具的出現(xiàn)和應(yīng)用為標(biāo)志的。蒸汽機(jī)把人們從農(nóng)業(yè)時(shí)代帶入了工業(yè)時(shí)代,計(jì)算機(jī)和互聯(lián)網(wǎng)把人們從工業(yè)時(shí)代帶入了信息時(shí)代,而如今大數(shù)據(jù)時(shí)代已經(jīng)到來,它源自信息時(shí)代,又是信息時(shí)代全方位的深化應(yīng)用與延伸。大數(shù)據(jù)時(shí)代的生產(chǎn)原材料是數(shù)據(jù),生產(chǎn)工具則是大數(shù)據(jù)技術(shù),是對(duì)信息時(shí)代所產(chǎn)生的海量數(shù)據(jù)的挖掘和分析,從而快速地獲取有價(jià)值信息的技術(shù)和應(yīng)用。
概括來講,大數(shù)據(jù)有三個(gè)特征,可總結(jié)歸納為“3V”,即量 (Volume)、類(Variety)、時(shí)(Velocity)。量,數(shù)據(jù)容量大,現(xiàn)在數(shù)據(jù)單位已經(jīng)躍升至ZB級(jí)別。類,數(shù)據(jù)種類多,主要來自業(yè)務(wù)系統(tǒng),例如社交網(wǎng)絡(luò)、電子商務(wù)和物聯(lián)網(wǎng)應(yīng)用。時(shí),處理速度快,時(shí)效性要求高,從傳統(tǒng)的事務(wù)性數(shù)據(jù)到實(shí)時(shí)或準(zhǔn)實(shí)時(shí)數(shù)據(jù)。
數(shù)據(jù)挖掘,又稱為知識(shí)發(fā)現(xiàn)(Knowledge Discovery),是通過分析每個(gè)數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù)。知識(shí)發(fā)現(xiàn)過程通常由數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示3個(gè)階段組成。數(shù)據(jù)準(zhǔn)備是從數(shù)據(jù)中心存儲(chǔ)的數(shù)據(jù)中選取所需數(shù)據(jù)并整合成用于數(shù)據(jù)挖掘的數(shù)據(jù)集;規(guī)律尋找是用某種方法將數(shù)據(jù)集所含規(guī)律找出來;規(guī)律表示則是盡可能以用戶可理解的方式 (如可視化)將找出的規(guī)律表示出來。
“數(shù)據(jù)海量、信息缺乏”是相當(dāng)多企業(yè)在數(shù)據(jù)大集中之后面臨的尷尬問題。目前,大多數(shù)事物型數(shù)據(jù)庫僅實(shí)現(xiàn)了數(shù)據(jù)錄入、查詢和統(tǒng)計(jì)等較低層次的功能,無法發(fā)現(xiàn)數(shù)據(jù)中存在的有用信息,更無法進(jìn)一步通過數(shù)據(jù)分析發(fā)現(xiàn)更高的價(jià)值。如果能夠?qū)@些數(shù)據(jù)進(jìn)行分析,探尋其數(shù)據(jù)模式及特征,進(jìn)而發(fā)現(xiàn)某個(gè)客戶、群體或組織的興趣和行為規(guī)律,專業(yè)人員就可以預(yù)測到未來可能發(fā)生的變化趨勢。這樣的數(shù)據(jù)挖掘過程,將極大拓展企業(yè)核心競爭力。例如,在網(wǎng)上購物時(shí)遇到的提示 “瀏覽了該商品的人還瀏覽了如下商品”,就是在對(duì)大量的購買者“行為軌跡”數(shù)據(jù)進(jìn)行記錄和挖掘分析的基礎(chǔ)上,捕捉總結(jié)購買者共性習(xí)慣行為,并針對(duì)性地利用每一次購買機(jī)會(huì)而推出的銷售策略。
數(shù)據(jù)挖掘在供電企業(yè)的應(yīng)用前景
在電力行業(yè),堅(jiān)強(qiáng)智能電網(wǎng)的迅速發(fā)展使信息通信技術(shù)正以前所未有的廣度、深度與電網(wǎng)生產(chǎn)、企業(yè)管理快速融合,信息通信系統(tǒng)已經(jīng)成為智能電網(wǎng)的 “中樞神經(jīng)”,支撐新一代電網(wǎng)生產(chǎn)和管理發(fā)展。目前,國家電網(wǎng)公司已初步建成了國內(nèi)領(lǐng)先、國際一流的信息集成平臺(tái)。隨著三地集中式數(shù)據(jù)中心的陸續(xù)投運(yùn),一級(jí)部署業(yè)務(wù)應(yīng)用范圍的拓展,結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中心的上線運(yùn)行,電網(wǎng)業(yè)務(wù)數(shù)據(jù)從總量和種類上都已初具規(guī)模。隨著后續(xù)智能電表的逐步普及,電網(wǎng)業(yè)務(wù)數(shù)據(jù)將從時(shí)效性層面進(jìn)一步豐富和拓展。大數(shù)據(jù)的 “量類時(shí)”特性,已在海量、實(shí)時(shí)的電網(wǎng)業(yè)務(wù)數(shù)據(jù)中進(jìn)一步凸顯,電力大數(shù)據(jù)分析迫在眉睫。當(dāng)前,電網(wǎng)業(yè)務(wù)數(shù)據(jù)大致分為三類:一是電力企業(yè)生產(chǎn)數(shù)據(jù),如發(fā)電量、電壓穩(wěn)定性等方面的數(shù)據(jù);二是電力企業(yè)運(yùn)營數(shù)據(jù),如交易電價(jià)、售電量、用電客戶等方面的數(shù)據(jù);三是電力企業(yè)管理數(shù)據(jù),如ERP、一體化平臺(tái)、協(xié)同辦公等方面的數(shù)據(jù)。如能充分利用這些基于電網(wǎng)實(shí)際的數(shù)據(jù),對(duì)其進(jìn)行深入分析,便可以提供大量的高附加值服務(wù)。這些增值服務(wù)將有利于電網(wǎng)安全檢測與控制(包括大災(zāi)難預(yù)警與處理、供電與電力調(diào)度決策支持和更準(zhǔn)確的用電量預(yù)測),客戶用電行為分析與客戶細(xì)分,電力企業(yè)精細(xì)化運(yùn)營管理等等,實(shí)現(xiàn)更科學(xué)的需求側(cè)管理。
例如,在電力營銷環(huán)節(jié),針對(duì)“大營銷”體系建設(shè),以客戶和市場為導(dǎo)向,省級(jí)集中的95598客戶服務(wù)、計(jì)量檢定配送業(yè)務(wù)屬地化管理的營銷管理體系和24小時(shí)面向客戶的營銷服務(wù)系統(tǒng),可通過數(shù)據(jù)分析改善服務(wù)模式,提高營銷能力和服務(wù)質(zhì)量;以分析型數(shù)據(jù)為基礎(chǔ),優(yōu)化現(xiàn)有營銷組織模式,科學(xué)配置計(jì)量、收費(fèi)和服務(wù)資源,構(gòu)建營銷稽查數(shù)據(jù)監(jiān)控分析模型;建立各種針對(duì)營銷的系統(tǒng)性算法模型庫,發(fā)現(xiàn)數(shù)據(jù)中存在的隱藏關(guān)系,為各級(jí)決策者提供多維的、直觀的、全面的、深入的分析預(yù)測性數(shù)據(jù),進(jìn)而主動(dòng)把握市場動(dòng)態(tài),采取適當(dāng)?shù)臓I銷策略,獲得更大的企業(yè)效益,更好地服務(wù)于社會(huì)和經(jīng)濟(jì)發(fā)展。此外,還可以考慮在電力生產(chǎn)環(huán)節(jié),利用數(shù)據(jù)挖掘技術(shù),在線計(jì)算輸送功率極限,并考慮電壓等因素對(duì)功率極限的影響,從而合理設(shè)置系統(tǒng)輸出功率,有效平衡系統(tǒng)的安全性和經(jīng)濟(jì)性。
公司具備非常好的從數(shù)據(jù)運(yùn)維角度實(shí)現(xiàn)更大程度信息、知識(shí)發(fā)現(xiàn)的條件和基礎(chǔ),完全可以立足數(shù)據(jù)運(yùn)維服務(wù),創(chuàng)造數(shù)據(jù)增值價(jià)值,提供并衍生多種服務(wù)。以數(shù)據(jù)中心為紐帶,新型數(shù)據(jù)運(yùn)維的成果將有可能作為一種新的消費(fèi)形態(tài)與交付方式,給客戶帶來全新的使用體驗(yàn),打破傳統(tǒng)業(yè)務(wù)系統(tǒng)間各自為陣的局面,進(jìn)一步推動(dòng)電網(wǎng)生產(chǎn)和企業(yè)管理,從數(shù)據(jù)運(yùn)維角度對(duì)企業(yè)生產(chǎn)經(jīng)營、管理以及堅(jiān)強(qiáng)智能電網(wǎng)建設(shè)提供更有力、更長遠(yuǎn)、更深入的支撐。