社交、移動和云、分析以及相關的數據技術已經在數字時代贏得一席之地。2016年我們看到大數據技術不斷給商業智能注入活力。2017年則是數據和分析的沉淀階段。
大數據時代,國家和企業都非常重視大數據的發展,而大數據的發展需要人才的支持,人才問題是大數據發展迫切需要解決的問題,DT時代新技術的領航者科多大數據表示:大數據人才高度稀缺,想要抓住風口,快速學習是個不錯的選擇,培訓機構的學員可以符合企業的用人需求。
2017年數據及分析方面的六大趨勢
·人工智能(AI)
將再度盛行早在60年代,Ray Solomonoff 奠定了人工智能的數學理論基礎,引入通用貝葉斯原理(Bayesian)來歸納推理和預測。1980年,美國人工智能協會(American Association for Artificial Intelligence,AAAI)的第一次全國會議在斯坦福大學召開,其標志著在軟件中理論應用的開始。Schroeder認為AI如今和一些熱詞如機器智能、機器學習、神經網絡和認知計算等一樣,已經回歸到主流探討。為何AI重返潮流,他指出定義大數據常用的“三V”特性:速度(Velocity),多樣性(Variety)和海量(Volume)。他認為各平臺可以將大數據的“三V”特性以現代和傳統的混合式處理模型來處理,這將比傳統平臺提高10-20倍的成本效率。谷歌記錄了簡單算法對大型數據集進行高速運行比對小數據集應用有更好的結果。Schroeder認為我們將會目睹,對于高體量重復性任務來說,和人工知覺相比,應用AI可獲取更有效的一致性,從而避免人為錯誤,產生最高價值。
·大數據治理或競爭優勢
Schroeder認為2017年數據治理和數據價值之爭將點燃。企業擁有大量客戶以及合作伙伴信息。領先的企業將把他們的數據分類成“規范使用案例”和“非規范使用案例”兩個類別來應用。規范使用案例數據需要治理;數據質量和線性關系使其可以產生報表,并且跟蹤數據進行各種轉化及追溯來源。Schroeder認為這非常必要甚至可強制執行,但可能對非規范使用案例作用有限,例如客戶360或者當需要通過進行高行選擇數處理、滿足實時需求和處理結構化及非結構化的混合數據來產生有效結果時,會受到限制。
·公司將關注業務驅動型應用
避免數據湖陷入困境 Schroeder表示在2017年,企業機構將從“構建未來”的數據湖應用轉向業務驅動型數據應用。當今世界需要分析和操作能力去觸及客戶、處理索賠并且連接到個體的不同設備。舉例而言,任何商業網站需要提供實時的個性化推薦和價格查詢。醫療健康型企業必須處理有效的索賠并且運用分析運營系統來防止索賠欺詐。媒體公司需要通過機頂盒提供個性化的內容。汽車制造商和汽車共享公司則要交互運營其車輛和司機。這些案例的實施交付均需要由一個敏捷平臺來實現,同時提供分析和運營的處理,跨越后臺分析和前臺運營進行整合,提升了商業價值。Schroeder認為2017年企業機構將大舉推動“提問題”型處理和架構及更多實際應用來驅動長期商業價值
·數據敏捷性決定勝負
Schroeder認為自DevOps提供可連續性交付實施以來,軟件發展逐漸導向敏捷性。2017年,處理和分析模型將進化到一個類似的敏捷度層面,因為企業認識到競爭優勢的來源并非簡單依靠大數據湖本身,而是數據敏捷性,以及其在不同場景對數據的理解能力和如何采取商業行動。敏捷處理模型的出現將使同樣的數據可以支持批量分析、互動分析、全球信息、數據庫和基于文件的模型。越來越多的敏捷分析模型也可以讓單一數據支持更廣泛的工具。最終結果就是產生可以支持最大范疇的處理和分析模型的敏捷發展和應用平臺。
·區塊鏈變革金融服務應用
Schroeder認為2017年數據存儲和交易處理的方式將令金融服務的選擇和轉換融合更廣泛地應用。區塊鏈提供了一個全球分布式總賬,這將改變數據存儲和交易的處理方式。區塊鏈運行于全球分布的計算機上,并可以被任何人查看。每個數據區塊按照時間順序相連,在不同區塊儲存的交易以時間戳界定儲存數據而不可纂改。黑客也認為區塊鏈理論上無法攻克。區塊鏈為消費者提供了顯而易見的效率。舉例來講,消費者不用等待SWIFT交易或者擔心中央數據中心泄露而產生影響。對企業來說,區塊鏈代表節約成本以及極具競爭優勢。
·機器學習最大化微服務影響
今年我們將看到機器學習和微服務的整合所帶來的活動增量。微服務部署將專注于輕量服務,其結合受限于“快數據”集成的機器學習,將應用于窄頻流媒體數據。2017年我們將看到很多狀態應用發展轉向以大數據結合機器學習的方式來處理大量歷史數據,從而更佳理解新增流數據的場景。
Hadoop服務解決方案
·智能網絡引領數據云攀升
感謝萬物互聯或全聯網(Internet of Anything ,IoAT)的持續發展和機器端到機器端的連接性,數據孤島將被數據云所替代。
·實時機器學習和分析蓄勢待發
智能設備將整合和分析一切,F代分布式數據應用中的實時機器學習算法將開始發揮所長-算法宣告了“端到端”實時決策的實現
·更前瞻性的分析
從延時處理到實時分析到提前分析并采取行動我們將看到一個從延時處理到實時分析到前瞻分析的演進過程,其驅動著各類交易而不是僅僅修訂或者優化它們。這將帶來變革性的影響,以數據為中心的商業能力將會迎來新的營收流、節約成本和改善與客戶的親密度。
·無處不在的現代數據連接
于那些以數據致勝的企業來說,應用和數據需要連接到同一個平臺或者架構,這是2017年現代數據應用的基石,F代數據應用非常便攜、集成性高以及互聯。他們將迅速取代那些垂直整合的獨立軟件。
·數據將成為每個人的產出
數據將成為可以購買、銷售或者損失的價值產品。屆時將有很多新途徑、新商業模式和新公司將觀望如何價值化這些資產。
開發和支持開源Apache Cassandra非線性數據庫商業版的公司DataStax預測
·數據工程師的適時出現
“數據科學家”這個術語將不再流行,而被“數據工程師”取代。數據科學家專注于數據科學的應用以及對關鍵業務問題的分析結果。數據工程師則是設計、構建以及管理大數據基礎架構,他們側重在架構和保證系統執行。
·安全
物聯網發展導致模糊地帶現今物聯網發展很大程度上有些失控。因為缺乏標準和數據的爆炸,誰來對安全負責并不是很明晰。最大的風險來自于互聯網服務提供商(ISP),這也是為什么過去一年中主要是他們在安全領域進行探討。
·企業級云應用導致混合云致勝
很多已有平臺上建立了數據庫的大型企業寧愿放棄也不愿交換其數據庫;旌蠑祿軜嬁梢院ㄒ延袛祿䦷,同時允許企業同時利用云應用,這將成為這些企業的主要關注點。
·去服務器架構解除緊關連
DataStax認為依靠第三方云應用或者云服務來管理服務器端的邏輯和狀態,或者說來運行在事件驅動的無狀態計算容器,這種去服務器架構將變得更為廣泛。對去服務器架構的采納將對應用如何部署以及管理產生更為廣泛的影響。
(文章轉自:搜狐網)