元年(nián)

數字化轉型:AI中台如(rú)何在企業中落地(dì)

數據中台· 發布時間:2022-01-27

近年(nián)來,人工智能浪潮正在釋放出巨大的(de)創新能量。AI技術的(de)加速演進,給各行(xíng)各業、各類場景應用帶來了颠覆性的(de)變革。在全球數字經濟飛(fēi)速發展的(de)時代背景下,行(xíng)業數字化轉型和(hé)智能化升級已經全面啓動。

一(yī)、AI在企業落地(dì)的(de)痛點

企業中的(de)業務都運行(xíng)于大數據之上,大量的(de)業務、财務、稅務的(de)沉澱數據都是處于待開發狀态。在信息智能化轉型時代,信息就是價值。如(rú)何使這些數據真正活動起來,得到有(yǒu)價值的(de)信息,并創造額外的(de)價值,是每個企業都非常關心的(de)話題。比如(rú)根據曆史數據,一(yī)方面可(kě)以分析生産經營狀況,深度挖掘數據中的(de)模式,清晰地(dì)發現銷量變化趨勢,以及受哪些數據維度影響最大;另一(yī)方面利用曆史數據建模,可(kě)以對将來的(de)業務、财務、稅務狀況進行(xíng)評估和(hé)預測,及時進行(xíng)戰略調整。

大數據時代最活躍的(de)消費者是人工智能(AI),AI可(kě)以賦能企業,對龐大的(de)信息系統進行(xíng)降維,提取其中最重要的(de)結構化數據和(hé)要素矩陣。AI技術是這個時代普及最快的(de)技術之一(yī),企業都或多或少參與了AI能力的(de)消費,但是隻有(yǒu)積極參與AI的(de)生産,才能從源頭上抓住先機(jī)。

而AI的(de)工作流非常複雜,并擁有(yǒu)一(yī)定的(de)不确定性。面對海量的(de)沉澱數據和(hé)龐雜的(de)場景,如(rú)何從中發現知識,尋找隐藏在大數據中的(de)特定模式、趨勢和(hé)相關性(甚至因果性)以及其他可(kě)能的(de)商(shāng)業應用前景,都需要擁有(yǒu)更好的(de)數據洞察,并對現實業務産生正向反饋。随着數據量的(de)指數級增長(cháng),企業對高(gāo)價值信息的(de)模式發現和(hé)趨勢判斷都将變得越來越困難,由于缺乏清晰的(de)實施路線圖,企業往往無從下手,這主要受制于以下幾個因素的(de)影響:

技術門檻高(gāo)

人工智能(AI)是一(yī)門結合計算機(jī)、統計學(xué)和(hé)認知科(kē)學(xué)等的(de)跨學(xué)科(kē)技術,一(yī)方面需要技術人員有(yǒu)足夠的(de)數學(xué)知識來理(lǐ)解AI的(de)算法;另一(yī)方面需要将人對業務和(hé)數據的(de)理(lǐ)解,轉化為(wèi)人工智能的(de)算法建模。處在數字化轉型階段,企業更加關注的(de)是業務轉型和(hé)場景優化,組織算法團隊去(qù)解決技術問題的(de)人力和(hé)技術成本非常高(gāo)。

建模周期長(cháng)

算法的(de)實現過程,包含數據清洗、特征提取、特征編碼、算法設計、算法開發、優化和(hé)部署等等,每一(yī)步都存在不确定性,會影響到模型的(de)最終效果。而且還需要針對業務場景進行(xíng)特定優化,業務或者算法團隊內(nèi)部經常會重複造輪子(zǐ),不利于快速叠代,導緻建模的(de)成本高(gāo)、時間長(cháng)。

業務反應慢

從業務需求出發,從開始需求分析到最終算法建模完成,研發團隊需要針對性開展數據分析處理(lǐ)、模型的(de)構建訓練等,過程複雜繁複,效率不高(gāo),且有(yǒu)可(kě)能錯過決策的(de)最佳窗口期,拖長(cháng)了需求響應時間,從而造成業務的(de)損失,特别是對時機(jī)比較敏感的(de)行(xíng)業,比如(rú)快消品生産零售行(xíng)業。

零散需求多

企業的(de)業務需求往往比較零散,需要AI能力的(de)場景遍布橫向的(de)部門業務線和(hé)縱向的(de)期間業務流水,實現、管理(lǐ)和(hé)叠代這些應用場景耗費大量人力和(hé)腦力,造成成本和(hé)資源的(de)浪費。

模型黑盒化

衆所周知人工智能的(de)精度越高(gāo),模型越難解釋,特别是深度學(xué)習算法,人們很難在黑盒化的(de)模型中進行(xíng)數據洞察以及做(zuò)出業務決策,這是一(yī)個長(cháng)期困擾企業業務人員和(hé)決策層的(de)問題。企業從大數據中受益,也承擔了模型難以理(lǐ)解的(de)風險,最新的(de)人工智能潮流就包含了模型的(de)可(kě)解釋性和(hé)信任方向的(de)研究。

二、元年(nián)方舟AI中台的(de)解決方案

以數據中台、技術中台、業務中台為(wèi)代表的(de)一(yī)系列技術,極大地(dì)增強了業務敏捷性,通過沉澱共享服務,提高(gāo)複用率,打破“煙囪式”系統之間的(de)協作,降低(dī)業務試錯成本。企業專注于業務的(de)快速創新能力,從而提升企業業務和(hé)技術的(de)管理(lǐ)效能。

随着企業智能化發展的(de)要求,AI應用參與業務的(de)比例越來越高(gāo),但AI模型開發的(de)周期長(cháng)、不确定性高(gāo),嚴重影響了下遊業務推進。而企業應用AI的(de)目标通常是:根據業務數據和(hé)市(shì)場動态,對曆史數據進行(xíng)挖掘、分析和(hé)洞察,通過人工智能算法對數據進行(xíng)降維并抽象出效率高(gāo)、效果好的(de)模型,從而對将來的(de)業務進行(xíng)預測、推演和(hé)決策。為(wèi)此,元年(nián)算法團隊推出了AI中台産品,可(kě)以全方位地(dì)為(wèi)客戶的(de)業務優化進行(xíng)AI賦能。

1、元年(nián)方舟AI中台架構設計


能否基于中台化思想對AI研發的(de)數據、流程和(hé)模型成果進行(xíng)高(gāo)效的(de)組織和(hé)管理(lǐ)?目前數據中台提供了貫通一(yī)緻的(de)數據管理(lǐ),在未來,數據中台則更多基于數據和(hé)算法來進行(xíng)科(kē)學(xué)決策,擁有(yǒu)為(wèi)數據決策提供戰略洞察的(de)能力。為(wèi)滿足業務需求,數據中台背後需要有(yǒu)強大的(de)計算引擎和(hé)AI算法引擎支持,這為(wèi)打造AI中台提供了契機(jī)。元年(nián)方舟AI中台對接數據中台,實行(xíng)統一(yī)的(de)數據管理(lǐ),并以此為(wèi)基礎形成了開發流程和(hé)模型管理(lǐ)的(de)高(gāo)效的(de)一(yī)體化解決方案。圖1展示了典型的(de)AI中台架構圖。

2、元年(nián)方舟AI中台技術特點

AI中台旨在賦能企業用戶在數小時內(nèi)實現多樣化的(de)AI能力。從設計之初,就是面向企業的(de)業務人員、數據科(kē)學(xué)家、算法人員打造。提供多種人工智能建模方式,讓用戶能快速創建算法模型,自(zì)動生成服務并發布到生産環境。在此服務的(de)基礎上,我們提供了場景豐富的(de)數據洞察、預測、歸因、決策、反饋等功能。


表中總結了AI中台的(de)一(yī)些特點,因此元年(nián)方舟AI中台實際上提供了一(yī)種融合了AI+BI一(yī)體化的(de)快速響應方案,讓終端用戶從業務數據入手,從人工智能的(de)被動消費者積極轉變為(wèi)主動生産者的(de)角色,利用AI提供的(de)探索、分析、預測、決策線索,抓住市(shì)場先機(jī)。下面就幾個最大的(de)特點進行(xíng)詳細介紹:

AIaaS:AI 即服務,為(wèi)企業AI的(de)開發、管理(lǐ)、部署、監控、注冊服務提供一(yī)站式解決方案,形成全生命周期的(de)AI服務管理(lǐ)。業務人員和(hé)算法人員借助平台能力,可(kě)以快速實現模型的(de)訓練、部署和(hé)發布,需求交付周期大大縮短(duǎn),建模周期從周的(de)量級縮短(duǎn)到1小時甚至十分鍾。分析人員和(hé)決策者可(kě)以根據市(shì)場行(xíng)情,快速實現洞察、分析、歸因和(hé)決策,抓住市(shì)場機(jī)遇。

聚焦業務:AI中台幫助用戶省去(qù)了繁瑣的(de)建模步驟,用戶隻需要關心數據和(hé)業務本身,就可(kě)以實現高(gāo)精度的(de)AI能力,用于後續對業務的(de)探索、預測、分析和(hé)決策。業務可(kě)以是千變萬化,不同行(xíng)業或者不同領域遵循同一(yī)套建模和(hé)管理(lǐ)方案,都可(kě)以用非常小的(de)代價以标準化的(de)接口方式嵌入到用戶的(de)使用場景中。聚焦業務還意味着離(lí)散需求可(kě)以抽象為(wèi)通用需求,可(kě)以多次複用和(hé)叠代線上算法,比如(rú)匹配模型既可(kě)以用在酒店實體(POI)的(de)智能化對齊中,也可(kě)以用在回款認領的(de)過程中。同時我們會定期推出開箱即用的(de)人工智能組件,用于不同的(de)業務需求。

自(zì)動化調參:算法實現過程中,選擇合适算法和(hé)參數往往依賴算法工程師的(de)經驗。這些流程通常比較耗費時間、有(yǒu)技術門檻并且非常複雜。算法團隊根據特征的(de)數據類型(比如(rú)數值型、文本型、日期型和(hé)布爾型等),對預處理(lǐ)、特征預處理(lǐ)、特征編碼、算法建模和(hé)參數優化等流程,全部進行(xíng)了自(zì)動化處理(lǐ);對模型的(de)超參數進行(xíng)了随機(jī)搜索和(hé)貝葉斯優化等多種優化處理(lǐ),用戶不需要指定參數,就可(kě)以從AI中台得到訓練好的(de)最優模型,實現業內(nèi)領先的(de)AutoML能力。

解釋和(hé)決策:融入模拟預測、數據洞察、歸因分析等多種商(shāng)業智能能力,幫助用戶理(lǐ)解模型、建立信任,發現生産經營中的(de)重要因素以及決策的(de)關鍵線索。算法團隊使用博弈論中著名的(de)Shapley指标,來估算模型中每個特征對預測結果的(de)影響程度,從而形成預測結果的(de)歸因分析。

3、元年(nián)方舟AI中台建模方式


元年(nián)方舟AI中台提供了以下幾種建模方式:

(1)面向業務人員、分析人員的(de)無代碼建模場景

為(wèi)業務人員和(hé)數據分析人員提供無代碼建模平台。衆所周知,人工智能算法要達到比較好的(de)效果,需要完成冗長(cháng)的(de)建模流程,并且進行(xíng)每一(yī)步流程的(de)優化。使用元年(nián)方舟AI中台,用戶無需調參,隻需要上傳表格數據集,就可(kě)以擁有(yǒu)快速實現分類、預測和(hé)時序預測的(de)能力。

(2)面向算法人員的(de)jupyter建模方式

通過jupyter環境,賦能企業的(de)算法人員自(zì)定義實現算法功能。企業算法人員隻需要專注于算法本身的(de)開發,而不需要關心數據的(de)存儲、環境的(de)搭建、服務發布等細節,并可(kě)以自(zì)動化發布為(wèi)服務API,經過測試的(de)算法最終也可(kě)以成為(wèi)通用的(de)企業組件,在業務之間共享。

(3)面向企業單業務場景的(de)預置組件方式

預置組件是元年(nián)算法團隊針對通用場景開發的(de)一(yī)系列深度學(xué)習模型,用戶隻需要根據業務場景選擇算法組件并提供訓練數據,就可(kě)以實現諸如(rú)文本分類、文本匹配、實體識别、關系提取、情感分析等常用的(de)功能。值得一(yī)提的(de)是,元年(nián)會持續提供業财稅和(hé)行(xíng)業內(nèi)的(de)模型,幫助企業在業務中迅速實現相關場景的(de)賦能。

三、AI中台的(de)建模過程

AI中台的(de)最大價值在于将企業的(de)核心業務和(hé)繁雜的(de)建模過程高(gāo)效解耦,用戶隻需要聚焦于業務本身,提煉建模需求,而不需要關注建模的(de)細節,從而形成業務數據—模型生産—模型消費—業務反饋的(de)閉環。


如(rú)上圖所示,用戶聚焦于業務本身,有(yǒu)兩層含義:一(yī)是用戶需要從公司的(de)業務場景中提煉出業務需求,形成能夠代表典型業務場景的(de)數據,進行(xíng)模型的(de)生産,而不用感知建模的(de)過程。二是AI應用對于業務的(de)反饋,用戶可(kě)以根據模型反饋及時制定調整措施,這是模型的(de)消費過程。

元年(nián)方舟AI中台的(de)敏捷建模過程,幾分鍾內(nèi)就可(kě)以生産出模型,極大提高(gāo)企業使用AI應用的(de)便捷性和(hé)時效性。模型生成之後可(kě)以進行(xíng)模型消費,從而根據反饋信息及時做(zuò)出業務調整和(hé)決策。下面我們就通過兩個場景,了解一(yī)下消費過程。

場景1:時序模型預測

據曆史數據進行(xíng)生産、銷售、收入等指标的(de)預測,是每個公司的(de)基本需求,也是最廣泛的(de)一(yī)類應用場景。通常是分析型數據的(de)預測,比如(rú)房價預測、公司産品銷量預測、熱度走勢等等,這種預測往往具有(yǒu)時間周期的(de)變化趨勢,構成一(yī)種特殊的(de)預測場景,成為(wèi)時間序列預測(簡稱時序預測)。舉個例子(zǐ)來說,根據國(guó)外某産品的(de)每周銷量,預測未來幾周的(de)銷量,這是一(yī)個時序預測的(de)場景,我們用上面的(de)視(shì)頻來展示建模過程。


上圖顯示了該産品的(de)每周銷量,可(kě)以發現明顯的(de)周期性演化特征,并且在節假日(聖誕節、感恩節前後)有(yǒu)明顯的(de)銷量暴漲的(de)特征。陰影區域是模型預測結果,實線是真實結果,可(kě)以看出商(shāng)家需要為(wèi)即将到來的(de)銷量高(gāo)峰,準備合适數量的(de)庫存;如(rú)果銷量下降,商(shāng)家需要考慮如(rú)何清理(lǐ)庫存。

場景2:銷量預測+歸因分析+模拟預測

某汽車公司想要測算下一(yī)季度某車型在某地(dì)的(de)銷量走勢,那麽需要提供的(de)數據應該盡可(kě)能包含車型的(de)參數、宏觀經濟、消費習慣、競争對手、國(guó)家政策、節假日等特征數據,模型的(de)生産過程以數據為(wèi)核心資源。在消費過程中,用戶可(kě)以深入了解數據特征對于銷量的(de)影響。建模完成發布成應用,就可(kě)以考察歸因分析、模拟預測和(hé)批量預測等應用頁面。

歸因分析通常使用瀑布圖表示,藍色的(de)表示對銷量有(yǒu)正向貢獻的(de)數據特征,橙色表示負向特征,柱圖的(de)高(gāo)度越大表示正向/負向的(de)程度越高(gāo)。圖5展示了車長(cháng)、車寬、品牌等因素是影響銷量的(de)最大幾個正向因素,而排量、價格是最大的(de)幾個負向因素。


如(rú)果想深入考察某一(yī)特定因素的(de)影響,比如(rú)品牌,可(kě)以下鑽該維度,了解哪些品牌的(de)銷量更多,下圖展示id 638的(de)品牌(數據已脫敏)銷量超出所有(yǒu)品牌平均銷量的(de)22%,如(rú)下圖所示:


在了解哪些因素影響比較重要之後,可(kě)以模拟改變某個因素看銷量會如(rú)何變化,見圖7。因此模拟預測可(kě)以輔助客戶進行(xíng)決策,對導緻銷量下降的(de)某些因素做(zuò)出調整。真實的(de)輔助決策場景會更加複雜,有(yǒu)些宏觀因素無法預見和(hé)幹預(如(rú)天氣、GDP、疫情、房價走勢等等),或者根本不在數據集中,真實場景使用時需要關注數據缺失帶來的(de)預測偏差。


上述案例介紹了模型的(de)生産過程和(hé)一(yī)般場景的(de)消費過程,更多的(de)業務場景同樣可(kě)以泛化。元年(nián)方舟AI中台為(wèi)企業提供功能豐富、靈活高(gāo)效的(de)一(yī)站式AI應用模型效率化生産平台,助力企業智能化,提高(gāo)其自(zì)身業務價值,讓AI與業務深度融合。

>>

解決方案

白皮書

研究報告

咨詢熱線

400-680-2995