係統上雲是數字(zì)經濟發展的潮流,在數字化轉型的浪潮中,上雲(yún)已經成為推動各行各業創新和效率提升的關鍵力量。運(yùn)營商作(zuò)為服務行業和企業上雲的服務商,積極響應國家號召的同時為行業上(shàng)雲打造案例標杆,自身的係統(tǒng)要(yào)首先上雲。
運營商運營支撐體係(xì)上雲也有內(nèi)在的需要,係統架構不統一、依賴傳統IOE硬件、單體架構等,帶來了部署成本高、維護(hù)困難、無(wú)法根據業務(wù)彈性伸(shēn)縮、新業務擴展支撐響應慢等一(yī)係列(liè)問題。互(hù)聯網企業的雲(yún)化實踐以及前(qián)期的試點經驗都表明,上雲是高效解決這些問題的必由之路。
參考互聯網企業雲(yún)化實踐思路,結合運營商現網係統情(qíng)況,按照“先(xiān)雲化,再上雲”的策略,采取去IOE、微服務(wù)化、容器化、中心化、統一和多(duō)底座兼容、雲化工具配套 6大舉措實現上(shàng)雲,最終達成節省IT投資、簡化配(pèi)置部署、彈性伸縮、快速集成、靈活擴展(zhǎn)和降低運維難度的目標。

運營商係統上雲存在很多挑戰,包括但不限於架構適配改造工作量大,性能、可靠性和安(ān)全風險高,現有標準不滿足雲化特性,缺乏底座能力,存在工程實施周期長、風險高、業務遷移(yí)難(nán)和運營效率低等多方麵挑戰(zhàn)。
運營商的係統往往是(shì)基於傳統的(de)、大型的、集成度高的架構設計,這些係統需要大量的改(gǎi)造(zào)才能適應(yīng)雲(yún)環境(jìng)。例如,將單體應用拆分為微服務架構(gòu),需要重新設計服務的模塊、通信機製等等。舊係統未微服務化,依賴較(jiào)重的中間件,煙囪(cōng)式(shì)支撐業務,升級較為繁瑣,無法動(dòng)態伸縮部署,前後(hòu)端未做分離(lí),定位(wèi)問題困難等,需要在較短時間內完成(chéng)係統的(de)架構升級。
現有標準不滿足(zú)雲化特性,缺乏統(tǒng)一平台底座現有係統基於(yú)IOE構建,使用重量級中間件或開源中間件,未使用統一(yī)的PAAS組(zǔ)件。缺乏統一平台底座,導致係統雲化改造缺乏統一架構標準、改造工作量大、擴(kuò)展支撐難度高,例如不(bú)具備低代(dài)碼快(kuài)速配置實現前端需求能力、報表快速配置能力。
上雲要求複雜的項目管理、多方協調和技術實施,這些(xiē)因素可能導致上雲項目延期或(huò)預算超支。追求快速上(shàng)雲的過程(chéng)中,過於複雜或不明(míng)確的項目目標和範圍設定可能導致實施進度緩慢(màn),難以在(zài)預定(dìng)計劃完成。
運營商(shāng)業務複雜,為保證業務正常運行,需同時兼顧新老係統(tǒng)需求的並行支撐。共性需(xū)求沒有統一研發,不(bú)能共享成果,人(rén)力資源浪費,個性化需求(qiú)響應不及時,端到端全流程有斷點,無法快速的承接遷移(yí)業務。
流程業務配置工作量大,需要配置流程、環節、時限和業務組件埋點等,表單個性化需求較多、表單(dān)界麵多,需投入較多前段人力開發。
定製化需求多(duō),變(biàn)更較為頻繁,上線後難運維,缺乏故障快(kuài)速發現、定位、處理手(shǒu)段,並且無法快速進行需求研發(fā)迭代。
在運營商係統上雲實踐過程中,為(wéi)達成係(xì)統雲化特性標準,針對上雲過程中的諸多困難點,按照“八步(bù)法”組織實施(shī),有(yǒu)序推進,實現了係統(tǒng)並行實(shí)施和快速上(shàng)雲。
總(zǒng)體(tǐ)思路是基(jī)於統一底座實現多業務係統統一雲化架(jià)構(gòu),優化資源利用率,整(zhěng)體上實現業務與技術(shù)的解耦,提高(gāo)係(xì)統的靈活性和可維護性。
架構自下而上分(fèn)為硬件層、PAAS層、應用層以及展示(shì)層,其中硬件層提供必要的計算能力、數據(jù)存儲能力和網絡通信能力,是支撐上層應用運行的物理基礎,硬件資源通常通過虛擬化技術被抽象化(huà),以支持更靈活和可擴展的網絡(luò)功(gōng)能和服務;PAAS層為上層業務應用提供了統一的雲化技(jì)術底座,提供流程平台與搜索引擎、開放(fàng)的(de)API設計能力、低(dī)代碼能力的表單設計器、靈活的規則配置平台與報表平台等組件或能力;應用層基(jī)於服務能力開放平(píng)台支持模塊化服務,通過API快速集成構成多業務係統,采用容器化技術來封裝和部署各種應用和服務,保(bǎo)障雲資源環境的一致(zhì)性(xìng),支持快速部署和拓展,資源隔離(lí),可伸縮性;展示層提供雲化應用係統的統一對外交互界麵。

針對上雲的挑戰和目標,對標上雲(yún)目標特(tè)性,製定了以(yǐ)下目標(biāo)措施:
完(wán)成係統去IOE及去Weblogic、Websphere 等商業軟件;
統一使用平台(tái)PaaS組件,包括不限於Cache,pg,mq等等;
能力注冊:對外(wài)提供能力注冊平台,有效調(diào)用,應用和(hé)界麵解耦,核心功能能夠(gòu)注冊並調用;
代碼(mǎ)平台托管:全量代碼托管到平台代碼倉庫且動態(tài)更(gèng)新;
CI/CD:容器化實現平台的編譯打包和部署,實現動態伸(shēn)縮;
敏捷開發(fā):平台實(shí)現從(cóng)軟件開發需求到可部署代碼的開發全過程管理;
故障快速定位解決: IaaS/PaaS/SaaS相關業務指標監控(kòng),故障時快(kuài)速發現(xiàn)並定位,較短時間內處理解決。
以(yǐ)微服務化架構對外(wài)提供服務,實現應用與平台(tái)解耦,基(jī)於這個核心底座,可以快(kuài)速進行業務(wù)流程的加載,實現敏捷開發、實現需求開發測試上線(xiàn)轉維的全周(zhōu)期管控。統一(yī)底座包含如下一係列共享平台(tái)組件:
流(liú)程平台:嚴格遵循BPMN規範,提供全麵的流程管理功能,包括流(liú)程定義、監聽(tīng)配置和部署。支持流程實例的創建、啟動和完(wán)成,支持任務節點的生成、完成,以(yǐ)及環節參與者的指定、簽收、改派和加派等操作。此外,平台還提供(gòng)靈活的微流程設計工具,以適應各種業務需(xū)求,確保流程管理的高效和靈活。
自定義表單設(shè)計器:支持(chí)低代碼的方式快速配置表單的各項業務屬性(xìng)、數據(jù)源,適合不同設計與應用(yòng)場景。
API設計平台(tái):支持多種(zhǒng)通信協議,如:http/restful、soap/webservice、websocket。
規則平(píng)台:支持一個規則定義下(xià)有百萬級規則(zé)實例數,可根據多(duō)種(zhǒng)條件(jiàn)組(zǔ)合規則進行智能調度。
報表平台(tái):新報表平台支持多數據源、可視化設計、多種類型表格及圖表,提供豐富模板,支持快速(sù)自定義配置。
搜索平台:集成高效的Elasticsearch查詢分析服(fú)務,優化並加速工單搜索過程確保(bǎo)快速準確地檢索相關工單信息。
架構升級原則(zé)依托於雲原生的10要素(sù)(前後端分離、應用與(yǔ)數據解耦、中心(xīn)化&微服(fú)務設計、無狀態設(shè)計、應用與配置分離(lí)、統一日誌、水平擴展、快速啟動、容器部署、應用敏(mǐn)捷交付)實現架構(gòu)彈性伸縮(suō),具備研發雲、雲眼、雲橋等平台對(duì)接的能力。

合理的利用工具(jù)能提升研發、配(pèi)置效率,做到事半功倍的效果(guǒ),業務發布助手以及底代碼表單工具為快速上雲實踐提供了(le)巨大助力。
業務發(fā)布助手:實現將業務場景設計的流(liú)程、表單、埋(mái)點、調度策略、時限規則等業務配置打包,發(fā)布到其他環境(jìng),如從(cóng)研發環境生(shēng)成業務包(bāo),發布到生產環境,避免(miǎn)重複配置,提升上雲業務配置效率。
低代碼表單工具:基於低代碼(mǎ)表單平台“拖拉拽”的模式快速實現界麵需求,省去大部分的編碼工作量,降低(dī)了研發門檻,節約資源投入,提高效率。

業務遷移的過程采取專題需求版本統一研發、規範發布、自動數據遷移比對(duì)和共性能力預置等手段,幫助核心業務流(liú)程快速遷移整合。
統一研發:針對專題需求,由統一團隊對需求進行統一分析、設計和研發,製定基線版本(běn),最大程度上縮短交付周期。
規範發布(bù):統一版本包(應用包+數據包)、部(bù)署操作手(shǒu)冊、演示(shì)腳本(běn)等,支持定製需求落(luò)地。
自動數據遷移比對:對於複(fù)雜流程,針對性的設計了數據遷移比對流程,較好的(de)實(shí)現了(le)舊係(xì)統數據(jù)的遷移到雲化係統。
共性能力預置:針對具有共性的業(yè)務場景在出廠時預置(zhì)了對應的模塊以及配置數據,實現快速的業務遷移,具備可(kě)複製性可推廣性。
為應對多(duō)項目並行交付的挑戰,確保項目同步推進,統(tǒng)一支撐團隊通過優化資源配置和規範化交付流程,快速識別(bié)並解決潛(qián)在問題,統一版本輸出,加強各省項目的統一性和效率。同時建立了項目交付模型框架,在交付前中後六個階段規定了標準動作輸出,係統化地(dì)推進交(jiāo)付運(yùn)營並提升交付質量。

係統遷移上雲(yún),需優(yōu)化需求(qiú)保障、研發提效、運維提升等各種運營(yíng)指(zhǐ)標,做到事中並行保障,事後優化提升。
1、針對多項目並發需求,采取統一支撐,亮點共(gòng)享,個性需求小(xiǎo)循環(huán),共(gòng)性需求大循(xún)環的模式。
統一團隊作為需求分析接口人過濾共性需求還是個性化需求,如果判定為個性化需求就由各自團隊內部進行分析、設計、研發、測試、交付;如果是共性需(xū)求則由統一團隊進行後續的(de)流(liú)程,做到多點交付,亮點共享,節約成本。
2、運維上采取多個有效措施,來解決發現難、定位慢、解決差的問題。
針對中間件比如cache,mq,數據庫等問題,利用監(jiān)控平台進行日常監控,出現問題及時(shí)發現並告警(jǐng)通知。針對應用(yòng)類故障的引(yǐn)入調用鏈(liàn)相關,提供圖形化界麵快速定位故(gù)障點,避免傳(chuán)統人工排查日誌定位。針對故障出現的業務數據修複(fù),引(yǐn)入業務(wù)清障助手,可以批量快速的處理故障引發(fā)的異常業務數據。

基於上雲采取的積極有效措施,團隊在一年內完成了超過(guò)30套係統的快速上(shàng)雲,取得了良(liáng)好的(de)效果。經(jīng)運行監測發現,係統上雲後,係統性(xìng)能上提升35%左右,穩定性大幅提高(gāo),係統(tǒng)部署和運(yùn)維成本降低幅度達到75%,係統不再依賴昂貴的硬件和商用中間件,節省了大量的IT投資;雲環境支持快速部署新服務和應用,響(xiǎng)應變化的速度比傳統IT架構快50%以上;DevOps和自動化工具的集成簡化了開發和運維流程,使得新功能從開發到上線的時(shí)間可以縮短至幾小(xiǎo)時(shí)或幾(jǐ)天。