超大規模帶來的性能要求
園區內監控對象的品牌、型號、協議類型繁多,且設備數量多。一旦數據量達到規模級別之后,就會出現各式各樣的問題。
穩定性可靠性要求(宕機頻繁)
由于數據量比較大,監控系統在運行的時候,任何一個節點一旦出現阻塞都是致命的。如果沒有方便可靠的監控報警平臺,對于運維人員而言猶如噩夢。
無法滿足監控水平和垂直擴展需求
隨著業務的拓展和延伸,以及不同管控要求,監控系統需要不斷提高水平和垂直擴展需求。
自主研發針對海量監測需求的數據庫
海量監控數據:分布式架構+非結構化存儲=水平擴張;高性能:分布式存儲與高并發訪問帶來性能的飛躍;敏捷開發:所見即所得。
64位緩存設計
監控數據先寫入緩存,再定時寫入數據庫磁盤,減少寫入壓力。64位緩存尋址,足以支撐單臺服務器監測上萬監測指標。
高可靠性
動態負載均衡,服務器根據數量和計算能力動態承擔監測任務;可靠雙機熱備,兩臺主服務器組成“主”-“備”模式;多機容災備份。
靈活+高可擴展性
采用云模式從多個容器采集數據,實現了本地采集+云端管理模式,多園區的統一管理控制臺部署在一臺阿里云主機上。

業務引領
對園區基礎設施進行巡查、監測、預警、分析、評價、 服務的全周期管理,解決園區業務綜合管理難問題。

技術驅動
通過提供監控基礎技術能力平臺,支持園區高效建立基礎設施監控和運維管理能力。

降本增效
通過靈活的部署模式和高性能的數據采集分析能力,整體降低資金成本。

自動化運維
運維管理從腳本化升級到自動化,實現所有設備秒級輪詢。自動預警告警,故障快速定位,保障 IT系統支持的各項業務更加穩定地運行。