“未來的油田在需要計算數據的時候,會升到‘云端’,完成高速計算,在數據需要存儲時降到‘湖里’,形成大數據生態系統。”3月2日,冀東油田信息中心主任王者云介紹道。
近年來,冀東油田將推進數據資源建設放在首要位置,完善和深化智慧化油田建設頂層設計,應用了“數據湖”框架體系,深化數據資源治理,完善數據中心主庫,打通專業數據“入湖”通道,數據治理工程已完成70%。構建跨系統、跨專業數據共享,應用集成體系,提升管理效率。
開啟“數據湖”應用新時代
如何獲取、處理和使用數據來創造效益,借助數據探索引領企業發展?這一難題擺在信息中心全體人員面前,他們圍繞“如何管理數據”和“如何使用數據”,進行頂層謀劃。
信息中心從制度上,加強對源頭數據的管理,引入PDCA管理模式。從規范上,繼續推進非結構化數據治理工作。從業務上,建立勘探開發全息數據采集系統,加強數據質量技術管控。從服務上,完善數據中心主庫,深化數據共享服務,加強用戶行為審計。
信息中心提出了由“數據湖”為企業提供數據服務,開啟了數據應用的新時代。“數據湖”是以原生格式存儲數據的方法,對企業中所有結構化、半結構化、非結構化和二進制數據進行統一存儲,可以利用機器學習技術和算法進行建模。
通過兩年的時間,截至3月2日,信息中心已完成鉆井、錄井、測井、井下、分析化驗、動態監測專業庫技術成果類數據的集成和需擴充的生產動態數據的梳理,編制數據同步接口12類112個,A1、A2、A5系統中的核心數據已全部入“湖”,其中結構化數據63類784.2731萬條,非結構化文檔數據17類1.1773萬個。
規范數據資源建設管理
3月1日,信息中心數據管理室員工李旭和趙淑穎利用技術手段精確定位數據質量。他們制定質控規則1830條,實現核心數據的自動質量掃描、數據質量報告的自動生成,變“人工隨機抽查”為“全庫自動掃描”,精準定位錯誤數據,為數據的快速整改提供了依據。
多年的信息化建設,冀東油田相繼建設完成84個應用系統,積累了海量寶貴數據,但各系統之間存在主數據不一致、數據標準不一致、數據采集不統一、數據管理制度不健全、數據共享困難等問題。他們建立統一的數據標準和管理規范,為后續提供高效、優質的數據服務。
信息中心明確各類數據歸檔時間節點,建立了新井數據采集流程,保障新數據及時準確入庫。強化入庫數據質量檢查,確保數據治理效果。采用常態檢查與專項檢查相結合的方式,完成了數據治理單位的檢查全覆蓋,發布歷史數據治理通報材料7次,新數據采集質量公報1次。
數據治理應用成效顯著
1月25日,科研人員利用開發生產智能系統單井生命周期系統,輕點鼠標,便可清楚地觀看到每一口井的日生產曲線、產液剖面圖等信息。
通過近兩年的努力,冀東油田目前已實現數據管理標準和流程規范化、單井全生命周期的管理、新井數據自動技術管控,中心主庫數據入湖支撐了上游業務應用。
運行時,信息中心精準推進數據治理工作,逐步形成了三級管理、五級質量控制、兩級技術支持的數據治理體系。
勘探開發研究院2018年度在研84個項目已全部納入平臺管理,其中8個重點測試項目已部分實現在線工作。地震處理解釋輔助數據加載,以往手工分散加載,5口井需5小時,目前提速到5分鐘,輸入、輸出效率大幅提升。
研究人員采集數據現場入庫,樣本點及表征交互甄選,開展測井解釋研究。平臺一鍵推送,圖版研制過程可視、交互、便捷。以油氣層圖版識別為例,一個區塊30口井數據準備、交會圖繪制、標準圖版研制從以往12小時縮短到30分鐘。