收藏本站
收藏 | 投稿 | 手機打開
二維碼
手機客戶端打開本文

水力壓裂缺失數據填補方法研究比較

樊毅龍  馬先林  連建文  
【摘要】:缺失值填補是機器學習算法數據預處理中不可或缺的任務。以蘇東壓裂直井為例,通過篩選收集了800口井的地質、壓裂施工和生產三個方面的數據集。應用機器學習數據預處理方法在R語言中對缺失值可視化描述。并繪制無阻流量與各自變量之間的散點矩陣圖,分析線性關系較為顯著的自變量。通過構造完整數據集,對線性關系較好的自變量建立多元線性回歸模型,分析該回歸模型的各個參數及其標準誤差并作為參考標準。分別采用均值填補法、K最近鄰填補法和多重填補對缺失值進行填補,將填補的數據集與完整數據集的參數及其標準誤差進行比較后,發現就此數據集缺失機制和缺失率而言,選擇多重填補法效果最佳。

知網文化
中國知網廣告投放
 快捷付款方式  訂購知網充值卡  訂購熱線  幫助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978


黑粗硬大欧美在线视频