樊哲宁,杨秋辉,翟宇鹏,万莹,王帅.重复数据中关键属性值缺失填补的改进ROUSTIDA算法[J].计算机科学,2019,46(2):30-34
重复数据中关键属性值缺失填补的改进ROUSTIDA算法
Improved ROUSTIDA Algorithm for Missing Data Imputation with Key Attribute in Repetitive Data
投稿时间:2017-12-05  修订日期:2018-03-22
DOI:
中文关键词:  数据预处理,重复数据,缺失填补,ROUSTIDA算法
英文关键词:Data pre-processing,Repeated data,Missing data imputation,ROUSTIDA algorithm
基金项目:
作者单位E-mail
樊哲宁 四川大学计算机学院软件学院 成都610065 fanzheningchn@163.com 
杨秋辉 四川大学计算机学院软件学院 成都610065 yangqiuhui@scu.edu.cn 
翟宇鹏 四川大学计算机学院软件学院 成都610065  
万莹 四川大学计算机学院软件学院 成都610065  
王帅 四川大学计算机学院软件学院 成都610065  
摘要点击次数: 0
全文下载次数: 0
中文摘要:
      随着数据分析研究的兴起,数据预处理越来越得到研究者的重视,其中缺失数据填补问题的重要性也逐渐显现。在ROUSTIDA数据补齐算法的基础上,针对具有关键属性的重复数据的特点,文中提出了一种改进的ROUSTIDA算法——Key&Rpt_RS算法。Key&Rpt_RS算法继承了ROUSTIDA算法的优势,同时考虑了目标数据的重复性特点,分析了关键属性对填补效果的影响,得到了更加准确且有效的填补结果。
英文摘要:
      With the rise of data analysis,the importance of data pre-processing has attracted more and more attention,especially the imputation of missing data.Based on the ROUSTIDA algorithm,this paper proposed an improved ROUSTIDA algorithm-Key&Rpt_RS algorithm.Key&Rpt_RS algorithm inherits the advantages of ROUSTIDA algorithm,considers the characteristic of repeatability in objective data,and analyzes the influence of key attribute on imputation effect.At last,this paper conducted the experiments based on the alarm data in communication network.The results show that Key&Rpt_RS algorithm outperforms the traditional ROUSTIDA algorithm in terms of the imputation effect for missing data.
查看全文  查看/发表评论  下载PDF阅读器