大数据预处理

数据预处理负责将分散的、异构数据源中的数据如关系数据、网络数据、日志数据、文件数据等抽取到临时中间层,然后进行清洗、转换、集成,最后加载到数据仓库或数据库中,成为通过数据分析、数据挖掘等方式提供决策支持的数据。

数据预处理能够帮助改善数据的质量,进而帮助提高数据挖掘进程的有效性和准确性,因此数据预处理是整个数据挖掘与知识发现过程中的一个重要步骤。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容