更多精彩内容,欢迎关注:

视频号
视频号

抖音
抖音

快手
快手

微博
微博

数据预处理的主要方法有哪些

文档

数据预处理的主要方法有哪些

数据的预处理是指对所收集数据进行分类或分组前所做的审核、筛选、排序等必要的处理;主要方法有数据清理,数据集成,数据变换,数据归约等。数据清理;数据清理例程通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。主要是达到如下目标:格式标准化,异常数据清除,错误纠正,重复数据的清除。数据集成;数据集成例程将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程实际上就是数据集成。数据变换;通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。数据归约;数据挖掘时往往数据量非常大,在少量数据上进行挖掘分析需要很长的时间,数据归约技术可以用来得到数据集的归约表示,它小得多,但仍然接近于保持原数据的完整性,并结果与归约前结果相同或几乎相同。
推荐度:
导读数据的预处理是指对所收集数据进行分类或分组前所做的审核、筛选、排序等必要的处理;主要方法有数据清理,数据集成,数据变换,数据归约等。数据清理;数据清理例程通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。主要是达到如下目标:格式标准化,异常数据清除,错误纠正,重复数据的清除。数据集成;数据集成例程将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程实际上就是数据集成。数据变换;通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。数据归约;数据挖掘时往往数据量非常大,在少量数据上进行挖掘分析需要很长的时间,数据归约技术可以用来得到数据集的归约表示,它小得多,但仍然接近于保持原数据的完整性,并结果与归约前结果相同或几乎相同。

数据的预处理是指对所收集数据进行分类或分组前所做的审核、筛选、排序等必要的处理;主要方法有数据清理,数据集成,数据变换,数据归约等。

数据清理;数据清理例程通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。主要是达到如下目标:格式标准化,异常数据清除,错误纠正,重复数据的清除。数据集成;数据集成例程将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程实际上就是数据集成。数据变换;通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。数据归约;数据挖掘时往往数据量非常大,在少量数据上进行挖掘分析需要很长的时间,数据归约技术可以用来得到数据集的归约表示,它小得多,但仍然接近于保持原数据的完整性,并结果与归约前结果相同或几乎相同。

文档

数据预处理的主要方法有哪些

数据的预处理是指对所收集数据进行分类或分组前所做的审核、筛选、排序等必要的处理;主要方法有数据清理,数据集成,数据变换,数据归约等。数据清理;数据清理例程通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。主要是达到如下目标:格式标准化,异常数据清除,错误纠正,重复数据的清除。数据集成;数据集成例程将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程实际上就是数据集成。数据变换;通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。数据归约;数据挖掘时往往数据量非常大,在少量数据上进行挖掘分析需要很长的时间,数据归约技术可以用来得到数据集的归约表示,它小得多,但仍然接近于保持原数据的完整性,并结果与归约前结果相同或几乎相同。
推荐度:
为你推荐
资讯专栏
热门视频
相关推荐
华硕a555怎么加内存条 南北方差异成语 房屋动迁补偿标准是什么 浙版西游记真假美猴王是第几集 宏碁台式机U盘启动设置 流量怎么共享 关于红楼梦癸酉本 皮肤屏障受损多久恢复正常 为什么仙人掌不用浇水就可以活 诺基亚n72的锁码怎么取消 怎么查高职高考录取 中考后做什么 香葱头怎样贮藏 放生自己家的锦鲤好不好 咖啡机的功能和使用方法 私人养果子狸当宠物国家允许吗 什么是垃圾车 求穿越到网游世界的小说 小说爵迹怎么样 旧床不要了怎么处理 平板支撑前怎么热身 抱者柴火救火的四字成语是什么 计算器包括哪两部分 红珊瑚为什么是红的 哪一款地图软件最好用 老年手机内存卡怎么往上插 液体压强的特点是什么 手机卡注销需要营业执照吗 scp049为什么是小天使 大学生的学业观是什么 小米4c手机后盖如何打开 小金桔冬天如何养护 北杏仁怎么吃 公共卫生包括哪些内容 一加五用什么软件能root 魅族3s有用过的吗怎么样 车牌可以注销重新选吗 女主叫夏倾城的穿越小说 酱油和醋打开口可以放多长时间 监控室的简介
Top