本帖最后由 AAS数据可视化 于 2018-11-7 17:40 编辑
Talend 是一种ETL工具 ETL是Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载。主要是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。 Talend,是一家专业的开源集成软件公司。Talend提供集数据集成,数据分析以及清洗,主数据管理,应用集成为一体的软件提供商。 相比其他传统ETL工具,Talend还有一个优势那就是他是开源的。作为开源数据管理的先行者,这款开源工具可执行数据仓库到数据库之间的数据同步,检测数据源中的数据,收集数据的统计和其它相关信息。 应用Talend这款软件,在做任何项目之前,可以通过它发现数据质量的水平,理解数据特性, 鉴定潜在问题,减少发现问题数据需要的时间和资源,使业务分析人员更为有效地控制数据的管理与维护。 内置数据清洗器通过转置数据来提高质量,通过删除或回收错误的记录,如姓名、地址、电话等,去除不连贯、重复的数据等,从而增强/扩充数据,将数据标准化,进而保留下来正确的数据。 |