Bootstrap是由Twitter公司的设计师Mark Otto(马克·奥托)和Jacob Thornton(雅各布·桑顿)合作开发的开源框架,该框架基于HTML、CSS和JavaScript语言编写,于2011年8月在GitHub上发布,一经推出就颇受欢迎。Bootstrap具有简单、灵活的特性,常用于开发响应式布局和移动设备优先的Web项目,能够帮助开发者快速搭建前端页面。 查看全文>>
Python+大数据学习常见问题2022-07-25 |传智教育 |Bootstrap,Bootstrap的特点有哪些
每个数据仓库都包含一个或者多个事实数据表,事实表是对分析主题的度量,它包含了与各维度表相关联的外键,并通过连接(Join)方式与维度表关联... 查看全文>>
Python+大数据学习常见问题2022-07-22 |传智教育 |事实表,维度表
数据清洗技术是提高数据质量的有效方法。这项技术是一个较新的研究领域,对大数据集的清洗工作需要花费很长的时间。由于不同的应用领域对数据清洗有不同的解释,因此数据清洗直到现在都没有一个公认、统一的定义。数据清洗主要应用于3个领域,即数据仓库领域、数据挖掘领域以及数据质量管理领域。 查看全文>>
Python+大数据学习常见问题2022-07-22 |传智教育 |数据清洗,数据清洗定义
数据质量的评价指标主要包括数据的准确性(accuracy)、完整性(completeness)、简洁性(concision)及适用性(applicability),其中数据的准确性、完整性和简洁性是为了保证数据的适用性。下面针对数据质量的主要评价指标进行详细的介绍。 查看全文>>
Python+大数据学习常见问题2022-07-22 |传智教育 |数据清洗,数据质量评价
每个ETL工具都会有自己的设计原则,Kettle也不例外。Kettle的设计原则一共有7点,具体内容如下... 查看全文>>
Python+大数据学习常见问题2022-07-21 |传智教育 |Kettle,Kettle设计原则
数据的加载是ETL的最后一个阶段,它的主要任务是将数据从临时数据表或文件中加载到指定的数据仓库中。一般来说,可以通过编写SQL语句和利用加载工具将数据加载到数据仓库中。ETL的数据加载和数据抽取类似,将数据加载到目标数据表或者数据仓库的过程中可分为全量加载、增量加载以及批量加载。下面详细介绍一下ETL的全量加载、增量加载以及批量加载。 查看全文>>
Python+大数据学习常见问题2022-07-21 |传智教育 |全量加载,增量加载
目前比较流行的ETL工具有Pentaho Kettle、Hawk、Informatica PowerCenter及DataStage,对这些工具的介绍如下... 查看全文>>
Python+大数据学习常见问题2022-07-20 |传智教育 |ETL常见工具介绍,大数据知识
Zookeeper分布式集群部署指的是Zookeeper分布式模式安装。Zookeeper集群搭建通常是由2n+1台服务器组成,这是为了保证Leader选举(基于Paxos算法的实现)能够通过半数以上服务器选举支持,因此,Zookeeper集群的数量一般为奇数。 查看全文>>
Python+大数据学习常见问题2022-07-20 |传智教育 |Zookeeper分布式,Zookeeper集群部署