在Surface对象上绘制图形分为加载图片和绘制图片两个步骤。加载图片即将图片读取到程序中,通过pygame中 image模块的load()方法可以向程序中加载图片,生成Surface对象。load()方法的声明如下: 查看全文>>
Python+大数据技术文章2022-07-21 |传智教育 |Surface对象绘制图形
之前我们讲过客户端向HDFS写数据的流程,接下来学习客户端从HDFS中读数据的流程,如图3-9所示,从图3-9可以看出,HDFS中的读数据流程可以分为4个步骤,具体如下... 查看全文>>
Python+大数据技术文章2022-07-12 |传智教育 |HDFS读数据流程,大数据培训
存储方式上的不同:关系型数据库采用表的格式进行存储,数据以行和列的方式进行存储,读取和查询都十分方便。非关系型数据库是以数据集的方式进行存储,即将大量数据都集中在一起存储,类似于键值对、图结构或者文档。 查看全文>>
Python+大数据技术文章2022-07-11 |传智教育 |关系型数据库与非关系型数据库的区别
键值对存储数据库键值对存储数据库是NoSQL数据库中的一种类型,也是最简单的NoSQL数据库。键对值对存储数据库中的数据是以键值对的形式来存储的。常见的键值对存储数据库有Redis、Tokyo Cabinet/Tyrant、Voldemort以及Oracle BDB等数据库。键值对存储数据库的结构示意图如下。 查看全文>>
Python+大数据技术文章2022-07-11 |传智教育 |NoSQL数据库分类
通常情况下,将数据源中不完整、重复以及错误等有问题的数据称为“脏”数据。由于数据仓库的数据来自底层数据源,因此“脏”数据出现的原因与数据源有密切的关系。基于数据源的“脏”数据分类如图所示。 查看全文>>
Python+大数据技术文章2022-07-07 |传智教育 |基于数据源的脏数据分类
应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描。如:select id from t where num is null可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:select id from t where num=0 查看全文>>
Python+大数据技术文章2022-07-04 |传智教育 |MySQL优化技巧
数据清洗技术是提高数据质量的有效方法。这项技术是一个较新的研究领域,对大数据集的清洗工作需要花费很长的时间。由于不同的应用领域对数据清洗有不同的解释,因此数据清洗直到现在都没有一个公认、统一的定义。数据清洗主要应用于3个领域,即数据仓库领域、数据挖掘领域以及数据质量管理领域。 查看全文>>
Python+大数据技术文章2022-06-28 |传智教育 |数据清洗,数据清洗的应用,数据清洗
基于数据源的“脏”数据分类方法需要为每种类型的“脏”数据设计单独的清洗方式。从数据清洗方式的设计者角度看,可以将“脏”数据分为“独立型“脏”数据”和“依赖型“脏”数据”两类。基于清洗方式的“脏”数据分类如图下所示。 查看全文>>
Python+大数据技术文章2022-06-28 |传智教育 |脏数据分类