数据质量的评价指标主要包括数据的准确性(accuracy)、完整性(completeness)、简洁性(concision)及适用性(applicability),其中数据的准确性、完整性和简洁性是为了保证数据的适用性。下面针对数据质量的主要评价指标进行详细的介绍。 查看全文>>
Python+大数据技术文章2022-06-28 |传智教育 |数据质量的评价指标
无论是在Scala中还是Java中,类都是对象的抽象,而对象都是类的具体实例;类不占用内存,而对象占用存储空间。由于面向对象的核心是对象,若想要在应用程序中使用对象,就必须得先创建一个类。类是用于描述一组对象的共同特征和行为。 查看全文>>
Python+大数据技术文章2022-06-17 |传智教育 |Scala面向对象的特性
逻辑结构反映的是数据元素之间的关系,它们与数据元素在计算机中的存储位置无关,是数据结构在用户面前所呈现的形式。根据不同的逻辑结构来分,数据结构可分为集合、线性结构、树形结构和图形结构4种形式,接下来分别进行简要介绍。 查看全文>>
Python+大数据技术文章2022-06-08 |传智教育 |描述元素与元素间的逻辑关系,数据结构类型划分
一个正常运营的产品每天会产生大量的数据,如果把这些数据都收集起来进行分析,不仅会使工作量增加,浪费大量时间,很可能还会得不到想要的分析结果。作为一名数据分析人员,更不应该为了分析而分析,而是应该紧紧围绕你的分析目的(了解现状、分析业务变动原因、预测发展趋势等)去进行分析。所以,在开始数据收集工作之前,就应该先把数据分析的目的梳理清楚,防止出现”答非所问”的数据分析结果。 查看全文>>
Python+大数据技术文章2022-05-31 |传智教育 |数据分析常见的误区
今天的Python大数据培训课程我们讲一下MapTask工作原理,MapTask作为MapReduce工作流程的前半部分,它主要经历了5个阶段,分别是Read阶段、Map阶段、Collect阶段、Spill阶段和Combine阶段,如图4-7所示。 查看全文>>
Python+大数据技术文章2022-05-26 |传智教育 |Python大数据培训,MapTask工作原理
数据库是存储和管理数据的仓库,但数据库并不能直接存储数据,数据是存储在表中的,在存储数据的过程中一定会用到数据库服务器,所谓的数据库服务器就是指在计算机上安装一个数据库管理程序,如MySQL。数据库、表、数据库服务器之间的关系,如图所示。 查看全文>>
Python+大数据技术文章2022-05-25 |传智教育 |数据库中数据的储存结构和方式
在Scala中,集合有三大类:List、Set以及Map,所有的集合都扩展自Iterable特质。Scala集合分为可变的(mutable)和不可变(immutable)的集合。其中,可变集合可以在适当的地方被更新或扩展,意味着可以对集合进行修改、添加、移除元素;不可变集合类,相比之下,初始化后就永远不会改变。 查看全文>>
Python+大数据技术文章2022-05-23 |传智教育 |List,Set,Map
MySQL安装完成后,需要启动服务进程,否则客户端无法连接数据库。在前面的配置过程中,已经将MySQL安装为Windows服务,当Windows启动时MySQL服务也会随着启动,然而有时需要手动控制MySQL服务的启动与停止,此时可以通过两种方式来实现。 查看全文>>
Python+大数据技术文章2022-05-23 |传智教育 |MySQL的使用