Dataset不仅能从RDD中构建,它与DataFrame也可以互相转换,DataFrame可以通过as[ElementType]方法转换为Dataset,同样Dataset 也可以使用toDF()方法转换为DataFrame,具体代码如下: 查看全文>>
Python+大数据技术文章2021-09-09 |传智教育 |Dataset对象,创建Dataset
Kerberos 主要用来做网络通讯中的身份认证,帮助我们高效、安全的识别访问者。 那么 Kerberos 是如何做身份认证的呢? 我们来看一个现实中的例子: 查看全文>>
Python+大数据技术文章2021-09-03 |传智教育 |Kerberos,Kerberos身份认证案例演示
Zookeeper选举机制有两种类型,分别为全新集群选举和非全新集群选举,下面分别对两种类型进行详细讲解。 查看全文>>
Python+大数据技术文章2021-08-12 |传智教育 |Zookeeper选举机制类型
本节将通过Java API来演示如何操作HDFS文件系统,包括文件上传与下载以及目录操作等,具体如下: 查看全文>>
Python+大数据技术文章2021-08-12 |传智教育 | HDFS系统操作
赋值语句和set()函数两种方式都可以创建集合,但是最简单的方法是使用使用赋值语句,使用“{}”包含元素,各个元素之间使用逗号进行分隔,具体的操作如下: 查看全文>>
Python+大数据技术文章2021-08-10 |传智教育 |集合创建,集合常见操作
切片截取的范围属于左闭右开,即从起始索引开始,到结束索引前一位结束(不包含结束位本身)。我们把索引比作一把“刀”,在开始索引和结束索引的位置“切下”,“切下”的元素就是这个范围内的元素。步长的取值可以是正数和负数,默认值为1。 查看全文>>
Python+大数据技术文章2021-08-10 |传智教育 |切片,切片操作,步长大于0,步长小于0
从基础知识点到安装部署、集群配置、各种服务安装到增加新节点,通过知识点 + 实际操作的方式帮助小白快速掌握CDH的安装和配置。 查看全文>>
Python+大数据技术文章2021-08-09 |传智教育 |CDH安装与部署
Python源码不需要编译成二进制代码,它可以直接从源代码运行程序。Python解释器将源代码转换为字节码,然后把编译好的字节码转发到Python虚拟机(PVM)中进行执行。接下来,通过一张图来描述Python程序的执行过程,如图1所示。 查看全文>>
Python+大数据技术文章2021-08-06 |传智教育 |Python程序执行原理