Scala和Java一样也有方法和函数。Scala的方法是类的一部分,而函数是一个对象可以赋值给一个变量。换句话来说,在类中定义的函数即是方法。Scala中可以使用df语句和val语句定义函数,而定义方法只能使用def语句。下面来讲解Scala的方法。 查看全文>>
Python+大数据技术文章2022-09-16 |传智教育 |Scala方法,def语句定义方法
二维数据是一维数据的集合,以此类推,三维数据可以是二维数据的集合,但按照此种层层嵌套的方式组织数据,多维数据的表示会非常复杂。为了直观地表示多维数据,也为了便于组织和操作,三维及以上的多维数据统一采用键值对的形式进行格式化。 查看全文>>
Python+大数据技术文章2022-09-14 |传智教育 |多维数据键值对形式格式化
在计算机中,根据组织数据时与数据“有联系”的参数的数量,数据可分为不同的维度,本节将对数据维度(不同维度数据格式相互转换)相关的知识进行讲解。 查看全文>>
Python+大数据技术文章2022-09-13 |传智教育 |一维数据,二维数据,多维数据,数据维度的划分
计算机擅长接受指令,但不能识别人类的语言,人类为保证计算机可以准确地执行指定的命令,需要使用计算机语言向计算机发送指令。计算机语言是用于编写计算机指令,即编写程序的语言,其本质是根据事先定义的规则编写的预定语句的集合。计算机语言分为3类:机器语言、汇编语言和高级语言... 查看全文>>
Python+大数据技术文章2022-09-13 |传智教育 |机器语言,编汇语言和高级语言
随着互联网信息的“爆炸”,网络爬虫渐渐为人们所熟知,并被应用到了社会生活的众多领域。作为一种自动采集网页数据的技术,很多人其实并不清楚网络爬虫具体能应用到什么场景。事实上,大多数依赖数据支撑的应用场景都离不开网络爬虫,包括搜索引擎、舆情分析与监测、聚合平台、出行类软件等。 查看全文>>
Python+大数据技术文章2022-09-07 |传智教育 |爬虫的应用场景
MySQL外键约束(FOREIGN KEY)是表的一个特殊字段,经常与主键约束一起使用。对于两个具有关联关系的表而言,相关联字段中主键所在的表就是主表(父表),外键所在的表就是从表(子表)。 查看全文>>
Python+大数据技术文章2022-09-06 |传智教育 |什么是外键约束,创建外键约束,外键多表操作
有时候我们会碰到这样的需求,例如,将有关年龄的数据进行离散化(分桶)或拆分为“面元”,直白来说,就是将年龄分成几个区间。Pandas的cut()函数能够实现离散化操作,该函数的语法格式如下... 查看全文>>
Python+大数据技术文章2022-09-01 |传智教育 |离散化连续数据,数据预处理
数据清洗的基本流程一共分为5个步骤,分别是数据分析、定义数据清洗的策略和规则、搜寻并确定错误实例、纠正发现的错误以及干净数据回流。下面通过一张图描述数据清洗的基本流程,具体如图所示。 查看全文>>
Python+大数据技术文章2022-08-30 |传智教育 |数据清洗的基本流程