Hive CLI是Hive的交互工具,下面演示几种CLI调动Hive功能的一些命令。 查看全文>>
Python+大数据技术文章2021-08-06 |传智教育 |Hive,Hive命令,Hive操作
完成了Hadoop集群安装和测试之后,显示构建的Hadoop集群能够正常运行。接下来,就通过Hadoop经典案例——单词统计,来演示Hadoop集群的简单使用。 查看全文>>
Python+大数据技术文章2021-08-06 |传智教育 |Hadoop集群经典单词统计案例
如果Hadoop集群中部署了Hive服务,并且在Sqoop服务的sqoop-env.sh文件中配置了Hive的安装路径,那么也可以通过Sqoop工具将MySQL表数据导入Hive表中。将MySQL表数据导入到Hive文件系统中,具体指令示例如下。 查看全文>>
Python+大数据技术文章2021-08-06 |传智教育 |MySQL表数据导入Hive
Pandas执行算术运算时,会先按照索引进行对齐,对齐以后再进行相应的运算,没有对齐的位置会用NaN进行补齐。其中,Series是按行索引对齐的,DataFrame是按行索引、列索引对齐的。 查看全文>>
Python+大数据技术文章2021-07-30 |传智教育 |Panda,算术运算和数据对齐
在Jupyter Notebook的主界面中,单击 “Anaconda Projects” 进入该目录下,继续单击右上方的“New”按钮,打开如图1所示的下拉列表。 查看全文>>
Python+大数据技术文章2021-07-30 |传智教育 |Notebook功能和操作界面介绍, Jupyter
这里我们采用的是京东的数据仓库分层模式,是根据标准的模型演化而来。将数据仓库分为4层,BDM作为缓冲数据,FDM作为基础数据层,接下来对他们做详细介绍。 查看全文>>
Python+大数据技术文章2021-07-28 |传智教育 |数据仓库,数据仓库实际分层
Sqoop工具操作简单,它提供了一系列的工具指令,来进行数据的导入、导出操作等。使用Sqoop解压包中bin目录下的“sqoop help”指令可以查看Sqoop支持的所有工具指令,具体效果如图1所示。 查看全文>>
Python+大数据技术文章2021-07-26 |传智教育 |Sqoop,sqoop指令