实际生产中同一项目的不同版本可能依赖不同的环境,这时需要在系统中安装多个版本的Python。若直接在物理环境中进行配置,多个版本的软件之间会产生干扰。为了避免这种情况,应使用virtualenv命令创建虚拟环境,以隔离不同版本的Python。 查看全文>>
Python+大数据技术文章2023-09-13 |传智教育 |隔离的python开发环境,Python版本干扰
matbtlb库仅需开发人员编写几行代码即可绘制一个图表。下面结合面向对象的方式使用matpbtib库绘制一个简单的图表,示例代码如下: 查看全文>>
Python+大数据技术文章2023-09-06 |传智教育 |matplotlib库,matplotlib使用,matplotlib
OLTP是操作型处理,叫联机事务处理OLTP(On-LineTransactionProcessing),主要目标是做数据处理,它是针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。 查看全文>>
Python+大数据技术文章2023-08-22 |传智教育 |OLTP和OLAP有什么区别
数据模型(Data Model)是数据库系统的核心和基础,它是对现实世界数据特征的抽象,为数据库系统的信息表示与操作提供一个抽象的框架。逻辑结构设计是数据库设计其中的一个环节,而逻辑结构设计的产物就是逻辑数据模型。逻辑数据模型包含以下几种分类: 查看全文>>
Python+大数据技术文章2023-08-16 |传智教育 |逻辑数据模型,关系模型和网状模型
数据模型按照数据结构主要分为层次模型(Hierarchical Model)、网状模型(NetworkModel)、关系模型(Relational Model)和面向对象模型(Object Oriented Model)。下面分别对这4种数据模型进行讲解。 查看全文>>
Python+大数据技术文章2023-08-01 |传智教育 |数据模型分类
DataFrame对象可以从RDD转换而来,都是分布式数据集 其实就是转换一下内部存储的结构,转换为二维表结构。 查看全文>>
Python+大数据技术文章2023-07-28 |传智教育 |基于RDD方式完成DataFrame的代码构建
时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,如某股票上半年的收盘价、某城市近10年的降雨量等。时间序列中的时间段可以是一组固定频率或非固定频率的时间值,时间形式可以是年份、季度、月份或其他时间形式。 查看全文>>
Python+大数据技术文章2023-07-25 |传智教育 |时间序列,修改生成时间序列
内部表(CREATE TABLE table_name ......)未被external关键字修饰的即是内部表,即普通表。内部表又称管理表,内部表数据存储的位置由hive.metastore.warehouse.dir参数决定(默认:/user/hive/warehouse),删除内部表会直接删除元数据(metadata)及存储数据... 查看全文>>
Python+大数据技术文章2023-07-21 |传智教育 |内部表和外部表的区别,什么是内部表