什么是数据库? 数据库是代表现实世界的相关数据的集合,数据库系统旨在构建并填充特定任务的数据。 什么是DBMS? 数据库管理系统(Databas...
什么是PL/SQL? PL/SQL是Oracle中使用的结构化查询语言(SQL)的扩展。 与SQL不同,PL/SQL允许程序员以过程编写代码,即...
cx_Oracle支持Python访问Oracle数据库。 它符合Python Database API v2.0规范 ,包含大量添加内容和一些...
什么是ER模型? ER或(实体关系模型 Entity Relational Model)是一个高级概念数据模型图。 实体 - 关系模型基于现实世...
SQL执行 执行SQL语句是Python应用程序与Oracle数据库通信的主要方式。 使用方法Cursor.execute()或Cursor.e...
用户定义函数(UDF:User-Defined Functions) UDF广泛用于数据处理,以转换数据帧。 PySpark中有两种类型的UDF...
管理Hadoop作业的官方工作流程调度程序是Apache Oozie。与许多其他Hadoop产品一样,Oozie是用Java编写的,是基于服务器...
分区 默认情况下,简单的HQL查询会扫描整个表。查询大表时,这会降低性能。可以通过创建分区来解决此问题,这些分区与RDBMS中的分区非常相似。在...
什么是HBase? HBase是Hadoop环境中的一个开源的,面向列的分布式数据库系统。最初,它是Google Big Table,之后被重新...
文集作者