【大数据】Hive系列之- Hive-DML 数据操作
迪丽瓦拉
2025-05-28 02:07:08
0

Hive系列-DML 数据操作

  • 数据导入
    • 向表中装载数据(Load)
      • 语法
      • 操作用例
    • 通过查询语句向表中插入数据(Insert)
      • 创建一张表
      • 插入数据
      • 基本模式插入(根据单张表查询结果)
    • 查询语句中创建表并加载数据(As Select)
    • 创建表时通过 Location 指定加载数据路径

数据导入

向表中装载数据(Load)

语法

load data [local] inpath '数据的 path' [overwrite] into table
car [partition (partcol1=val1,…)];
  • load data:表示加载数据
  • local:表示从本地加载数据到 hive 表;否则从 HDFS 加载数据到 hive 表
  • inpath:表示加载数据的路径
  • overwrite:表示覆盖表中已有数据,否则表示追加
  • into table:表示加载到哪张表
  • car:表示具体的表
  • partition:表示上传到指定分区

操作用例

创建一张表

create table car(id string, name string) row format delimited fields terminated by '\t';

加载本地文件到 hive

load data local inpath '/data/apps/hive/datas/car.txt' into table default.car;

加载 HDFS 上数据到 hive

load data inpath '/data/hive/car.txt' into table default.car;

加载数据覆盖表中已有的数据

load data inpath '/data/hive/car.txt' overwrite into table default.car;

通过查询语句向表中插入数据(Insert)

创建一张表

create table car1(id int, name string) row format delimited fields terminated by '\t';

插入数据

insert into table car1 values(1,'tesla'),(2,'bmw');

基本模式插入(根据单张表查询结果)

insert overwrite table car1
select id, name from car where month='201709';
  • insert into:以追加数据的方式插入到表或分区,原有数据不会删除
  • insert overwrite:会覆盖表中已存在的数据

查询语句中创建表并加载数据(As Select)

create table if not exists car3 as select id, name from car;

创建表时通过 Location 指定加载数据路径

  • 上传数据到 hdfs 上
dfs -mkdir /car;
dfs -put /data/car.txt /car;
  • 创建表,并指定在 hdfs 上的位置
create external table if not exists car5( id int, name string
)
row format delimited fields terminated by '\t' location '/car;
  • 查询数据

希望对正在查看文章的您有所帮助,记得关注、评论、收藏,谢谢您

相关内容

热门资讯

回话跟踪技术 一. 简介会话:用户打开浏览器,访问web服务器的资源,会话建立...
深度解析赚钱的底层逻辑和认知(... 我们来简单的算一笔账,普通人打工挣钱,一辈子不吃不喝,最多...
蓝桥冲刺31天之316 如果生活突然向你发难 躲不过那就迎面而战 所谓无坚不摧 是能享受最好的,也能承受最坏的...
自媒体都在用的音频、配乐素材网... 很多朋友不知道去哪里找BGM素材和音效素材,今天我就给大家推荐5个声音素材网站...
数据库面试题——锁 了解数据库的锁吗? 锁是数据库系统区别于文件系统的一个关键特性,锁机制用...
C++并发编程之五 高级线程管... 文章目录5.1.1 线程池 5.1.1 线程池 在前面我们引入了线程的通信和同步手段,...
手写springmvc步骤 springmvc 手写步骤一(默认已写相关bean) 1、pom.xm...
Spring通过Bean的na... 什么是策略模式? 如果在一个系统里面有许多类,它们之间的区别仅在于它们的...
pytorch转onnx踩坑日... 在深度学习模型部署时,从pytorch转换onnx的过程中,踩了一些坑。...
Leetcode 146. L... 题目: 请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。实现 ...
Jmeter——性能测试的认知... 前言 性能测试是一个全栈工程师/架构师必会的技能之一,只有学会性能测试,...
想用好分布式框架,先学会Pax... 想用好分布式框架,先学会Paxos算法吧 tips:觉得难理解多看几遍 ...
常见的编码方式以及字节等的概念 1、常见的编码方式 常见的一些字符编码方式无非有:Unicode、ASCII、GBK、...
【蓝桥杯-筑基篇】排序算法 🍓系列专栏:蓝桥杯 🍉个人主页:个人主页 目录 前言:...
【spring】bean的生命... 目录一.说明二.四步2.1 实例化2.2 属性赋值2.3 初始化2.4 销毁 一.说明 1.bea...
《动手学深度学习 v2》之计算... 计算性能 12.1. 编译器和解释器 # 命令式编程使得新模型的设计变得容易,因为可...
Nginx加载静态资源;反向代... 一、加载静态资源 Nginx命令 cd /usr/local/nginx/sbin ./nginx ...
【闲聊杂谈】深挖IO 虚拟文件系统 在现代计算机的操作系统当中,除了CPU和内存之外,剩下的基...
运动耳机哪款稳固性最好、最新的... 在健身房、在家锻炼或跑步时听音乐是我们日常锻炼的重要组成部分。无论您是在收听快节奏的音乐来让自己精神...
nginx整合lua、jwt、... 文章目录一、基础组件下载二、组件本地安装三、镜像构造容器内部构建提交本地容器作为镜像构建最终镜像 基...