Hive是一个构建在Hadoop上的数据仓库框架,需要的支持组件包括:HDFS、YARN、MapReduce。它是应Facebook每天产生的海量新兴社交网络数据进行管理和机器学习的需求而产生和发展的。
Hive提供一套类SQL语言——HiveQL语言,可将HiveQL编译成MapReduce程序并在YARN中执行,支持HDFS文件数据和HBase数据记录查询。
一、Hive安装1、去下载Hive ()/dyn//hive/2、解压安装包创建hive目录和临时目录
(资料图片)
解压完后,注意最后没有报错信息
tar: Exiting with failure status due to previous errors如果有,则尝试寻找原因重新解压
3、修改环境变量
添加以下行
加载资源并执行命令查看版本
如果提示Missing Hive Execution Jar,则可能是下载或解压不完全导致
解压不全可能的原因:
(1)下载文件错误,在windows中解压试试
(2)传输错误,重新将文件传给linux试试
(3)虚拟硬盘空间已满,查看虚拟硬盘剩余空间:df -h
4、进入hive安装目录下的conf目录
从模板复制一个配置文件并打开
在文件末尾增加(以实际的hadoop和hive版本为主)
不配置数据库Hive即缺省采用Derby数据库
5、启动Hadoop HDFS和YARN,确保HDFS和YARN能正常工作
6、初次执行时,先初始化derby元数据库cd进入hive安装目录:
初始化derby元数据库
Derby会在第一次启动初始化命令时,在当前所在目录创建元数据库文件(metastore_db)
注意:执行hive会在当前所在目录寻找元数据文件(metastore_db),必须先cd进入第6步的目录,否则会在原地创建一个空metastore_db并报找不到元数据表的错误
执行命令 bin/hive 进入Hive命令行界面
二、Hive命令行应用(注意单条命令以 ; 结尾!!)
内部表应用(1) 创建内部表Student,要求的字段和类型: id int, name string, sex string, age int,执行insert语句录入以下数据:
(2) 执行查询查询所有男生
查询大于18岁的学生,并按年龄升序排列
2.外部表应用
(1) 将本实验数据上传至HDFS,数据为,此数据修改了实验4中stock-daily数据中的日期格式以支持Hive中的Date数据类型:
/download/m0_69488210/87961142
stock-daily数据说明:
[‘code’,‘isst’,open’, ‘close’, ‘high’, ‘low’, ‘volume’, ‘money’, ‘factor’, ‘high_limit’, ‘low_limit’, ‘avg’, ‘paused’, ‘date’]
code 股票代码
isst 是否ST
open 开盘价
close 收盘价
high 当日最高价
low 当日最低价
volume 交易量(手)
money 交易量(万元)
factor 除权比例
high_limit 涨停价
low_limit 跌停价
avg 每日均价
paused 是否停牌
date 日期
在hdfs中新建/hivedata/stock-daily目录,并把上传到/hivedata/stock-daily目录中
(2) 创建外部表Stock,具体的字段名称和类型为:code string, isst boolean, open float, close float, high float, low float, volume float, money float, factor float, high_limit float, low_limit float, avg float, paused boolean, trade_date date;注意日期字段不要用date或time,可使用trade_date以避免语法错误。
(3) 执行查询查询上证所的股票数量,代码以.SH结尾的股票
参考SQL语句group语句,查询每日市场总交易量(万元)
结果须包含日期和对应的中交易量数据
结果按时间做降序排列
市场总交易量为当天所有股票交易量(万元)之和
(4) 学习与思考:计算实验4中,股票5日滚动收益率_1_ 搜索所有交易日,并对交易日编号(保存中间数据到tradedate表)
_2_ 利用连接查询,搜索提取计算所需股票代码和收盘价,并将交易日标记上对应编号(保存中间数据到closewithid表)
_3_ 利用自连接,让股票当日收益与改股票前第五日收益连接在同一行中,并计算五日收益率,此计算对每个股票和交易日都生效(保存中间数据到rollreturn表)
_4_ 查询某只股票的五日滚动收益率
标签:
Hive是一个构建在Hadoop上的数据仓库框架,需要的支持组件包括:HDFS、
第一时间提供各大券商研究所报告,最大程度减少个人投资者与机构之间信
06月28日,创耀科技获沪股通增持万股,最新持股量为万股,占公司A股总
1、写作思路:实事求是,不夸张,避免“找借口”的嫌疑。2、言简意明、
来源|网络人间三千事,都付谈笑中,面对人生种种境遇,一笑而过,是一
在南京理工大学校园里有这样一位学生,他在本科期间通过两段各4个月的
“中年失业,就去开网约车”这条路,如今恐怕已被堵死。截至2023年4月
【导语】在资本市场,有股票上市就有股票退市,股票上市指早已推出的个
齐鲁网·闪电新闻6月29日讯6月29日出版的《光明日报》在第10版刊文,关
来源:证券时报本公司董事会及全体董事保证本公告内容不存在任何虚假记
一夜综述!穆帅又被禁赛,阿森纳1亿新援即将敲定,曼联接洽2目标,曼联,
1、所谓美白,先补水,再补水,在干燥的春天,怎么做才能为夏天的美白
郑州市气象台2023年06月29日06时30分发布暴雨橙色预警信号:目前航空港
1、目前,儿童自闭症的病因尚未完全明了。儿童孤独症的因素与先天遗传
欧洲主要股指普遍收涨,德国DAX30指数涨0 64%,英国富时100指数涨0 52%
2023年高级审计师考试题型是什么?考试题型是主观题,也就是问答题的形
宇博智业产业研究院发布了最新的十大品牌排行榜,此次排行榜是基于多维
当我们在使用电脑时候,发现突然多出了一个占用内存不小进程,叫做desk
就我国而言,海南是唯一的热带岛屿,三亚全年平均气温在25摄氏度左右,
1、dell售后服务电话:800-858-0950戴尔免费电话:普通消费者及家庭用
来源:泡财经泡财经获悉,6月28日,移为通信(300590 SZ)公告,因自身
1、本人是天津户口想摇一个天津市小汽车牌照。2、不知道应该怎么操作啊
视频加载中 长江网讯(记者王允祺)“我希望通过设计,为人们创造美
Culp(CULP US):2023年Q4财报实现营收6142 6万美元,前值为5694万美元
6月27日上午,黄浦区召开2023年数字化转型工作推进会。据介绍,2022年
hello大家好,我是价值网小科来为大家解答以上问题,金志文有170高吗,
今天小红来为大家带来的是汽车电池多久换一次比较好,汽车电池多久换一
作者:hfew8801说说这次旅行第1天随记默认段落随记盂县汽车客运站随记
1、那要看你主号是不是也喜欢上去砍要是想快速秒对方的话就全加准确如
电影《消失的她》连续7天单日票房破亿朱一龙倪妮发文庆祝,倪妮,朱一龙,
Copyright © 2015-2022 国华娱乐网版权所有 备案号:京ICP备2021034106号-22 联系邮箱:55 16 53 8 @qq.com