本篇文章主要介绍了"hive hive日常",主要涉及到hive方面的内容,对于其他数据库感兴趣的同学可以参考一下:
1、sqlselect ROUND(RAND()*1000,0) from dual; 生成随机数2、hive创建临时表create TEMPORARY ...
1、sql
select ROUND(RAND()*1000,0) from dual; 生成随机数
2、hive创建临时表
create TEMPORARY table up_speed select a.place,a.quart,a.year,a.kwh/b.kwh-1 as elec_speed_up from (select c.place,c.year,c.quart,sum(c.kwh) as kwh from user_h_growth c group by place,quart,year) a JOIN (select d.place,d.year,d.quart,sum(d.kwh) as kwh from user_h_growth d grou```
3、
drop database aaa cascade??傻琪记不住命令
4、

支持Python中运行hive语句,还需要安装bison 下载thrift依赖的东西 yum -y install automake libtool flex bison pkgconfig gcc-c++ boost-devel libevent-devel zlib-devel Python-devel ruby-devel crypto-utils openssl openssl-devel
8、
hive调用的包明明在本机存在,却报不存在,需要把端口kill掉重启hive --service hiveserver 重启,因为ambari开机时会自动起一个10086,这个端口是不能用的。
10、
ORA-12899: value too large for column 列宽太小,修改列宽
11、
hive的join 要用on 用where的时候outer join不起作用和inner join一样····(这都能差······)
14、http://blog.sina.com.cn/s/blog_6ff05a2c010131sh.html

17、
Hive没有关系数据库的临时表,只能先生成一个表后再用完再删除
18、oracle insert数据后需要commit 否则不生效
19、http://blog.csdn.net/mashroomxl/article/details/22223777 and or的坑
20、
今天完成一个简单的join,却一直报
org.apache.hadoop.hive.ql.metadata.HiveException: Hive Runtime Error while processing row
这样的错误,还具体列出了某行,查询两表,均有该字段···
最后解决。
就是把小的表加入内存,可以配置以下参数,是hive自动根据sql,选择使用common join或者map join
set hive.auto.convert.join = true;
hive.mapjoin.smalltable.filesize 默认值是25mb