Hive安装

通过hive介绍章节,知道Hive的运行是基于Hadoop集群上的,所以Hive的安装优先得先搭建好Hadoop集群,可以参考:

hadoop 详细安装步骤:https://www.oraclejsq.com/hdpjc/060102558.html


第 1 步:下载并解压 Hive

访问Apache Hive 官方下载页面,选择你需要下载的Hive版本:

Hive安装

这里,我采用下载的是最新版本,因为之前搭建的Hadoop是2.10版本的,正好符合:

Hive安装

下载完后,上传tar包到Hadoop集群服务器/usr/local目录下,进行解压。

tar zxvf ./apache-hive-2.3.9-bin.tar.gz 

第 2步:为Hive 设置环境变量

把以下几行追加到/etc/profile文件来设置 Hive 环境变量,其中HIVE_HOME就是刚刚解压出来的hive路径

export HIVE_HOME=/usr/local/apache-hive-2.3.9-bin
export PATH=$PATH:$HIVE_HOME/bin
export CLASSPATH=$CLASSPATH:/usr/local/apache-hive-2.3.9-bin/lib/*:.

添加保存后,要加载环境变量使之生效,命令如下:

source /etc/profile

第 3 步:配置HIVE

因为hive需要访问Hadoop,所以要在hive-env.sh文件中编辑配置Hadoop环境变量,该文件位于hive安装目录的conf下。配置如下:

cd /usr/local/apache-hive-2.3.9-bin/conf/
cp ./hive-env.sh.template ./hive-env.sh

vi ./hive-env.sh

然后在hive-env.sh文件追加:

export HADOOP_HOME=/usr/local/hadoop-2.10.0

第4步:下载并安装 mysql

从hive介绍当中知道,hive的元数据存储需要额外数据库,所以这里就采用mysql数据库,来存储元数据信息。mysql的安装这里就不细说了,自行安装


第5步:配置Hive的Metastore(元数据存储)

1、修改/conf/下的hive-site.xml文件,对其进行元数据存储的数据库配置:

cd /usr/local/apache-hive-2.3.9-bin/conf/

cp ./hive-default.xml.template  hive-site.xml

vi ./hive-site.xml

2、编辑hive-site.xml并在 <configuration> 和 </configuration> 标记之间附加以下行:(记得把里面对应的mysql配置换成自己的,不要直接复制)

    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>root</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>123456</value>
    </property>
   <property>
        <name>javax.jdo.option.ConnectionURL</name>mysql
        <value>jdbc:mysql://192.168.10.2:3306/hive</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>mysql
        <value>com.mysql.jdbc.Driver</value>
    </property>

3、在自己的msyql数据库创建一个hive数据库实例。

4、然后在hive的bin目录下的schematool 对mysql进行初始化。在这之前需要把mysql的驱动jar包传到hive安装目录/lib下。

cd /usr/local/apache-hive-2.3.9-bin/bin

schematool -dbType mysql -initSchema

5、然后执行hive命令,查看安装效果。

Hive安装