虚幻0516 发表于 2017-12-16 20:37:46

从零自学Hadoop(23):Impala介绍及安装

  Impala Daemon
  是Impala的核心进程,进程名叫做:impalad,运行在所有的数据节点上,可以读写数据,并接收客户端的查询请求,并行执行来自集群中其他节点的查询请求,将中间结果返回给调度节点。调用节点将结果返回给客户端。
  Impala Statestore
  状态管理进程,定时检查The Impala Daemon的健康状况,协调各个运行impalad的实例之间的信息关系,Impala正是通过这些信息去定位查询请求所要的数据,进程名叫做 statestored,在集群中只需要启动一个这样的进程,如果Impala节点由于物理原因、网络原因、软件原因或者其他原因而下线,Statestore会通知其他节点,避免查询任务分发到不可用的节点上。
  Impala Catalog Service
  元数据管理服务,进程名叫做 catalogd,将数据表变化的信息分发给各个进程。
页: [1]
查看完整版本: 从零自学Hadoop(23):Impala介绍及安装