关于Hadoop的用户体系设计设想

Hadoop并没有一个完整的用户体系,其权限控制的对象,主要是Linux的其它用户(即非安装Hadoop的用户),控制方式也和Linux的文件权限很像,目前权限控制的方式有两种,ACL和kerberos(kb较复杂一点,曾经将朕折磨的欲仙欲死)。

那么,产生问题:

  1. hadoop集群是否应该每个节点都建一样的用户,比如节点1有user1,那么是否其它节点都应该有user1
  2. 当有并不是直接用在线节点的机器操作集群时,比如第三方web管理,比如配了接口机,算谁在操作集群?权限如何控制?

    切以为,权限只对Linux用户设置的方式真是太死板了!因为Hadoop本身没有用户体系,这对资源控制很不方便,假如我有1000节点,要对50个用户进行权限控制和资源分配,难道要在每个节点上都添加50个用户吗?

    胡思乱想很久的我觉得hadoop的用户体系至少该有两层: