古城热线 发表于 2016-12-11 11:13:23

《hadoop权威指南第二版》读书疑问(1)

  第二章数据流部分,其中有段描述如下:
  最佳分片大小应该与块大小相同,因为它是确保可以存储在单个节点上的最大输入块大小。如果分片跨越两个数据块,那个对任何一个HDFS节点,基本上都不可能同时存储这两个数据块,因为分片中的部分数据需要通过网络传输到map任务节点。
  本人刚刚开始学些hadoop,对红色高亮部分不甚了解,望高手指教。
  问题补充:
  一个节点是否只有一个map任务运行?
页: [1]
查看完整版本: 《hadoop权威指南第二版》读书疑问(1)