推荐专题：

失眠网 > Hadoop-hdfs读写流程

Hadoop-hdfs读写流程

时间：2020-10-13 18:21:02

相关推荐

Hadoop-hdfs读写流程

HDFS写流程

写详细步骤：

客户端向NameNode发出写文件请求。检查是否已存在文件、检查权限。若通过检查，直接先将操作写入EditLog，并返回输出流对象。（注：WAL，write ahead log，先写Log，再写内存，因为EditLog记录的是最新的HDFS客户端执行所有的写操作。如果后续真实写操作失败了，由于在真实写操作之前，操作就被写入EditLog中了，故EditLog中仍会有记录，我们不用担心后续client读不到相应的数据块，因为在第5步中DataNode收到块后会有一返回确认信息，若没写成功，发送端没收到确认信息，会一直重试，直到成功）client端按128MB的块切分文件。client将NameNode返回的分配的可写的DataNode列表和Data数据一同发送给最近的第一个DataNode节点，此后client端和NameNode分配的多个DataNode构成pipeline管道，client端向输出流对象中写数据。client每向第一个DataNode写入一个packet，这个packet便会直接在pipeline里传给第二个、第三个…DataNode。（注：并不是写好一个块或一整个文件后才向后分发）每个DataNode写完一个块后，会返回确认信息。（注：并不是每写完一个packet后就返回确认信息，个人觉得因为packet中的每个chunk都携带校验信息，没必要每写一个就汇报一下，这样效率太慢。正确的做法是写完一个block块后，对校验信息进行汇总分析，就能得出是否有块写错的情况发生）写完数据，关闭输输出流。发送完成信号给NameNode。（注：发送完成信号的时机取决于集群是强一致性还是最终一致性，强一致性则需要所有DataNode写完后才向NameNode汇报。最终一致性则其中任意一个DataNode写完后就能单独向NameNode汇报，HDFS一般情况下都是强调强一致性）

读详细步骤：

client访问NameNode，查询元数据信息，获得这个文件的数据块位置列表，返回输入流对象。就近挑选一台datanode服务器，请求建立输入流。DataNode向输入流中中写数据，以packet为单位来校验。关闭输入流

如果觉得《Hadoop-hdfs读写流程》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

Java大数据-Hadoop-HDFS的读数据流程（原理）

2022-02-17

磁盘读写流程和网络读写流程

2022-11-16

Linux 块设备读写块设备读写流程

2024-03-28

2022-04-05

最近发布

十二星座失眠时怎么办

2024-08-23

医科大学博士生如何解决失眠问题和恢复睡眠质量？

2024-08-22

孕妇心悸与失眠的有效治疗方法

2024-08-22

改善失眠的饮食与调理秘诀：助你整夜香睡！

2024-08-22

六种中药小验方：治疗失眠肝掌肿毒及肝癌痛等问题

2024-08-22

心悸失眠吃什么呢

2024-08-22

十个方法帮助爱失眠的孕妈妈

2024-08-22

克服神经性失眠：营养调节与饮食建议

2024-08-22

肝不好还失眠怎么办

2024-08-22

一起了解失眠患者会有哪些异常表现

2024-08-22

推荐专题

失眠脚抖动半梦半醒失眠头晕 panda失眠熊猫失眠者适合干什么工作好吃了醪糟后失眠了失眠吃匹克隆也睡不着中年女性深度失眠吃什么药失眠精神紧张什么原因失眠喝红枣茶养心失眠音乐推荐你看今天我又失眠中老年失眠多梦气血虚食疗月经来前严重失眠怎么回事月经很少失眠累且失眠英文咋说