0
75

你将收获

通过本节课程为您详细讲解HDFS和YARN。

适用人群

所有人

课程介绍

通过本节课程为您详细讲解HDFS和YARN。

课程讨论

可能我今天没睡好,心情差,所以对不起了
HDFS是分布式文件系统,专门用来存储数据内容。 我知道了数据是用文件形式存的,文件是最小单位,不能修改只能删除,有块的概念确保单个文件大小在限定范围内,超过的拆分成多个文件,文件会自动备份,系统会自动的选择高效的方式读取需要的数据,并确保数据备份可靠。 HDFS是个可靠的文件系统,我在使用的时候需要注意小文件的问题,尽量不要做大量的随机读取。我理解随机读取就像大海捞针,并不能指定数据内容在某个或某些文件中,而是进行全局搜索。这需要遍历所有文件,HDFS的机制会导致效率应该非常低。 ———————————————— 版权声明:本文为CSDN博主「钱锋0519」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/weixin_42258472/article/details/99703889
这节课声音比较小,听不太清楚。。。。。。。。

所有回复(1):

您好,具体是哪一节课呢?我们这边测试一下。
讲师很厉害,讲的很详细。