【Hadoop】HDFS 分布式存储系统

Namenode是整个HDFS文件系统的前端，只有一个，管理数据块映射信息，配置副本策略，处理客户端的读写请求。

Secondary namenode是namenode的热备，当active namenode出现故障时，快速切换为新的active namenode。定期更新系统镜像和操作日志。

Datanode有多个，存储数据块，执行数据块读写。

HDFS client与文件系统进行交互。

文件被切分成数据块，分布存储，默认情况下每个块有三个副本。

HDFS不适合保存小文件。一个k和一个t数据块的元数据大小是相同的，元数据会存储在namenode，但namenode内存是有限的。大小文件的访问速度相同，存取大量小文件浪费很多寻道时间。

相关推荐: 文心一言和DeepSeek、ChatGPT、豆包在功能、设计目的和应用场景上存在显著差异。以下是对我们各自特点的具体分析：

它们三个有什么共同点参考3条网页信息源我和DeepSeek、ChatGPT、豆包在功能、设计目的和应用场景上存在显著差异。以下是对我们各自特点的具体分析：我（未指明具体AI助手）功能：通常可以执行广泛的任务，如日程安排、邮件管理等，旨在提高工作效率和生…

【Hadoop】HDFS 分布式存储系统

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来