博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop之HDFS基本概念
阅读量:6565 次
发布时间:2019-06-24

本文共 809 字,大约阅读时间需要 2 分钟。

hot3.png

1. 概念

HDFS,它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。

HDFS 的设计适合一次写入,多次读出的场景,且不支持文件的修改。适合用来做数据分析,并不适合用来做网盘应用。

2. 组成

(1) HDFS 集群包括,NameNode 和 DataNode 以及 Secondary Namenode。

(2) NameNode 负责管理整个文件系统的元数据,以及每一个路径(文件)所对应的数据块信息。
(3) DataNode 负责管理用户的文件数据块,每一个数据块都可以在多个 DataNode 上存储多个副本。
(4) Secondary NameNode 用来监控 HDFS 状态的辅助后台程序,每隔一段时间获取 HDFS 元数据的快照。

3. HDFS 文件块大小

HDFS 中的文件在物理上是分块存储 (block),块的大小可以通过配置参数 (dfs.blocksize) 来规定,默认大小在 hadoop2.x 版本中是 128M,老版本中是 64M。

HDFS 的块比磁盘的块大,其目的是为了最小化寻址开销。如果块设置得足够大,从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间。因而,传输一个由多个块组成的文件的时间取决于磁盘传输速率。
如果寻址时间约为 10ms,而传输速率为 100MB/s,为了使寻址时间仅占传输时间的 1%,我们要将块大小设置约为 100MB。默认的块大小实际为 64MB,但是很多情况下 HDFS 使用 128MB 的块设置。
块的大小:10ms*100*100M/s = 100M

 

本文为原创文章,如果对你有一点点的帮助,别忘了点赞哦!比心!如需转载,请注明出处,谢谢!

 

转载于:https://my.oschina.net/aibinxiao/blog/2997998

你可能感兴趣的文章
Docker镜像加速 | Docker 中国源 | 仓库
查看>>
洛谷——P3225 [HNOI2012]矿场搭建
查看>>
我们都是程序员(四个男人三个女人的故事上)
查看>>
sexi部署openstack (devstack) 、三
查看>>
(转)Android’s HTTP Clients
查看>>
移动apache访问日志后如何立即生效
查看>>
编译 recastnavigation
查看>>
移动web模拟客户端实现多方框输入密码效果
查看>>
求3-100的素数!
查看>>
Typiquement tous ces Lancel French Flair nécessite normalement tout
查看>>
Better Swing Application Framework
查看>>
2018-2019-1 20165313 实验五 通讯协议设计
查看>>
个人编程项目作业
查看>>
LeetCode.893-特殊相等字符串组(Groups of Special-Equivalent Strings)
查看>>
从零开始学java(接口)
查看>>
Android compiling -- on ubuntu 12.04 && ubuntu 14.X
查看>>
vscode 实用插件
查看>>
浅谈DNS
查看>>
Linux常用网络工具:fping主机扫描
查看>>
IOS - 递归
查看>>