在千锋郑州大数据培训班学习已经两个多月了,我渐渐地适应了这里高强度的学习生活,虽然自己在学习结果上不能让自己满意,但却是学到了很多知识。最近一段时间我们主要学习了Hadoop相关的内容,我也渐渐了解了大数据方面的就业方向和未来的主要工作内容。接下来我就分享一下近段学习的HDFS的特点。
1、高容错性。(1)数据自动保存多个副本。它通过增加副本的形式,提高容错性。(2)某一个副本丢失以后,它可以自动恢复。
2、适合大数据处理。(1)数据规模:能够处理数据规模达到 GB、TB、甚至 PB 级别的数据。(2)文件规模:能够处理百万规模以上的文件数量,数量相当之大。
3、流式数据访问。(1)一次写入,多次读取,不能修改,只能追加。(2)它能保证数据的一致性,但不支持多线程(不支持多用户操作同一个文件)。
4、可构建在廉价机器上,通过多副本机制,提高可靠性。
尽管HDFS是一个高度容错性的系统,适合部署在廉价的机器上,能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。但它也有自己的不足,比如:不适合低延时数据访问、无法高效的对大量小文件进行存储、仅支持数据append(追加)不支持文件的随机修改。
HDFS是基于Java的分布式文件系统,允许你在Hadoop集群中的多个节点上存储大量数据。如果你安装Hadoop,你将HDFS作为底层存储系统来存储分布式环境中的数据,这也是我们在今后的工作中会经常用到的知识点,一定要熟练掌握。
在千锋郑州大数据培训班,我们学了很多知识,比如Java基础知识、Linux命令、MySQL操作以及现阶段的Hadoop集群搭建,同时也积累了相关的经验。在接下来的学习中,我们一定要坚定信念,好好学习天天向上,要对得起自己时间和精力的付出,期待未来找到一份高薪工作!
相关文章
了解千锋动态
关注千锋教育服务号
扫一扫快速进入
千锋移动端页面
扫码匿名提建议
直达CEO信箱