千锋郑州大数据培训学员学习分享HDFS的特点有哪些

当前位置：首页 > 学员心声 > 正文

分享到：

时间：2018-09-30 15:35 　来源：千锋教育郑州校区　作者：Yolanda

　　在千锋郑州大数据培训班学习已经两个多月了，我渐渐地适应了这里高强度的学习生活，虽然自己在学习结果上不能让自己满意，但却是学到了很多知识。最近一段时间我们主要学习了Hadoop相关的内容，我也渐渐了解了大数据方面的就业方向和未来的主要工作内容。接下来我就分享一下近段学习的HDFS的特点。

　　1、高容错性。(1)数据自动保存多个副本。它通过增加副本的形式，提高容错性。(2)某一个副本丢失以后，它可以自动恢复。

　　2、适合大数据处理。(1)数据规模：能够处理数据规模达到 GB、TB、甚至 PB 级别的数据。(2)文件规模：能够处理百万规模以上的文件数量，数量相当之大。

　　3、流式数据访问。(1)一次写入，多次读取，不能修改，只能追加。(2)它能保证数据的一致性，但不支持多线程(不支持多用户操作同一个文件)。

　　4、可构建在廉价机器上，通过多副本机制，提高可靠性。

　　尽管HDFS是一个高度容错性的系统，适合部署在廉价的机器上，能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。但它也有自己的不足，比如：不适合低延时数据访问、无法高效的对大量小文件进行存储、仅支持数据append(追加)不支持文件的随机修改。

　　HDFS是基于Java的分布式文件系统，允许你在Hadoop集群中的多个节点上存储大量数据。如果你安装Hadoop，你将HDFS作为底层存储系统来存储分布式环境中的数据，这也是我们在今后的工作中会经常用到的知识点，一定要熟练掌握。

　　在千锋郑州大数据培训班，我们学了很多知识，比如Java基础知识、Linux命令、MySQL操作以及现阶段的Hadoop集群搭建，同时也积累了相关的经验。在接下来的学习中，我们一定要坚定信念，好好学习天天向上，要对得起自己时间和精力的付出，期待未来找到一份高薪工作!