千锋郑州老师分享经典大数据面试题_郑州千锋IT培训

千锋教育-做有情怀、有良心、有品质的职业教育机构

400-811-9990

手机站

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频

千锋教育

关注千锋学习站小程序
随时随地免费学习课程

首页课程

HTML5

Java

Python

云计算

软件测试

网络安全

大数据

物联网

Unity

UI/UE设计

全媒体营销

影视剪辑

游戏原画

区块链

产品经理

商业插画

PMP认证

红帽RHCE

软考认证

华为认证

教程
HTML5视频教程 Java视频教程 Python视频教程 UI视频教程云计算视频教程软件测试视频教程大数据视频教程物联网视频教程 Unity视频教程网络安全视频教程全媒体视频教程影视剪辑视频教程
教研
教研院项目库师资团队原创书籍项目大赛
服务
企业内训高校合作学科共建
就业
就业服务双选会上门招聘人才定制
问答资讯技术干货 IT培训机构零基础学IT 关于千锋
千锋简介联系我们锋益公益大赛组织品牌活动

上海

北京
郑州
武汉
成都
西安
沈阳

广州
南京
深圳
大连
青岛
杭州
重庆

当前位置：郑州千锋IT培训 > 面试技巧 > 千锋郑州老师分享经典大数据面试题

千锋郑州老师分享经典大数据面试题

来源：千锋教育

发布人：Yolanda

时间： 2018-12-19 15:34:27

　　大数据市场前景广阔，选择学习大数据技术的人也在不断增多，求职竞争压力进一步加大，为了能够拥有更多的市场主动权，有人在专业技能上下功夫，有人在面试技巧上赞经验，今天千锋郑州大数据培训老师就给大家分享一些比较经典的大数据面试题。

　　1、hdfs上传文件的流程(一个256M的文件上传)。

　　①由客户端向NameNode节点节点发出请求;

　　②NameNode向Client返回可以存数据的DataNode这里遵循机架感应原则;

　　③客户端首先根据返回的信息先将文件分块(Hadoop2.X版本每一个block为128M而之前的版本为64M;

　　④然后通过那么Node返回的DataNode信息直接发送给DataNode并且是流式写入同时会复制到其他两台机器;

　　⑤dataNode向Client通信表示已经传完数据块同时向NameNode报告⑥依照上面(④到⑤)的原理将所有的数据块都上传结束向NameNode报告表明已经传完所有的数据块。

　　2、zookeeper是什么，简述它的选举机制和集群的搭建。

　　答：ZooKeeper是一个开源的分布式协调服务，是GoogleChubby的开源实现。分布式应用程序可以基于ZooKeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。我们公司使用的flume集群，Kafka集群等等，都离不开ZooKeeper呀。每个节点上我们都要搭建ZooKeeper服务。首先我们要在每台pc上配置zookeeper环境变量，在cd到zookeeper下的conf文件夹下在zoo_simjle.cfg文件中添加datadir路径，再到zookeeper下新建data文件夹，创建myid，在文件里添加上server的ip地址。在启动zkserver.shstart便ok。

　　3、说一下你对hadoop生态圈的认识。

　　没有固定答案，主要从hdfs底层存储，hbase数据库，hive数据仓库，flume收集，Kafka缓存，zookeeper分布式协调服务，spark大数据分析，sqoop数据互转来说。

　　4、数据来源的方式：

　　1.webServer：用户访问我们的网站，对日志进行收集，记录在反向的日志文件里tomcat下logs

　　2.js代码嵌入前端页面(埋点)：js的sdk会获取用户行为，document会得到元素调用function，通过ngix集群进行日志收集。

　　5、YARN的理解：

　　YARN是Hadoop2.0版本引进的资源管理系统，直接从MR1演化而来。

　　核心思想：将MR1中的JobTracker的资源管理和作业调度两个功能分开，分别由ResourceManager和ApplicationMaster进程实现。

　　ResourceManager：负责整个集群的资源管理和调度ApplicationMaster：负责应用程序相关事务，比如任务调度、任务监控和容错等。YARN的出现，使得多个计算框架可以运行在同一个集群之中。

　　①.每一个应用程序对应一个ApplicationMaster。

　　②.目前可以支持多种计算框架运行在YARN上面，比如MapReduce、storm、Spark、Flink。

　　6、说一下你对hadoop生态圈的认识。

　　没有固定答案，主要从hdfs底层存储，hbase数据库，hive数据仓库，flume收集，Kafka缓存，zookeeper分布式协调服务，spark大数据分析，sqoop数据互转来说。

声明：本站稿件版权均属千锋教育所有，未经许可不得擅自转载。

上一篇

常见的Web前端面试题整理汇总

下一篇

千锋老师分享简历如何写面试机会更多

猜你喜欢LIKE

最新文章NEW

相关推荐HOT

更多>>

热门推荐

如何在面试中得高分？一般要注意哪些方面

UI设计师如何应对面试？哪些细节不可忽略

求职者如何应对面试？需要特别注意什么

Java面试必问什么技术？如何搞定Spring框架

求职过程中如何抓住机遇？要注意哪些要点

郑州Web前端培训之JavaScript面试题推荐

郑州云计算培训机构之常见面试题及答案

如何开始求职生涯？个人简历有哪几种类型

初入职场大学生如何应对？怎么规避职场风险

企业对Python人才的招聘需求有哪些？

职场新人如何找到适合自己性格的工作？

大学生如何尽快获得职位？需要注意哪几点

毕业生如何应对求职？推荐10条参考标准

常见UI设计面试题有哪些？郑州UI培训好不

行业资讯 更多>>

云计算需要学习什么

学平面设计大概多少钱学费

大数据培训需要多少钱

大数据培训要花多少钱

技术干货

谈谈你对节流防抖的理解

谈谈你对节流防抖的理解

描述组件渲染和更新的过程

描述组件渲染和更新的过程

应该在 React 组件的何处发起 Ajax 请求

应该在 React 组件的何处发起 Ajax 请求

Jmeter压力测试工具使用

Jmeter压力测试工具使用

计算机专业需要怎么学

计算机专业需要怎么学

Access数据库介绍

Access数据库介绍

成熟的UI设计师是怎么做设计的

成熟的UI设计师是怎么做设计的

技术问答 在线提问>>

张同学在线提问

前端工程师主要干啥

前端工程师主要干啥？前端工程师是IT行业中非...详情

刘同学在线提问

java从入门到精通需要多久

java从入门到精通需要多久？Java作为一门非常...详情

师资团队 更多>>

陆神

原去哪儿网高级架构师

北京大学计算机系毕业

HTML5学科教研总监

千锋威哥

OCP认证专家

15年以上开发经验

Java学科首席技术官

宋宋

原阿里后端架构师

北京邮电大学硕士

Python学科首席技术官

卢老师

北京大学博士后

北京科技大学博士

人工智能学科总监

索尔

原阿里后端架构师

浙工大计算机系毕业

Java学科高级讲师

jackfrued

曾任职华为成都研究所

计算机应用技术博士

Python学科教学主管

快速通道 更多>>

课程介绍
点击获取大纲
就业前景
查看就业薪资
学习费用
了解课程价格
优惠活动
领取优惠券
学习资源
领3000G教程
师资团队
了解师资团队
实战项目
获取项目源码
开班地区
查看来校路线

最新开班信息更多>>

网友热搜更多>>

IT行业年龄有限制吗女生学IT Java薪资待遇零基础Web培训 Python就业如何学UI设计大数据学习路线 java培训学费软件测试培训转行学Linux 网络安全基础知识网络营销培训 unity培训 30岁还能学it吗大数据技术学什么 python培训费

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站