日韩欧乱色一区二区三区在线_久久―日本道色综合久久_欧美日本一区二区_网曝91综合精品门事件在线

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > 大數據開發面試題詳解:Hadoop的運行原理

大數據開發面試題詳解:Hadoop的運行原理

來源:千鋒教育
發布人:千鋒老師
時間: 2019-01-02 16:14:00 1546416840

  hadoop的核心思想是MapReduce,但shuffle又是MapReduce的核心。shuffle的主要工作是從Map結束到Reduce開始之間的過程。

  Hadoop不僅僅是大數據技術的核心重點,還是我們面試官面試的時候經常會問道的問題,本文將詳細介紹Hadoop的運行原理。

圖片1

  hadoop運行原理包括HDFS和Mapreduce兩部分。

  1)HDFS自動保存多個副本,移動計算。缺點是小文件存取占用namenode內存,寫入只支持追加,不能隨機修改。

  它存儲的邏輯空間稱為block,文件的權限類似linux。整體架構分三種節點,NN,SNN,DN

  NN 負責讀寫操作保存metadata(Ownership Permission blockinfo)

  SNN 負責輔助NN合并fsimage和edits,減少nn啟動時間

  DN 負責存數據,每個數據(文件)分割成若干block,每個block默認3個副本。啟動后像NN發送心跳保持聯系

  NN保存的metadata在hdfs啟動后加載到計算機內存,除block位置信息的metadata保存在OS文件系統中的fsimage文件中,對metadata的操作日志保存在OS文件系統中的edits文件中。block位置信息是hdfs啟動后由DN上報NN再加載到內存的。

  HDFS的安全模式:直到NN完全加載完metadata之前的這段時間。期間不能寫入文件,DN檢查各個block完整性,并修復。

  2)MapReduce

  離線計算框架,過程分為split map shuffle reduce四個過程

  架構節點有:Jobtracker TaskTracker

  Split將文件分割,傳輸到mapper,mapper接收KV形式的數據,經過處理,再傳到shuffle過程。

  Shuffle先進行HashPartition或者自定義的partition,會有數據傾斜和reduce的負載均衡問題;再進行排序,默認按字典排序;為減少mapper輸出數據,再根據key進行合并,相同key的數據value會被合并;最后分組形成(key,value{})形式的數據,輸出到下一階段

  Reduce輸入的數據就變成了,key+迭代器形式的數據,再進行處理。

  以上是對大數據技術面試題的詳細解析,當然了,既然是面試題不可能只有一道,千鋒老師還在積極預測備選中,針對大數據技術的重點內容進行詳細講解和階段測試,讓同學們真正掌握大數據技術,通過一周一小測,一個月一大測的培訓原則,給學生外界的學習推力。更多精彩,歡迎持續關注~

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
主站蜘蛛池模板: 新田县| 长岭县| 子洲县| 永登县| 吕梁市| 乐昌市| 文成县| 普兰店市| 理塘县| 台湾省| 哈巴河县| 兴仁县| 灵武市| 彰化市| 石林| 文昌市| 余江县| 磴口县| 泰安市| 沙湾县| 嘉善县| 即墨市| 离岛区| 昌吉市| 静乐县| 永清县| 新巴尔虎右旗| 湖口县| 遂川县| 门头沟区| 广汉市| SHOW| 甘德县| 双峰县| 洛扎县| 平安县| 句容市| 淳化县| 阳高县| 柘荣县| 武汉市|