丁香五月亚洲,欧美孕妇XXX高清在线,国产中文资源,精品r视频在线

MapReduce開發(fā)運行的精簡原理(mapreduce開發(fā)流程)

作者:黑馬程序員
鏈接:https://zhuanlan.zhihu.com/p/81237437
來源:知乎
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處。

簡單介紹

相信關(guān)于Hadoop中MapReduce的相關(guān)文章會很多,這里只簡單介紹一下MapReduce的相關(guān)知識。

Hadoop的MapReduce來源于Google公司的三篇論文中的MapReduce,其核心思想是“分而治之”

Map負責(zé)“分”,即把復(fù)雜的任務(wù)分解為若干個“簡單的任務(wù)”來并行處理??梢赃M行拆分的前提是這些小任務(wù)可以并行計算,彼此間幾乎沒有依賴關(guān)系。

Reduce負責(zé)“合”,即對map階段的結(jié)果進行全局匯總。

現(xiàn)階段MapReduce一般運行在Hadoop2.x版本的yarn資源平臺上,具體運行過程后面會有詳細說明。

MapReduce編程規(guī)范

MapReduce 的開發(fā)一共有八個步驟, 其中 Map 階段分為 2 個步驟,Shuffle 階段 4 個步驟,Reduce 階段分為 2 個步驟

Map 階段 2 個步驟

1)設(shè)置 InputFormat 類, 將數(shù)據(jù)切分為 Key-Value(K1和V1) 對, 輸入到第二步

2)自定義 Map 邏輯, 將第一步的結(jié)果轉(zhuǎn)換成另外的 Key-Value(K2和V2) 對, 輸出結(jié)果

Shuffle 階段 4 個步驟

3)對輸出的 Key-Value 對進行分區(qū)

4)對不同分區(qū)的數(shù)據(jù)按照相同的 Key 排序

5)(可選) 對分組過的數(shù)據(jù)初步規(guī)約, 降低數(shù)據(jù)的網(wǎng)絡(luò)拷貝

6)對數(shù)據(jù)進行分組, 相同 Key 的 Value 放入一個集合中

Reduce 階段 2 個步驟

7)對多個 Map 任務(wù)的結(jié)果進行排序以及合并, 編寫 Reduce 函數(shù)實現(xiàn)自己的邏輯, 對輸入的 Key-Value 進行處理, 轉(zhuǎn)為新的 Key-Value(K3和V3)輸出

8)設(shè)置 OutputFormat 處理并保存 Reduce 輸出的 Key-Value 數(shù)據(jù)

MapReduce開發(fā)運行的精簡原理(mapreduce開發(fā)流程)

MapReduce的步驟圖

yarn資源調(diào)度

yarn是hadoop集群當(dāng)中的資源管理系統(tǒng)模塊,從hadoop2.0開始引入yarn模塊,yarn可為各類計算框架提供資源的管理和調(diào)度,主要用于管理集群當(dāng)中的資源(主要是服務(wù)器的各種硬件資源,包括CPU,內(nèi)存,磁盤,網(wǎng)絡(luò)IO等)以及調(diào)度運行在yarn上面的各種任務(wù)。

相比于hadoop1.x版本,yarn核心出發(fā)點是為了分離資源管理與作業(yè)監(jiān)控,實現(xiàn)分離的做法是擁有一個全局的資源管理ResourceManager(RM),以及每個應(yīng)用程序?qū)?yīng)一個的應(yīng)用管理器ApplicationMaster(AM)。

總結(jié)一句話就是說:yarn主要就是為了調(diào)度資源,管理任務(wù)。

YARN總體上是Master/Slave結(jié)構(gòu),主要由ResourceManager、NodeManager、 ApplicationMaster和Container等幾個組件構(gòu)成。

ResourceManager(RM) 負責(zé)處理客戶端請求,對各NM上的資源進行統(tǒng)一管理和調(diào)度。給ApplicationMaster分配空閑的Container 運行并監(jiān)控其運行狀態(tài)。主要由兩個組件構(gòu)成:調(diào)度器和應(yīng)用程序管理器:

調(diào)度器(Scheduler):調(diào)度器根據(jù)容量、隊列等限制條件,將系統(tǒng)中的資源分配給各個正在運行的應(yīng)用程序。調(diào)度器僅根據(jù)各個應(yīng)用程序的資源需求進行資源分配,而資源分配單位是Container。Shceduler不負責(zé)監(jiān)控或者跟蹤應(yīng)用程序的狀態(tài)??傊{(diào)度器根據(jù)應(yīng)用程序的資源要求,以及集群機器的資源情況,為應(yīng)用程序分配封裝在Container中的資源。

應(yīng)用程序管理器(Applications Manager):應(yīng)用程序管理器負責(zé)管理整個系統(tǒng)中所有應(yīng)用程序,包括應(yīng)用程序提交、與調(diào)度器協(xié)商資源以啟動ApplicationMaster 、監(jiān)控ApplicationMaster運行狀態(tài)并在失敗時重新啟動等,跟蹤分給的Container的進度、狀態(tài)也是其職責(zé)。

NodeManager (NM) NodeManager 是每個節(jié)點上的資源和任務(wù)管理器。它會定時地向ResourceManager匯報本節(jié)點上的資源使用情況和各個Container的運行狀態(tài);同時會接收并處理來自ApplicationMaster 的Container 啟動/停止等請求。

ApplicationMaster (AM): 用戶提交的應(yīng)用程序均包含一個ApplicationMaster ,負責(zé)應(yīng)用的監(jiān)控,跟蹤應(yīng)用執(zhí)行狀態(tài),重啟失敗任務(wù)等。ApplicationMaster是應(yīng)用框架,它負責(zé)向ResourceManager協(xié)調(diào)資源,并且與NodeManager協(xié)同工作完成Task的執(zhí)行和監(jiān)控。

Container: Container是YARN中的資源抽象,它封裝了某個節(jié)點上的多維度資源,如內(nèi)存、CPU、磁盤、網(wǎng)絡(luò)等,當(dāng)ApplicationMaster向ResourceManager申請資源時,ResourceManager為ApplicationMaster 返回的資源便是用Container 表示的。

yarn的架構(gòu)和工作流程

MapReduce開發(fā)運行的精簡原理(mapreduce開發(fā)流程)

步驟分析:

  1. 客戶端通過命令(hadoop jar xxx.jar)提交上傳任務(wù)到主節(jié)點ResourceManager(RM)中的ApplicationManager進程
  2. 主節(jié)點RM判斷集群狀態(tài),選擇一臺NodeManager(NM),開啟一塊資源Container,用來開啟AppMaster進程
  3. AppMaster進程獲取RM接收的任務(wù)請求,進行任務(wù)分配
  4. AppMaster根據(jù)任務(wù)情況向RM中的ResourceScheduler索要資源分配方案
  5. AppMaster根據(jù)資源分配方案找到到各個NodeManager從節(jié)點
  6. 在從節(jié)點上開啟資源Container,并運行任務(wù)Task
  7. AppMaster獲取各個Task上傳的任務(wù)執(zhí)行進度和結(jié)果
  8. AppMaster將任務(wù)執(zhí)行的結(jié)果返回給ApplicationManager

版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 舉報,一經(jīng)查實,本站將立刻刪除。

(0)
上一篇 2023年5月14日 上午10:28
下一篇 2023年5月14日 上午10:44

相關(guān)推薦

  • ,不得利用財政資金支付科研人員承擔(dān)的知識產(chǎn)權(quán)費用

    不得利用財政資金支付科研人員承擔(dān)的知識產(chǎn)權(quán)費用 近年來,隨著科技的不斷發(fā)展,很多科研人員都在努力推動科技進步,同時也取得了許多重要的成果。然而,在這個過程中,一些研究人員卻利用財政…

    科研百科 2024年11月28日
    1
  • 大創(chuàng)項目算科研項目嗎

    大創(chuàng)項目通常被視為科研項目。 大創(chuàng)項目是指學(xué)生團隊在本科期間參與的,具有創(chuàng)新性和實用性的科研項目。這些項目通常是由學(xué)校 or 企業(yè)組織的,旨在促進學(xué)生的科技創(chuàng)新能力和實踐能力,并為…

    科研百科 2025年3月20日
    3
  • 科研項目課題重要嗎

    科研項目課題的重要性 科研項目課題是科學(xué)研究的核心,它是實現(xiàn)科學(xué)成果的關(guān)鍵。科研項目課題的質(zhì)量直接影響著科學(xué)研究的進展和成果,也決定著科學(xué)家的職業(yè)前途和聲譽。因此,科研項目課題的重…

    科研百科 2025年3月5日
    1
  • wfilter

    Wi-Fi 濾波器:一種保護網(wǎng)絡(luò)的實用工具 Wi-Fi 濾波器是一種用于保護網(wǎng)絡(luò)安全的實用工具。隨著 Wi-Fi 網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)安全問題也日益突出。Wi-Fi 濾波器可以通過過濾…

    科研百科 2024年10月4日
    9
  • 技術(shù)基礎(chǔ)科研項目分類

    技術(shù)基礎(chǔ)科研項目分類 隨著科技的不斷發(fā)展,許多科研項目都涉及到各種不同的技術(shù)基礎(chǔ)領(lǐng)域。這些技術(shù)基礎(chǔ)領(lǐng)域?qū)τ诳蒲许椖康捻樌M行和取得成功至關(guān)重要。本文將介紹一些常見的技術(shù)基礎(chǔ)科研項目…

    科研百科 2025年3月22日
    6
  • 科研項目負責(zé)人和成員(對科研項目負責(zé)人的評價)

    科研項目負責(zé)人是項目管理中非常重要的一環(huán)。他們負責(zé)制定項目計劃,協(xié)調(diào)團隊成員,監(jiān)督項目進展,并確保項目按時完成。在這篇文章中,我將對科研項目負責(zé)人進行一些評價。 首先,一個好的科研…

    科研百科 2024年4月5日
    87
  • 企業(yè)所得稅“兩免三減半”優(yōu)惠期的確定(企業(yè)所得稅 兩免三減半)

    《財政部 稅務(wù)總局 發(fā)展改革委 工業(yè)和信息化部關(guān)于促進集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)高質(zhì)量發(fā)展企業(yè)所得稅政策的公告》(2020年第 45 號)規(guī)定自2020年1月1日起,國家鼓勵的軟件企業(yè)…

    科研百科 2023年3月25日
    317
  • 光伏電站項目管理系統(tǒng)

    光伏電站項目管理系統(tǒng) 隨著光伏電站的快速增長,項目管理也變得越來越復(fù)雜。傳統(tǒng)的手動管理方式已經(jīng)無法滿足現(xiàn)代項目的需求,因此,光伏電站項目管理系統(tǒng)應(yīng)運而生。 光伏電站項目管理系統(tǒng)是一…

    科研百科 2024年12月30日
    2
  • 合同管理制度銷售

    合同管理制度銷售 合同管理制度是保證企業(yè)銷售合同有效實施的重要保障措施,也是企業(yè)長期發(fā)展的重要基石。隨著市場經(jīng)濟的發(fā)展,合同管理制度已經(jīng)成為企業(yè)銷售過程中必不可少的一部分。本文將介…

    科研百科 2024年9月20日
    2
  • 高途科研項目含金量

    高途科研項目含金量高 高途科研項目是一項備受關(guān)注的高質(zhì)量項目,其含金量高,具有廣泛的應(yīng)用前景和巨大的市場潛力。近年來,隨著科技的不斷發(fā)展,越來越多的企業(yè)和個人開始關(guān)注高途科研項目,…

    科研百科 2025年3月7日
    3
日韩中文字幕一区三区| 性夜影院爽黄A爽免费| 国产a久久精品日韩一区二区三区| 亚洲综合男女| 国产麻豆va精品视频| 一级黄色网站黄色| 亚洲肉成网| 日韩视频中文字幕| 中文字幕日本成人动漫| 熟女九九视频| 日本天堂一区二区三区| 黄色网站av一区二区| 久久久品无码一二三区| 人人澡人人澡人人澡| 国产成人免费视频| 国产aaaaaa| 日本黄色免费电影网| 亚洲伊人久久久综合| 五月天婷婷久久| 亚洲熟女不卡一区二区| 99热这里只有乱| 欧美二级生活片在线看| 精品国产一区二区av麻豆不卡| 诱惑美女一区| 国产裸体视频免费看| 成人免费国产精品视频| 国产台湾无码视频一区二区| 十六岁破处视频| 精品无码中文字幕蜜桃| 亚洲中文字幕精品一区二区三区 | 强开乖女嫩苞又紧又嫩免费视频| 精品五月五久久久| 国产精品初高中精品久久| 偷自拍亚洲视频在线观看99| 中文字幕视频一区二区少妇| AV中文字幕不卡三区| 老熟妇精品一区二区三区| 小黎人体自慰| 伊人久久综合爱| 国产普通话对白视频高清| 在线看www日在线推荐|