中文字幕第五页-中文字幕第页-中文字幕韩国-中文字幕最新-国产尤物二区三区在线观看-国产尤物福利视频一区二区

大數據hadoop領域技術總體介紹(各個組件的作用)

2019/2/16 星期六

大數據領域技術總體介紹(各個組件的作用)
1、大數據技術介紹
大數據技術生態體系:
Hadoop 元老級分布式海量數據存儲、處理技術系統,擅長離線數據分析
Hbase 基于hadoop 的分布式海量數據庫,離線分析和在線業務通吃
Hive sql 基于hadoop 的數據倉庫工具,使用方便,功能豐富,使用方法類似SQL
Zookeeper 集群協調服務
Sqoop 數據導入導出工具
Flume 數據采集框架 //經常會結合kafka+flume數據流 或者用于大量的日志收集到hdfs上 日志收集分析大多數企業用elk
Storm 實時流式計算框架,流式處理領域頭牌框架
Spark 基于內存的分布式運算框架,一站式處理all in one,新秀,發展勢頭迅猛
sparkCore //應用開發
SparkSQL //sql操作 類似hive
SparkStreaming //類似于storm

目前創新互聯已為超過千家的企業提供了網站建設、域名、網絡空間、綿陽服務器托管、企業網站設計、嵊泗網站維護等服務,公司將堅持客戶導向、應用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協力一起成長,共同發展。

機器學習:
Mahout 基于mapreduce 的機器學習算法庫
MLLIB 基于spark 機器學習算法庫

大數據hadoop領域技術總體介紹(各個組件的作用)

大數據hadoop領域技術總體介紹(各個組件的作用)

由上圖可以看出,大數據hadoop生態圈中類似于一個動物園,zookeeper組件就類似于一個管理者,管理這些動物。//大數據生態圈的組件很多,不知我們上面提到的組件,圖中展示的為基本組件。

2、需要由潛到深
一、理解該框架的功能和適用場景
二、使用(安裝部署,編程規范,API)
三、運行機制
四、結構原理
五、源碼

3、hadoop基本介紹
(1)hadoop 是用于處理(運算分析)海量數據的技術平臺,且是采用分布式集群的方式;
(2)hadoop 兩個大的功能:
? 提供海量數據的存儲服務;
? 提供分析海量數據的編程框架及運行平臺;
(3)Hadoop 有3大核心組件:
? HDFS---- hadoop 分布式文件系統海量數據的存儲(集群服務),
? MapReduce----分布式運算框架(編程框架)(導jar 包寫程序),海量數據運算分析(替代品:storm /spark 等)
? Yarn ----資源調度管理集群(可以理解為一個分布式的操作系統,管理和分配集群硬件資源)
(4)使用Hadoop:
? 可以把hadoop 理解為一個編程框架(類比:structs、spring、hibernate/mybatis),有著自己特定的API 封裝和用戶編程規范,用戶可借助這些API 來實現數據處理邏輯;從另一個角度,hadoop 又可以理解為一個提供服務的軟件(類比:數據庫服務
oracle/MySQL、索引服務solr,緩存服務redis 等),用戶程序通過客戶端向hadoop集群請求服務來實現特定的功能;
(5)Hadoop 產生的歷史
最早來自于google 的三大技術論文:GFS/MAPREDUCE/BIG TABLE
(為什么google 會需要這么一種技術?)
后來經過doug cutting 的“山寨”,出現了java 版本的hdfs mapreduce 和hbase
并成為apache 的頂級項目hadoop ,hbase
經過演化,hadoop 的組件又多出一個yarn(mapreduce+ yarn + hdfs)
而且,hadoop 外圍產生了越來越多的工具組件,形成一個龐大的hadoop 生態體系

為什么需要hadoop
在數據量很大的情況下,單機的處理能力無法勝任,必須采用分布式集群的方式進行處理,而用分布式集群的方式處理數據,實現的復雜度呈級數增加,所以,在海量數據處理的需求下,一個通用的分布式數據處理技術框架能大大降低應用開發難度和減少工作量。

hadoop業務的整體開發流程:見圖
flume數據采集--->MapReduce清洗---->存入hbase或者hdfs---->hive統計分析---->存入hive表中--->sqoop導入導出--->mysql數據庫--->web展示

大數據hadoop領域技術總體介紹(各個組件的作用)

提示:其中我們當數據量非常大的時候,我們可以在flume數據采集節點加入kafka消息隊列形成緩存區;在數據清洗階段我們可以用spark 或者storm flink等內存和實時流算法框架(針對不同的業務場景);存入hadoop中的HBASE或者hdfs中;在數據分析階段,我們可以用hive或者impala等計算工具;web展示的時候,可以把數據用elk中kabina//數據可視化工具kabina或者Grafana

名稱欄目:大數據hadoop領域技術總體介紹(各個組件的作用)
轉載源于:http://m.2m8n56k.cn/article36/ipjjsg.html

成都網站建設公司_創新互聯,為您提供App設計、網站營銷、ChatGPT外貿網站建設域名注冊做網站

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:[email protected]。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

營銷型網站建設
主站蜘蛛池模板: 婷婷色综合久久五月亚洲 | 国产一级二级三级毛片 | 久久一级片 | 日本污污网站 | 欧美一级片在线观看 | 深夜福利视频网站 | 老司机深夜影院入口aaaa | 国内自拍网红在线综合 | 香蕉国产人午夜视频在线观看 | 日韩欧美成人乱码一在线 | 久久免费看视频 | 亚洲国产精品久久久久 | 日韩精品一区二区三区乱码 | 萌白酱白丝护士服喷水铁牛tv | 国产精品免费久久久免费 | 欧美久久一区二区 | 91久久青青草原免费 | 国内精品久久久久影院网站 | 草草视频在线播放 | 免费在线看黄网址 | 日本高清aⅴ毛片免费 | 9丨精品国产高清自在线看 ⅹxx中国xxx人妖 | 2022国内精品免费福利视频 | 亚洲成年www | 久草免费资源在线 | 中国一级片免费看 | 午夜宅男宅女看在线观看 | 国产欧美在线观看不卡 | 亚洲第三区| 欧美二级在线观看免费 | 久久99精品九九九久久婷婷 | 国产精品自在线 | 另类视频区第一页 | 欧美巨大video粗暴 | 欧美成在线 | 99在线热视频 | 日本肥老妇色xxxxx日本老妇 | 中文在线三级中文字幕 | 欧美午夜免费观看福利片 | 97国产精品欧美一区二区三区 | 伊人手机视频 |