[Hadoop] bxg007-博学谷-hadoop基础入门-博学谷

[复制链接]
online_admin aixure 发表于 2021-3-7 17:41:07 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
111808ttl85ixls8lccv88
售 价: ¥15¥899加入会员,免费下载
库 存:9999
销 量:78
源 址:
卖家服务: 正品保证 
客 服:QQ(早10点-晚6点)
资源详情
bxg007-博学谷-hadoop基础入门-博学谷
【课程介绍】
学习大数据的同学都知道,Hadoop是一个很重要的知识点。本文主要概括了Hadoop的定义、优势和作用,带大家了解Hadoop基础知识能够快速入门。
bxg007-博学谷-hadoop基础入门-博学谷



    1、Hadoop的定义


    一句话概括:Hadoop就是存储海量数据和分析海量数据的工具。


    Hadoop是由java语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是HDFSMapReduce。


    HDFS是一个分布式文件系统:引入存放文件元数据信息的服务器Namenode和实际存放数据的服务器Datanode,对数据进行分布式储存和读取。


    MapReduce是一个计算框架:MapReduce的核心思想是把计算任务分配给集群内的服务器里执行。通过对计算任务的拆分(Map计算/Reduce计算)再根据任务调度器(JobTracker)对任务进行分布式计算。


    2、Hadoop的优势


    高可靠性 : Hadoop 按位存储和处理数据的能力值得人们信赖。


    高扩展性 : Hadoop 是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以干计的节点中。


    高效性 : Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。


    高容错性 : Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分。


    低成本 : 与一体机、商用数据仓库以及 QlikView、 Yonghong Z- Suites 等数据集市相比,Hadoop 是开源的,项目的软件成本因此会大大降低。


    Hadoop 带有用 Java 语言编写的框架,因此运行在 linux 生产平台上是非常理想的, Hadoop 上的应用程序也可以使用其他语言编写,比如 C++。


    3、Hadoop可以做什么


    可以大数据存储:分布式存储


    日志处理:擅长日志分析


    ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库


    机器学习: 比如Apache Mahout项目


    搜索引擎:Hadoop + lucene实现


    数据挖掘:目前比较流行的广告推荐,个性化广告推荐


    Hadoop是专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。


    以上就是Hadoop基础知识的快速入门讲解,大家都弄清楚了吗?

温馨提示:
1、如果下载地址失效,请尽快反馈给我们,我们尽快修复。点此反馈>>
2、全站资源高清无密,课程百分百高清,完整,原画,包含所有的视频+素材+课件+源码,官方同步体验!每天更新,成为vip后可免费下载本站IT课程。点此办理会员>>
3、有任何问题,请咨询QQ:87887023
4、支持7*24小时自助购买,购买后自动发货,链接永久有效,自动更新
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

专注资源整合与知识分享
客服QQ

87887023

周一至周日9:00-23:00

反馈建议

点此进行反馈 kfs 在线QQ咨询
ftqrcode

扫描二维码关注我们

label_sm_90020

Powered by 优百课栈 X3.4© 2019-2025