本文目录一览

1,hadoop是数据库技术吗

不是 hadoop是一种大数据处理技术 在其上有hbase hbase是一种nosql数据库

hadoop是数据库技术吗

2,hadoop distributed file systems 是什么意思

Hadoop Distributed File System (HDFS) — Apache Hadoop 项目的一个子项目 — 是一个高度容错的分布式文件系统,设计用于在低成本硬件上运行。HDFS 提供高吞吐量应用程序数据访问功能,适合带有大型数据集的应用程序。

hadoop distributed file systems 是什么意思

3,Hadoop主要应用的地方学习时需要注意的地方

Hadoop主要用来进行并行计算。 例如:一个大数据,有10GB。若集群中有10个计算节点,那么经过Hadoop框架拆分后,每个节点只需计算1GB的数据即可,这样大大减少了计算时间。像日志分析、PageRank计算等,一句话,就是将大任务分解为小任务。 在学习时,有两本书可以推荐给你:《Hadoop权威指南》、《实战Hadoop:开启通向云计算的捷径》。需要注意的地方就是将MapReduce框架掌握好,自己多写几个程序,API多看看。另外集群的配置参数也多学习学习。 我一开始学习的时候也是一头雾水,不过在自己写过几个程序后就觉得非常明朗了,所以你也要多实际应用应用。

Hadoop主要应用的地方学习时需要注意的地方

4,学习Hadoop需要学习哪些基础知识

如果是掌握hadoop的使用,java基础好就可以了,看看hadoop权威指南。想深入学习源码的话,就需要些网络编程的知识了。不过个人觉得hadoop最终是用于数据分析的,所以数据挖掘,机器学习这样的算法反而比掌握hadoop本身更重要一些,重点看用hadoop来做什么。我也是初学,只是一点体会,希望能帮到你。
能够理解分布式系统跟多线程就没什么问题,大方向对了,小细节,比如语言反而是次要的。
一楼说的有道理,要看你用hadoop做什么,如果是用的话很简单,会java就可以用maprduce编程啦!它的api看看就可以。如果是研究hadoop的底层,它本身是用java语言开发的,源码你应该看得懂的,呵呵

5,openstack 和hadoop的区别是什么

OPEN的票一般是不指定具体航班信息的机票,有半OPEN的,就是指定航空公司,不指定航班号,还有全OPEN的,就是航空公司,航班号都不指定。国际票OPEN得较多,国内一般不允许OPEN。 OK票是指机票座位的情况,座位一般有很多种状态,HL表示候补,OK就表示订座。只有OK票才允许登机。 0票面机票一般指团队票,因为团队票有折扣,而且不统一,所以航空公司在出团队票时,把票面额达成0。这样的票是不能退票的,也不能签转和改签别的航空公司。 所谓OK票,即已经定妥日期、航班和机座的机票。 持OK票着若在该联程或者回程站停留72小时以上,国内机票须在联程或回程航班机起飞前两天的中午12时以前,国际机票须在72小时前办理座位再确认手续,否则原定座位不予保留。 open票则是不定期机票,旅客乘机前须持机票和有效证件去民航办理定座手续
openstack 主要目的是做一整套的云计算基础构架。包括 云计算(compute), 网络(network),对象存贮(object store),镜像文件存储 (image),身份认证(authentication),blockstorage 以及 前端ui 。 openstack的每个模块都对外提供api,可以独立供云用户调用,在openstack内部,每个模块之间的相互调用也是用这些api. the openstack project as a whole is designed to "deliver(ing) a massively scalable cloud operating system." 而 hadoop 是一个分布式数据库。举个例子:openstack 中 object store 模块可以选择用hadoop来支持。如果把 openstack 比作windows的话,hadoop 相当于sql server。

6,OpenStack 和 Hadoop 的区别是什么

openstack是一个iaas云平台(云计算saas,paas,iaas中的iaas),是亚马逊aws的开源实现。OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作。OpenStack支持几乎所有类型的云环境,项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。OpenStack通过各种互补的服务提供了基础设施即服务(IaaS)的解决方案,每个服务提供API以进行集成。 hadoop是一个分布式的软件架构,有分布式计算和分布式存储。 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。 Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。
OpenStack 主要目的是做一整套的云计算基础构架。包括 云计算(Compute), 网络(Network),对象存贮(Object Store),镜像文件存储 (Image),身份认证(Authentication),BlockStorage 以及 前端UI 。 OpenStack的每个模块都对外提供API,可以独立供云用户调用,在OpenStack内部,每个模块之间的相互调用也是用这些API. The OpenStack project as a whole is designed to "deliver(ing) a massively scalable cloud operating system." 而 Hadoop 是一个分布式数据库。举个例子:OpenStack 中 Object Store 模块可以选择用Hadoop来支持。如果把 Openstack 比作WIndows的话,Hadoop 相当于Sql Server。

文章TAG:hadoop  做什么  什么  数据  hadoop是做什么的  
下一篇