hadoop是做什么的，hadoop是数据库技术吗

本文目录一览

1，hadoop是数据库技术吗
2，hadoop distributed file systems 是什么意思
3，Hadoop主要应用的地方学习时需要注意的地方
4，学习Hadoop需要学习哪些基础知识
5，openstack 和hadoop的区别是什么
6，OpenStack 和 Hadoop 的区别是什么

1，hadoop是数据库技术吗

不是 hadoop是一种大数据处理技术在其上有hbase hbase是一种nosql数据库

hadoop是数据库技术吗

2，hadoop distributed file systems 是什么意思

Hadoop Distributed File System (HDFS) — Apache Hadoop 项目的一个子项目 — 是一个高度容错的分布式文件系统，设计用于在低成本硬件上运行。HDFS 提供高吞吐量应用程序数据访问功能，适合带有大型数据集的应用程序。

hadoop distributed file systems 是什么意思

3，Hadoop主要应用的地方学习时需要注意的地方

Hadoop主要用来进行并行计算。例如：一个大数据，有10GB。若集群中有10个计算节点，那么经过Hadoop框架拆分后，每个节点只需计算1GB的数据即可，这样大大减少了计算时间。像日志分析、PageRank计算等，一句话，就是将大任务分解为小任务。在学习时，有两本书可以推荐给你：《Hadoop权威指南》、《实战Hadoop：开启通向云计算的捷径》。需要注意的地方就是将MapReduce框架掌握好，自己多写几个程序，API多看看。另外集群的配置参数也多学习学习。我一开始学习的时候也是一头雾水，不过在自己写过几个程序后就觉得非常明朗了，所以你也要多实际应用应用。

Hadoop主要应用的地方学习时需要注意的地方

4，学习Hadoop需要学习哪些基础知识

如果是掌握hadoop的使用，java基础好就可以了，看看hadoop权威指南。想深入学习源码的话，就需要些网络编程的知识了。不过个人觉得hadoop最终是用于数据分析的，所以数据挖掘，机器学习这样的算法反而比掌握hadoop本身更重要一些，重点看用hadoop来做什么。我也是初学，只是一点体会，希望能帮到你。

能够理解分布式系统跟多线程就没什么问题，大方向对了，小细节，比如语言反而是次要的。

一楼说的有道理，要看你用hadoop做什么，如果是用的话很简单，会java就可以用maprduce编程啦！它的api看看就可以。如果是研究hadoop的底层，它本身是用java语言开发的，源码你应该看得懂的，呵呵

5，openstack 和hadoop的区别是什么

OPEN的票一般是不指定具体航班信息的机票，有半OPEN的，就是指定航空公司，不指定航班号，还有全OPEN的，就是航空公司，航班号都不指定。国际票OPEN得较多，国内一般不允许OPEN。 OK票是指机票座位的情况，座位一般有很多种状态，HL表示候补，OK就表示订座。只有OK票才允许登机。 0票面机票一般指团队票，因为团队票有折扣，而且不统一，所以航空公司在出团队票时，把票面额达成0。这样的票是不能退票的，也不能签转和改签别的航空公司。所谓OK票，即已经定妥日期、航班和机座的机票。持OK票着若在该联程或者回程站停留72小时以上，国内机票须在联程或回程航班机起飞前两天的中午12时以前，国际机票须在72小时前办理座位再确认手续，否则原定座位不予保留。 open票则是不定期机票，旅客乘机前须持机票和有效证件去民航办理定座手续

openstack 主要目的是做一整套的云计算基础构架。包括云计算(compute), 网络(network)，对象存贮(object store)，镜像文件存储 (image)，身份认证(authentication)，blockstorage 以及前端ui 。 openstack的每个模块都对外提供api，可以独立供云用户调用，在openstack内部，每个模块之间的相互调用也是用这些api. the openstack project as a whole is designed to "deliver(ing) a massively scalable cloud operating system." 而 hadoop 是一个分布式数据库。举个例子：openstack 中 object store 模块可以选择用hadoop来支持。如果把 openstack 比作windows的话，hadoop 相当于sql server。

6，OpenStack 和 Hadoop 的区别是什么

openstack是一个iaas云平台（云计算saas，paas，iaas中的iaas），是亚马逊aws的开源实现。OpenStack是一个开源的云计算管理平台项目，由几个主要的组件组合起来完成具体工作。OpenStack支持几乎所有类型的云环境，项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。OpenStack通过各种互补的服务提供了基础设施即服务（IaaS）的解决方案，每个服务提供API以进行集成。 hadoop是一个分布式的软件架构，有分布式计算和分布式存储。 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。 Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。HDFS放宽了（relax）POSIX的要求，可以以流的形式访问（streaming access）文件系统中的数据。 Hadoop的框架最核心的设计就是：HDFS和MapReduce。HDFS为海量的数据提供了存储，则MapReduce为海量的数据提供了计算。

OpenStack 主要目的是做一整套的云计算基础构架。包括云计算(Compute), 网络(Network)，对象存贮(Object Store)，镜像文件存储 (Image)，身份认证(Authentication)，BlockStorage 以及前端UI 。 OpenStack的每个模块都对外提供API，可以独立供云用户调用，在OpenStack内部，每个模块之间的相互调用也是用这些API. The OpenStack project as a whole is designed to "deliver(ing) a massively scalable cloud operating system." 而 Hadoop 是一个分布式数据库。举个例子：OpenStack 中 Object Store 模块可以选择用Hadoop来支持。如果把 Openstack 比作WIndows的话，Hadoop 相当于Sql Server。

文章TAG：hadoop 做什么什么数据 hadoop是做什么的