Hadoop – 大数据解决方案

Hadoop – 大数据解决方案


传统方法

在这种方法中,企业将拥有一台计算机来存储和处理大数据。出于存储目的,程序员将借助他们选择的数据库供应商(例如 Oracle、IBM 等)的帮助。在这种方法中,用户与应用程序进行交互,应用程序依次处理数据存储和分析部分。

大数据传统方法

局限性

这种方法适用于处理标准数据库服务器可以容纳的海量数据的应用程序,或者处理数据的处理器的限制。但是当涉及到处理大量可扩展的数据时,通过单一的数据库瓶颈来处理这些数据是一项繁重的任务。

谷歌的解决方案

谷歌使用一种叫做 MapReduce 的算法解决了这个问题。该算法将任务分成小部分,并将它们分配给多台计算机,并从它们中收集结果,整合后形成结果数据集。

Google MapReduce

Hadoop

使用 Google 提供的解决方案,Doug Cutting和他的团队开发了一个名为HADOOP 的开源项目

Hadoop 使用 MapReduce 算法运行应用程序,其中数据与其他数据并行处理。简而言之,Hadoop 用于开发可以对海量数据进行完整统计分析的应用程序。

Hadoop框架

觉得文章有用?

点个广告表达一下你的爱意吧 !😁