科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条
科技百科
  • 人气指数: 2346 次
  • 编辑次数: 1 次 历史版本
  • 更新时间: 2012-05-01
高兴
高兴
发短消息
相关词条
大数据副作用
大数据副作用
大数据时代的业务转型
大数据时代的业务转型
大数据挑战谷歌
大数据挑战谷歌
社会化商业新数据时代
社会化商业新数据时代
大数据的兴起
大数据的兴起
大数据邂逅网络交友
大数据邂逅网络交友
竞争优势与大数据
竞争优势与大数据
大数据的未来是App
大数据的未来是App
大数据常见误解
大数据常见误解
大数据改变美国大选
大数据改变美国大选
推荐词条
希拉里二度竞选
希拉里二度竞选
《互联网百科系列》
《互联网百科系列》
《黑客百科》
《黑客百科》
《网络舆情百科》
《网络舆情百科》
《网络治理百科》
《网络治理百科》
《硅谷百科》
《硅谷百科》
2017年特斯拉
2017年特斯拉
MIT黑客全纪录
MIT黑客全纪录
桑达尔·皮查伊
桑达尔·皮查伊
阿里双十一成交额
阿里双十一成交额
最新词条

热门标签

微博侠 数字营销2011年度总结 政务微博元年 2011微博十大事件 美国十大创业孵化器 盘点美国导师型创业孵化器 盘点导师型创业孵化器 TechStars 智能电视大战前夜 竞争型国企 公益型国企 2011央视经济年度人物 Rhianna Pratchett 莱恩娜·普莱契 Zynga与Facebook关系 Zynga盈利危机 2010年手机社交游戏行业分析报告 游戏奖励 主流手机游戏公司运营表现 主流手机游戏公司运营对比数据 创建游戏原型 正反馈现象 易用性设计增强游戏体验 易用性设计 《The Sims Social》社交亮 心理生理学与游戏 Kixeye Storm8 Storm8公司 女性玩家营销策略 休闲游戏的创新性 游戏运营的数据分析 社交游戏分析学常见术语 游戏运营数据解析 iPad风行美国校园 iPad终结传统教科书 游戏平衡性 成长类型及情感元素 鸿蒙国际 云骗钱 2011年政务微博报告 《2011年政务微博报告》 方正产业图谱 方正改制考 通信企业属公益型国企 善用玩家作弊行为 手机游戏传播 每用户平均收入 ARPU值 ARPU 游戏授权三面观 游戏设计所运用的化学原理 iOS应用人性化界面设计原则 硬核游戏 硬核社交游戏 生物测量法研究玩家 全球移动用户 用户研究三部曲 Tagged转型故事 Tagged Instagram火爆的3大原因 全球第四大社交网络Badoo Badoo 2011年最迅猛的20大创业公司 病毒式传播功能支持的游戏设计 病毒式传播功能 美国社交游戏虚拟商品收益 Flipboard改变阅读 盘点10大最难iPhone游戏 移动应用设计7大主流趋势 成功的设计文件十个要点 游戏设计文件 应用内置付费功能 内置付费功能 IAP功能 IAP IAP模式 游戏易用性测试 生理心理游戏评估 游戏化游戏 全美社交游戏规模 美国社交游戏市场 全球平板电脑出货量 Facebook虚拟商品收益 Facebook全球广告营收 Facebook广告营收 失败游戏设计的数宗罪名 休闲游戏设计要点 玩游戏可提高认知能力 玩游戏与认知能力 全球游戏广告 独立开发者提高工作效率的100个要点 Facebook亚洲用户 免费游戏的10种创收模式 人类大脑可下载 2012年最值得期待的20位硅谷企业家 做空中概股的幕后黑手 做空中概股幕后黑手 苹果2013营收 Playfish社交游戏架构

Hadoop淘金时代 发表评论(0) 编辑词条

目录

Hadoop淘金时代编辑本段回目录

IDC的大数据市场预测,大数据将会迎来大时代。分析公司表示截止到2015年大数据产值将达169亿美元。不过我们尚不明确,这个市场有多新,或者除了大数据新兴企业是否真正会刮起一个淘金热。这是开源的炒作吗?按大数据的风格重演?

可能是的。开源在科技新闻界风行了好几年,因为它曾承诺能够降低成本同时获得企业级的IT自由度。最终,只有几个新兴企业投资(MySQL, JBoss),但是对于大部分的企业而言,真正的价值来自IT供应商和内部的IT组织,利用开源为他们的软件项目提供原材料。开源越来越不关于销售,而是代码,这也正是设计它的目的所在。

如今,很多的风险投资家将大量的钱投入大数据新兴企业希望能够致富,一些人也确实做到了。但是请弄清楚:数据分析长久以来都是技术产业的一部分。现在我们可能把它叫作“大数据”,但是它至少是未来20年来一个远瞻性的产业,一位博主这样写道。

把它叫作数据仓库、数据挖掘、又或者商业分析。随便你喜欢叫什么都可以。它并不新,甚至不一定是游戏规则的改变者,但是很多行业长期都需要优化数据收集和分析,所以技术提高就变得很有意义了。

然而,这里有两方面是新的大数据(也可以是开源)所要注意的:成本和规模。这两个因素,可能比别的都重要,Hadoop的惊人增长甚至让 “数据挖掘”失去了昔日的地位。Hadoop使得收集和分析数据变得低成本、便于扩展,形成商业化的硬件。在过去,运行信贷业务的金融服务公司,不得不给IBM支付巨额支票用于专业的硬件和软件。

不会再这样了。Hadoop有大量大众化的数据,将其转化为有竞争力的市场。

Hadoop不是凭空出现的。各种其它的事情,例如包括提升基础设施、移动设备和社会数据,都将使与Hadoop高度相关的人群受益。重要的是,在开源以前,Hadoop和大数据移动的真正价值被企业内部所有,而没有支付给不同的供应商。是的,这对于Hadoop新兴企业会有很好的出路,但是更大的赢者是内部的Hadoop专业知识获得发展。

总之,大数据就是大。但是它并不新,创新的地方是通过处理大量数据而降低数据仓库的花费。与开源相似,大部分大数据的价值被内部团队所用,让他们知道如何将专业知识应用于他们所收集的数据。好消息是,一些企业将会从大数据的“淘金热”中致富。

更好的消息是,大部分富起来的企业还将继续使用Hadoop和大数据技术。

大数据的解决方案不止只有Hadoop编辑本段回目录

要对当下的大数据解决方案进行分类评估可着实不是易事。首先,大数据工具似乎是在一夜之间就如雨后春笋般涌现出来,因此大家自然会对它们抱有一丝怀疑,毕竟像Hadoop与NoSQL这样的大项目也才刚刚付诸实际应用。

这个嘛……各位的顾虑及审慎的态度当然值得赞赏,不过实际上大多数此类解决方案早就已经实际服务于生产生活了;另外,某些旧有方法(例如企业搜索)也是可以为大数据业务服务的。

Brian Proffitt是一位Linux及开源项目记者兼分析师,他撰写了一篇相当精彩的文章,详细阐述了当今IT业界中较有影响的几种大数据技术。在这里我要向大家郑重推荐这篇文章,甚至最好把它保存下来,用作日后参考。

首先,Proffitt介绍了NoSQL数据库的特色,并讲述了它与关系类数据库有何不同之处。他结合实例概括了以下五种NoSQL(请注意是非关系类)数据库类型:

分布式键-值存储(简称DKVS)数据库,又名最终一致性键-值存储数据库。这种数据库在设计上主要是为了处理大量服务器上的数据存储问题。此处的关键字是“Dynamo平台”,因为大多数DKVS数据库都采用Dynamo平台或是以Dynamo平台为基础。

键-值存储(简称KVS)数据库,它将数据存储在硬盘或是内存中,并将键与值加以映射。此类解决方案包括开源方案Redis、Berkeley DB以及Memcache DB。

列式存储数据库,作者将其描述为一套“单独的、巨大的数据库列表,内部还充满嵌入式数据列表。”Hadoop、Cassandra以及谷歌的BigTable都是列式存储数据库的典型代表。

文档式存储数据库,顾名思义,存储并对整套文档数据价值进行排序。这类数据库并没有使用像列表、行、列等常见的方法,而是倾向于使用“非shema 类JSON型对象即文档”方式,这与常规XML文档截然相反,他指出。此类数据库中的佼佼者包括MongoDB以及CouchDB。

图形式存储数据库。这种类型我不太熟悉,也很难快速掌握其特性,在这里就直接援引原作者的表述:“数据操作在一套面向对象的架构中完成,利用图形来映射键、值以及二者之间的关系,而不是通过常见的列表,”他写道。Neo4j、HypergraphDB以及Bigdata(没错,的确有这么一种大数据解决方案就叫‘Bigdata’——大家是不是在懊恼自己没有抢先使用这么好的名字?)都属于这一类型。

好了,这就是能在网上搜罗到的全部信息了,解释得也很清楚。不过我们要怎么利用它们处理业务中的数据呢?别担心,Proffitt同样精心给出了几种选择,朋友们放心,这份清单比上面的要短得多。熟悉关系类数据库的朋友们有福了,因为这些方案都可以直接创建在原有数据库内部。NoSQL就悲剧了,没有什么能够直接契合的选项。这里Proffitt给出的方案是:

MapReduce,这款产品在使用上比较复杂,而且常常需要我们进行手动编码。不过CouchDB与Hadoop也差不多,都比较难用。

企业搜索产品,这类方案在处理大量文档及日常业务等结构化数据方面表现极为出色。他列出的备选产品有Apache Lucene、Apache Solr以及ElasticSearch。

就这些,一共两种选择。信息量似乎不大,但好处还在后面:Proffitt在他的文章中列出了长达两页半的大数据服务供应商及解决方案选项。

→如果您认为本词条还有待完善,请 编辑词条

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

标签: Hadoop淘金时代

收藏到: Favorites  

同义词: 暂无同义词

关于本词条的评论 (共0条)发表评论>>

对词条发表评论

评论长度最大为200个字符。