科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条

最新历史版本 :提纯大数据业务价值 返回词条

  • 编辑时间: 历史版本编辑者:明天
  • 内容长度:图片数:目录数:
  • 修改原因:
目录

提纯大数据业务价值 回目录

 4月17日、18日在北京国家会议中心隆重举行2012 第四届CCS云计算高峰论坛暨展览。近3000名来自运营商、政府部门、金融、保险、电力、能源、医疗、公安、军队、教育、制造等行业的企业IT、信息部门主管及专家学者齐聚一堂,深度探讨云计算应用现状及发展趋势,分享交流云计算的优秀案例。知名厂商“甲骨文”亮相“云计算高峰论坛”并发表精彩主题演讲,以下是甲骨文大中华区技术架构部总监林逸飞演讲主题“如何提纯大数据的业务价值?”演讲实录。

 


  甲骨文大中华区技术架构部总监林逸飞

  大家早上好,今天跟大家聊的话题是大数据,大数据跟云计算之间的关系越来越紧密,因为云计算提供了很多新的方式,使得我们有机会去处理这些大数据。今天我讲的是大数据在我们获得了以后,怎么能够让它真的在我们业务里面有价值,所以用了一个词叫提纯,下面我带着大家一块去把大数据做一次提纯。

  开始之前我也想把oracle现在的变化说一下,工程规划,很多大厂商都在跟随着甲骨文的脚步,不断的推出各种各样的一体化设备,可能这是一个潮流,都希望通过推出这样一些一体化或者精装修的系统,帮助客户降低他的运维成本,提高他的运行效率。

  大数据非常复杂,有结构化,也有非结构化的,增长速度飞快,单条数据的价值密度极低,最后一个很重要,为什么说单条数据业务价值极低,一条微博,或者一条博客,一条网上的日志对你来讲没有意义,我们需要的是把整个大的数据量,从中按图索骥,或者找出一些业务规律,业务价值,大数据才能为我所用,这是大数据的四个特点。从甲骨文的角度来看,可能所有的客户,包括合作伙伴都知道,甲骨文是做数据起家的公司,今天仍然我们是做数据做得最好的公司。所以我们把数据理解成这样一个金字塔,整个金字塔的最下段,我们把它认为是大数据,通常是大PB级的,这些数据很复杂,都存在在企业的ERP系统里面,外部系统里面都有这样的数据,只是这些数据在今天大部分没有被利用,第二个层次是在今天我们所有的大型企业或者中型企业都有的数据仓库,或者业务分析类的一些系统里面,这种通常是以百T作为你的数据级别,这些数据是指导我们业务生产创新的核心数据,这些数据今天的来源,来自于我们的生产系统,我指的生产系统,比如说我们后端的ERP系统,网商,电子渠道,我们的交易系统,这些系统后面的业务数据被我们采集来,放在数据仓库里面,通过对历史的分析总结,然后我归纳一种规律,用于预测未来我的业务趋势跟走向,这是今天我的所有DWDI所做的一种做法,开个玩笑说这些数据都是婚后数据,客户已经跟你的企业发生关系了,然后产生了这些数据,你分析的是这样一些数据,但是你想的是什么,是我还有没有机会再找到下一个。

  最上端指导我们老板们做决策的,去决定新招一些人,还是砍到一百人,新发布一个产品,还是我们下架一个产品,来自BI系统,这是我们的核心决策数据。

  今天互联网也好,云计算也好,使得我们这些业务数据能够被涉及到范畴是如此众多,换句话说我们希望不光采集婚后数据,我也希望把婚前的这样一些没有发生关系之前的数据也采集进来,能够为我的业务提供更多的业务反馈点,这些反馈点可能更直接,更快,更丰富,这是大数据在今天为所有企业关注的主要原因。

  接下来是我的演讲题目,这些大数据,四个V的特点,量又大,速度也大,格式也众多,每一条数据的价值又非常低,我怎么把这些数据提纯起来,真的知道我的生产,这是提纯大数据的主要原因。我举一个最简单的例子,一个超市,今天我谈到的这些是有十几案例,而且这些技术在今天,可能在座很多朋友们手里都有。比如说我可以根据在商城里面所有部署的探头或者其他的设备,客户的行进路线我可以采集得到,根据他的行进路线,途径我的门店的时候,我可以定点向他推荐促销信息,这个完全做得到。整体的营销策略里面,跟进整个销售的战役的制定,来调整他的一些促销,或者我进货出货的策略。采集客户在微博、博客在相关的一些网站上面,各种各样的反馈,这样是一个很明显的,在今天我们完全能够利用到的业务场景。我拿这个金字塔套一下,大家看,这些数据我们把他归结为大数据,他可以被采集到系统里面来,同时我跟进他的业务策略,这些数据可能来自于我们的数据仓库,甚至于来自我的ERP系统,这些数据是我的生产数据。那当然我采集所有网络相关的这些数据,他一定是大数据,他希望进入到我最底层的金字塔最下面,作为我大数据的基础。关键是说这些数据之间是完全需要互动的,换句话说你要定时定点的推一些营销策略,或者根据机器传回来的数据进行判断,这个时候这些大数据要反过来,对你的DW,对你的生产系统直接发生关系,如果不这样的话,这些大数据没有用处。

  大数据提纯以后的结果,让这个大数据从金字塔最下端被逐渐提纯进入到DW,最后再进入各种各样的分析,进入到BI,数据逐渐浓缩,最后具有商业价值。所有人都在说我希望做微博营销,我希望提高在互联网上对我企业的影响,哪些数据对企业经营有十几价值,这就是一些数据,48%的客户,当他是手机微博的用户的时候,通常他会更乐意接受这些促销信息,其中有很大比例的人会在它的微博,或者博客上发布我曾经在这个里面接到这样一些东西,使用的体验是什么样的,这就是数据。对这个企业来讲,我先解决缺货的问题,我一定能够解决在我整个店里面最基本的问题,第二我可以对这些手机微博客户做一些定点营销和精准策略,这是两个精准的例子,后面想做这件事情是非常难的。

  首先在金字塔终端这个层次上,他两个核心系统,一个是企业ERP的生产系统,第二个就是企业原有的DW,BI系统。第二个在金字塔的最下端大数据这块,你有很多企业专业应用,这些应用可能直接跟机器,跟互联网打交道。第三金字塔的最上端你要有一个合适的BI的工具和平台,形成管理者的驾驶舱,内容把业务数据体现出来。想产生上面这两个简单的结果,中间画了一个环,他基本上要历经这四个步骤,只有通过这四个步骤才能把你的大数据发挥它真正的业务价值,首先我要能够获取,我有合适手段采集到各种各样的数据。第二我能够去计算组织他们,第三能够根据这样属于进行分析,最后形成我的判断、业务动作出来。这些大数据跟你现在的数据仓库,跟BI要集成,如果不集成的话,这些大数据在旁边又建了一个烟囱出来,没有用的。

  说到最后就是oracle,oracle实际上提供了完整的方案,同数据的捕获、组织、分析、决策我们都有平台化的工具和产品提供给客户和合作伙伴。首先是捕获,大家都知道oracle有自己的应用,从ERP到CRM,到各种的ECM我们都有然间,使得你有机会从各种各样的核心系统里面找到一些数据。第二针对所有非结构化的数据,oracle直接推出了一个产品就叫NoSQL数据库,很有伸缩性的一款产品,他可以帮助你存储非结构化数据。

  在组织这一块,我们业提供沙盒的功能,你可以在你的机器里面配置这样一个沙盒出来,所有分析全部在这个沙盒里面运行,他对CPU的消耗不会超过你这个沙盒所设置的限制,这样是帮助你去运行这样一些大数据分析的基础平台性的功能。我们提供这样一个产品ODI,oracle已经有几十年的产品。

  分析有一个R的组织,他是非常适合统计分析跟图表化展示的平台,他是开源的,而且比较适合在笔记本里面或者PC里面运行的系统。我们能够把它集成到oracle数据库里面,大数据机里面,提供这样三种方式,比如通过客户机访问,或者直接在大数据机里面运行,第三,可以在oracle数据库一体机里面直接去运行。在BI的信息表里面我们也集成了对R的支持。这是oracleExalytics,oracle不断在各种领域体现推出合适的一体化的设备,这也是一种一个,他的主要特点基于内存的实时BI的产品,在这个产品里面所内置的oracle内存数据库是一个定制版本,这个版本可以利用到更大范畴的内存,使得这样一些BI分析数据可以直接灌入内存,可以达到非常高的速度。

  做个总结,一体化的设备,oracle将近三年半以前开始做,在今天看来,我们推出的数据库一体机,云计算的弹性服务器,在过去三年里面,在市场上都得到了非常好的反馈,这个反馈来自于两个方面,一方面我们的业绩当然大家去看oracle的财报,确实是这几款机器给oracle贡献非常巨大,在过去三年里面搅动了很多企业做了类似的收购,跟相应产品的推出,这是oracle一体机的背景。

  在今天我们去谈oracle大数据平台的时候,实际上我们也有一体化的解决方案,前端我们有一个叫大数据机,去年10月份发布,这个机器是oracle运行大数据最主要的机器,刚才我谈到的各种平台工具,全部内置在这个机器里面,这是oracle作为大数据最前端处理金字塔最下端的PB级别数据的机器。中间成名了三四年的机器,作为世界上最快的做DW的机器,我们看作金字塔中间那块,当你需要做最终的决策的时候,进入到BI,基于内存的实时BI的机器,也是去年我们刚刚推出的,他可以基于定制版本的内存数据库,支撑整体BI决策。关键一点是我们在这三者之间集成这块花了非常大的气力,变成你真的可以从新浪微博、博客里面采集数据,进入到真正指导你企业的业务生产,这是oracle谈到整体化大数据整体解决方案。oracle在处理大数据这一块,是跟我们整个云计算的策略一脉相承的,所以oracle也有自己完整的云计算的方案,其中针对云中的大数据,是刚才我所跟大家阐述的所有的大数据解决方案,谢谢大家!

→如果您认为本词条还有待完善,请 编辑词条

标签: 提纯大数据业务价值