科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条
科技百科
  • 人气指数: 14990 次
  • 编辑次数: 1 次 历史版本
  • 更新时间: 2009-05-05
方兴东
方兴东
发短消息
相关词条
比特世界的原子革命
比特世界的原子革命
Ovi Store
Ovi Store
《科学技术研究项目评价通则》
《科学技术研究项目评价通则》
智能本
智能本
远程精神控制技术
远程精神控制技术
虚拟工厂
虚拟工厂
思维帽
思维帽
无序的天才
无序的天才
虚拟双胞胎
虚拟双胞胎
无线充电器
无线充电器
推荐词条
希拉里二度竞选
希拉里二度竞选
《互联网百科系列》
《互联网百科系列》
《黑客百科》
《黑客百科》
《网络舆情百科》
《网络舆情百科》
《网络治理百科》
《网络治理百科》
《硅谷百科》
《硅谷百科》
2017年特斯拉
2017年特斯拉
MIT黑客全纪录
MIT黑客全纪录
桑达尔·皮查伊
桑达尔·皮查伊
阿里双十一成交额
阿里双十一成交额
最新词条

热门标签

微博侠 数字营销2011年度总结 政务微博元年 2011微博十大事件 美国十大创业孵化器 盘点美国导师型创业孵化器 盘点导师型创业孵化器 TechStars 智能电视大战前夜 竞争型国企 公益型国企 2011央视经济年度人物 Rhianna Pratchett 莱恩娜·普莱契 Zynga与Facebook关系 Zynga盈利危机 2010年手机社交游戏行业分析报告 游戏奖励 主流手机游戏公司运营表现 主流手机游戏公司运营对比数据 创建游戏原型 正反馈现象 易用性设计增强游戏体验 易用性设计 《The Sims Social》社交亮 心理生理学与游戏 Kixeye Storm8 Storm8公司 女性玩家营销策略 休闲游戏的创新性 游戏运营的数据分析 社交游戏分析学常见术语 游戏运营数据解析 iPad风行美国校园 iPad终结传统教科书 游戏平衡性 成长类型及情感元素 鸿蒙国际 云骗钱 2011年政务微博报告 《2011年政务微博报告》 方正产业图谱 方正改制考 通信企业属公益型国企 善用玩家作弊行为 手机游戏传播 每用户平均收入 ARPU值 ARPU 游戏授权三面观 游戏设计所运用的化学原理 iOS应用人性化界面设计原则 硬核游戏 硬核社交游戏 生物测量法研究玩家 全球移动用户 用户研究三部曲 Tagged转型故事 Tagged Instagram火爆的3大原因 全球第四大社交网络Badoo Badoo 2011年最迅猛的20大创业公司 病毒式传播功能支持的游戏设计 病毒式传播功能 美国社交游戏虚拟商品收益 Flipboard改变阅读 盘点10大最难iPhone游戏 移动应用设计7大主流趋势 成功的设计文件十个要点 游戏设计文件 应用内置付费功能 内置付费功能 IAP功能 IAP IAP模式 游戏易用性测试 生理心理游戏评估 游戏化游戏 全美社交游戏规模 美国社交游戏市场 全球平板电脑出货量 Facebook虚拟商品收益 Facebook全球广告营收 Facebook广告营收 失败游戏设计的数宗罪名 休闲游戏设计要点 玩游戏可提高认知能力 玩游戏与认知能力 全球游戏广告 独立开发者提高工作效率的100个要点 Facebook亚洲用户 免费游戏的10种创收模式 人类大脑可下载 2012年最值得期待的20位硅谷企业家 做空中概股的幕后黑手 做空中概股幕后黑手 苹果2013营收 Playfish社交游戏架构

Google图书扫描机 发表评论(0) 编辑词条

Google图书扫描计划(Google's book scanning project)很有意思,值得关注。

目录

[显示全部]

谷歌推出图书扫描机 可将图书批量数字化编辑本段回目录

(图)Google图书计划Google图书计划

据著名科技博客TechCrunch报道,谷歌对于图书扫描一直非常重视。多年以来,这个问题也引起了作家和出版商的许多争议。在最近谷歌同美国作家协会(Authors Guild)所达成的和解协议里,谷歌就曾计划扫描数千万本书籍,并试图尽可能地将这些内容实现数字化。

谷歌高度重视获取书籍里保存的内容和知识,并准备提供有关的搜索索引,这也推动谷歌在2009年3月24日发布了一项专利,以便以更快的速度实现图书扫描。

据了解,这个图书扫描机使用了两个红外摄像头(infrared cameras)。这两个摄像头可以探测要扫描的每篇书页,确定其是平直还是弯曲,然后可以将这一信息传输至OCR软件,并进行失真校准。换句话说,红外摄像头可以确定扫描书籍的三维形态,然后进行任何相应的调整。由于这种技术既不会破坏图书装订,也不用把图书一页页打开平铺在扫描板上进行扫描,所以能够更快地进行图书扫描。因此,可以说谷歌找到了对图书批量数字化的方法。
除了谷歌的图书扫描项目之外,还有一些其它的图书扫描计划。例如互联网档案馆计划(Internet Archive)在全球启动了18个扫描中心,平均每天总共能够扫描1000本书,但并不清楚互联网图书馆计划使用的是哪种扫描技术,有可能谷歌使用的扫描技术会更快一些。

Google图书扫描计划背后的秘密编辑本段回目录

专利文档揭示Google如何快速、准确、无损伤地扫描数以百万计的图书。

(图)美国专利和商标局所展示的谷歌红外摄像头技术美国专利和商标局所展示的谷歌红外摄像头技术

Google公司计划将上千万册图书资料数字化。对于这项颇惹争议(以及很可能成为反竞争的)的计划,展开过各种讨论以及争辩,但对于该公司究竟如何实施该项计划,我们则知之甚少。

这项大胆的计划涉及将上千万册图书进行数字扫描。Google表示,该计划所采用的扫描系统,比我们现在普遍使用的平板扫描仪的先进程度简直可以用光年来描述了。实践证明,我们现在使用的平板扫描仪难免性能不可靠,亦或本来想要保存的书籍遭到损坏。但是Google公司从未“渴望”透露它是如何实施这一壮举:即使几年前当我访问牛津大学博德莱安图书馆,想了解详情时,他们都不曾允许我参观一下数字扫描室,因为那里的扫描设备被认为是属于商业机密。

不过,现在美国国家公共电台(NPR)已设法揭开了Google公司专利图书扫描系统背后的神秘细节——发现的秘密就是三维红外照相机:

    Google公司开发了一些非常精巧的红外照相机技术,可以探测放在扫描仪里的书籍页面的三维形状及角度。然后将探测信息转给光学字符识别软件,进行变形失真调整,以便光学字符识别软件能更精确地识别文字。这样,再不会损坏书籍的装订,再没有扫描玻璃板效率不高的烦恼了。

揭秘Google图书扫描机:实现批量化图书扫描编辑本段回目录

(图)美国专利和商标局所展示的谷歌红外摄像头技术美国专利和商标局所展示的谷歌红外摄像头技术

北京时间5月3日下午消息,据国外媒体报道,业内人士发现,美国第7508978号专利系谷歌秘制的图书扫描机,该专利揭示了谷歌图书扫描机的工作原理。

  在1999年谷歌创办前,图书扫描过程冗长,但也曾被认为将导致图书消亡,图书扫描软件称之为光学字符识别软件(OCR),该软件要求扫描的每页图书需平整放置。因此,一种方法是将图书一页页打开放在玻璃面板上,进行扫描,或是毁掉图书的装订,但这也会破坏图书,如何使图书扫描即高效又不对其造成破坏成为一大难题,从美国第7508978号专利来看,谷歌的图书扫描机解决了这一大难题。

  按该专利图示,当图书放置于谷歌图书扫描机内,该机拥有的红外摄像头技术将探测书页的三维形态和角度,随后这一信息传输至OCR软件,并进行失真校准,以便于OCR软件更准确地阅读文本。这种方式既不会破坏图书装订,也不用一页页打开扫描。利用该技术,谷歌找到了对图书批量数字化的方法。

Google建图书结算点 每本扫描图书作者获60美元编辑本段回目录

  CNET科技资讯网2月13日国际报道 去年10月,Google与美国作家协会签约1.25亿美元的结算方案,用于支付受版权保护作品的作者,但其作品需是经过Google扫描,并通过Google图书搜索可以在Web上搜到的作品。

  迄今为止,Google已经扫描了逾700万本图书,其中有大量图书都已不再出版。现在已经建立起了Google图书结算站点,已不再出版的图书的作者和其他版权人可以要求参与结算。

  作者、出版社和其他版权人可以通过每一本被扫描过的图书一次性得到60美元(若是一本书的部分内容,可以得到5-15美元的补偿)。作为回报,Google可以索引图书,并在搜索结果中显示部分内容,最多可以预览一本书20%的内容。Google还可以在显示的图书页面上显示广告,销售每部书的电子版本。

  作者和版权所有人将得到与其作品相关的所有广告和电子商务营收的63%。现在,Google的图书搜索还用于手机,可下载的电子图书将成为Google有趣的数字副业。

谷歌图书扫描项目,让尘封的图书重现屏幕编辑本段回目录

谷歌图书扫描项目让20世纪的文库以新形式出现,21世纪,生活在小镇中的孩子们也能在屏幕上找到这些书籍并阅读它们。(图片提供:Corbis)

(图)谷歌图书扫描项目谷歌图书扫描项目

5年前,谷歌公司启动了一项图书搜索项目,对全球大学图书馆藏书进行数字化扫描,打造世界最大的数字图书馆。这曾引起部分出版商和图书馆的不安与焦虑,它们担心谷歌会控制图书市场。如今,谷歌已扫描了700万种图书,其中约100万种书可以免费预览全部内容,100万种书是公版书,另外500万种是绝版且无法购买的图书馆藏书。

《纽约时报》的文章指出,谷歌的图书搜索系统让全球读者通过网络获取全球大图书馆的珍贵藏书或绝版图片;学者和其他有特殊兴趣的人们现在发现,轻轻地点一下鼠标,那些被尘封在图书馆书架和古文物研究书店中的珍贵信息便如泉水般涌出。

扫清版权障碍

2004年,当谷歌图书扫描启动时,谷歌和斯坦福、哈佛、牛津以及密歇根大学4家大学图书馆以及纽约公共图书馆签署了合作协议,并预计将花费6年时间对这1000万册图书进行扫描以及编目。如今,已有2万多家出版商与谷歌签约,允许谷歌扫描它们所出版的图书全文。

(图)图书扫描机图书扫描机

但项目启动后不久,约翰·威立、麦格劳-希尔、培生、企鹅、西蒙&舒斯特等出版商代表就将谷歌公司告上法庭;同时,代表作家利益的美国作家协会也对谷歌公司提出了诉讼。他们认为,谷歌公司在未经版权持有者允许的情况下,对它们出版的图书内容进行扫描并将其中部分内容免费提供给网友,严重侵犯了作者和出版商的利益。对于出版商和作家的抗议,谷歌公司一直坚称自己的行为属于“合理使用”的范畴。谷歌认为,网络用户只能通过图书搜索项目浏览部分内容,并不能打印或下载正版图书。而且,其图书搜索项目增加了图书的曝光率,提升了读者的购买欲。出版商和作者则认为,谷歌公司扫描的是整本书的内容,超出了“合理使用”的范畴,并向法院提出两起针对谷歌的诉讼。

2008年10月,作者和出版商就版权问题共同起诉谷歌的两起官司已经和解,谷歌将投入1.25亿美元,解决此纠纷。读者因此能够在网上阅读到更丰富的图书馆藏书。

协议达成时,各方均为之叫好,认为这个里程碑式的协议在谷歌图书扫描项目得以继续的同时,保护了作者和出版商的权益和经济利益。业界则普遍认为,此项协议的达成有两大意义:一、为数字化时代网络搜索引擎带来的版权问题树立了史无前例的新模式,这是图书数字化和在线发行领域的里程碑;二、此项和解一旦生效,读者即可通过谷歌图书搜索项目获取全世界图书资源,这样的知识财富无法用金钱衡量。

《纽约时报》的文章认为,谷歌与出版商和作者达成的新协议使有版权的绝版图书以数字化方式重生,也让作者因此获利。在谷歌目前扫描的700多万册图书中,大约有500万册属于有版权但已绝版并因此不再流通的图书。

美国资深律师大卫·索恩表示,无论最终收益如何,这项和解条件最重要的意义在于确定了一个非常重要的标准。美国企业管理分析师安德鲁·弗兰克表示,图书搜索对谷歌来说非常重要。他说:“我不确定谷歌要多久才能收回成本,但是这项协议使全球的知识资源都对读者开放,这个好处是无法用金钱衡量的。”

(图)原理图解原理图解

尽管这一协议在今年还有待法官的批准,但它为双方从数字版图书中获利铺平了道路,意味着谷歌为数字化时代网络搜索引擎带来的版权问题树立了史无前例的新模式。目前还不清楚这一协议所代表的商业机会,只有少数人期望这会给作者带来丰厚利润。谷歌也认为,没有必要期待图书扫描项目带来大利润。

谷歌共同创始人、技术总裁谢尔盖·米克哈伊洛维奇·布林说,“没有必要考虑我们是否能挣钱,我们只是认为这是我们核心使命中的一部分。当我在网上搜索时,书中激动人心的信息就在眼前。”

图书搜索项目的收入主要来自于扫描图书预读页面上的广告收入、图书馆和个人等进入谷歌数字化扫描图书馆的订金。在利润的分享上,谷歌得37%,其余63%归出版商和作者。

谷歌产品和知识产权副总顾问亚历山大·迈吉里弗雷说,即使谷歌陷入诉讼并赢得官司,它也只保留在网上预览图书内容的权利,“人们真正想做的事是读这本书”。

一次文化上的胜利

目前,用户已经享受到了在谷歌上阅读绝版图书的好处。对学者和其他研究人员来说,当维基百科不能满足他们的需求时,谷歌与出版商和作者达成的新协议让上百册书在他们的指尖游走。“美国许多小城镇中的学生们将通过他们的指尖获取大量信息。”斯坦福大学的图书员迈克尔·克勒说,“这是真正重要的。”

部分图书馆专家私下担心谷歌可能会向图书数据库的订户收取高额费用,因为在这个领域还没有出现私人竞争对手,2008年5月,微软公司停止了它的图书扫描项目,谷歌就成为这一领域的垄断者。

谷歌的首席法律官员大卫·多姆德表示,公司希望将图书数据库尽可能多地推向图书馆,而不是那些只付得起费用的图书馆。对于那些希望通过购买数字通道获得单本扫描图书的人,谷歌可能会以每本5.99美元或更低的价格出售其一半的图书。对大学里的学生和教师来说,如果他们购买了数据库,则可全文免费阅读所有图书。

(图)图书扫描机图书扫描机

美国出版商协会主席、数字媒体投资集团主席理查德·萨诺夫认为,从经济角度来说,游戏的规则并没有改变。

到目前为止,允许谷歌扫描其新出版图书的出版商只收到少量经济回报。麦克米伦公司拥有多家出版社和签约作者,它为谷歌提供了1.1万册图书供其搜索,公司估计,谷歌在2007年帮忙销售了大约1.6万册书。

作者则认为,谷歌的工作让读者们能够发现他们已经绝版的书是一次文化的胜利,其重要意义超过了经济收入。美国作者指南理事会成员詹姆士·葛雷易克说:“我们的文化不仅仅只是史蒂芬·金的最新小说或哈里波特的书,还有1000多册尘封的书没有出现在100多万购买哈里波特的人们面前,只有100多人知道它们。”

下一个战场

部分学者担心,谷歌的用户很可能只搜索狭窄的信息而不阅读长文。耶鲁大学的图书馆专家爱丽斯·普罗查斯卡说:“我不得不说,从教育和学术进步的角度考虑,我担心人们因此受鼓励以这种支离破碎的方式使用图书。”其他人则表示,读者会继续珍视长文的阅读,谷歌的图书搜索只是简单地帮助读者发现这些图书。

“欣赏简·奥斯汀是没有捷径的,希望我正在按这种方式做事。”密歇根大学图书馆馆长保罗·库朗特说,“现在的许多阅读都是在屏幕上进行的。这个协议重要的一点是,它将20世纪的文库以一种新形式展现,让21世纪的学生能够找到它们。”

(图)图书扫描流水线图书扫描流水线

《纽约时报》的文章指出,谷歌的图书搜索已经进入了大众文化领域。在一部名为《暮光》的电影中,一个十多岁的女孩迷上了吸血鬼,她开始在谷歌上搜索有关美洲印第安人部落的信息,这些搜索将她指向了一本书,她会做什么呢?她来到书店并买了这本书。

在解决了打造全球最大数字图书馆的最大障碍——版权问题后,谷歌如今面临的是如何应对欧洲数字图书馆。

2005年4月27日,由法国国家图书馆牵头的欧洲19所国家图书馆负责人在巴黎签字,并发表联合共建欧洲数字图书馆的声明,以对抗谷歌的“文化入侵”。截至目前,除了英国和葡萄牙之外,欧盟其他23个国家都宣布参与该数字图书馆的建设,据估计,欧洲数字图书馆将收录25亿册图书的内容,所需经费高达1125亿欧元。

谷歌图书扫描项目带来的另一个问题是,如果消费者可以通过谷歌图书搜索项目阅读或购买几乎所有的图书,那类似Kindle之类的电子书阅读器的前景将会怎样?(《科学时报》 (2009-2-5 A3 国际))

参考文献编辑本段回目录

→如果您认为本词条还有待完善,请 编辑词条

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

标签: Google图书扫描计划 图书扫描机

收藏到: Favorites  

同义词: 暂无同义词

关于本词条的评论 (共0条)发表评论>>

对词条发表评论

评论长度最大为200个字符。