数据是下一个Intel Inside

2012-02-06 11:42 来源: 卓杰科技 [大中小]

现在每一个重要的互联网应用程序都由一个专门的数据库驱动：Google的网络爬虫, Yahoo!的目录（和网络爬虫），Amazon的产品数据库，eBay的产品数据库和销售商，MapQuest的地图数据库，Napster的分布式歌曲库。正如哈尔·瓦里安（Hal Varian）在去年的私人对话中谈到的，“SQL是新的HTML”。数据库管理是Web 2.0公司的核心竞争力，其重要性使得我们有时候称这些程序为“讯件”（infoware）而不仅仅是软件。　　该事实也引出了一个关键问题：谁拥有数据？　　在互联网时代，我们可能已经见到了这样一些案例，其中对数据库的掌控导致了对市场的支配和巨大的经济回报。当初由美国政府的法令授权给Network Solutions公司（后被Verisign公司收购）的对域名注册的垄断，曾经是互联网上的第一个摇钱树。虽然我们在争论通过控制软件的API来形成商业优势在互联网时代会变得困难得多，但是对关键数据资源的控制则不同，特别是当要创建这些数据资源非常昂贵，或者经由网络效应容易增加回报的时候。　　注意一下由MapQuest, maps.yahoo.com，maps.msn.com，或者maps.google.com等网站提供的每张地图下面的版权声明，你会发现这样一行字“地图版权NavTeq，TeleAtlas”，或者如果使用的是新的卫星图像服务，则会看到“图像版权Digital Globe”的字样。这些公司对其数据库进行了大量的投资。（仅NavTeq一家，就公布投资7.5亿美元用于创建其街道地址和路线数据库。Digital Globe则投资5亿美元来启动其自有卫星，来对政府提供的图像进行改进。）NavTeq竟然已做了很多模仿Intel的耳熟能详的Intel Inside标识的事：例如带有导航系统的汽车就带有“NavTeq Onboard”的印记。数据是许多此类程序事实上的Intel Inside，是一些系统的唯一的信息源组件，这些系统的软件体系多数是开放源码的，也有商业化的。　　当前竞争火热的网络地图（web mapping）领域显示着，对拥有软件核心数据的重要性的疏忽大意，将最终削弱其竞争地位。MapQuest在1995年率先进入地图领域，随后是Yahoo!，再后来是Microsoft，而最近Google也决定挺进这一市场，他们可以轻松地通过对同一数据的授权来提供一个具有竞争力的程序。　　然而，作为对比的是Amazon.com的竞争地位。像Barnesandnoble.com这样的竞争者一样，其原始数据库来自于ISBN注册商.R. Bowker。但是同MapQuest不同，Amazon大力增强其数据，增加出版商提供的数据，例如封面图片，目录，索引，和样张材料。更重要的是，他们利用了其用户来评注数据，以至于十年之后，是Amazon而不是Bowker，成为图书文献信息的主要来源，一个学者、图书管理员和消费者的参考书目来源。Amazon还引入了其专有的标识符，即ASIN，该标识符在ISBN存在时与之对应，而当产品不带有ISBN时，就创建出一个等价的命名空间。Amazon从而有效地“吸收和拓展了”其数据提供商。　　设想如果MapQuest也已做了同样的事情，利用他们的用户来评注地图和路线，添加新的价值层面。那么对仅仅通过授权使用基础数据来进入这一市场的其他竞争者，将造成远远大得多的困难。　　近期Google地图的引入，为应用程序销售商和其数据提供商之间的竞争，提供了一个活生生的实验室。Google的轻量型编程模型已经引发了不计其数的增值服务的出现，这些服务以数据混合的方式，将Google的地图同其他可以通过互联网访问的数据源相结合。保罗·拉特马赫（Paul Rademacher）的housingmaps.com是这种混合的一个上佳范例，其网站将Google的地图同Craigslist的公寓出租，以及住宅购买数据相结合，来创建一种交互式的房屋搜索工具。　　目前，这些混合大多是由程序高手们实现的创新性的实验产品。但是企业行动将紧随其后。并且，人们已经可以从至少一类开发者中发现这一点。Google已经将数据源提供者的角色从Navteq那里夺走，并且将自己定位为一个令人喜爱的中介者。在以后几年里，我们将会看到数据提供商和程序销售商之间的斗争，因为两大阵营都认识到了，特定的数据类别在作为搭建Web 2.0程序的积木时是多么的重要。　　这场竞赛已经涉及到拥有特定类别的核心数据：位置、身份、公共事件日历、产品标识和命名空间等。在许多情况下，在那些创建数据需要巨额成本的地方，也可能存在一种如同Intel Inside方式一样凭借单一数据源来所有作为的机遇。其他情况下，胜者将是那些通过用户聚合来达到临界规模，并且将聚合的数据融入系统服务中的公司。　　比如，在身份标识领域，PayPal，Amazon的一键式，以及拥有数百万用户的交流系统，都有可能成为创建整个网络范围的身份标识数据库的正当竞争者。（关于此，Google最近使用手机号码作为Gmail账号标识的尝试，可能就是朝借鉴和拓展电话系统所迈出的一步。）同时，像Sxip这样的创业公司，正在探索联合身份标识的可能性，以寻求一种“分布一键式”，从而提供一个无缝的Web 2.0标识子系统。在日历领域，EVDB则是通过维基式参与体系来搭建世界上最大的共享日历的一种尝试。虽然评判者尚在观望着任何一个特定创业公司或方式的成功是否，但很显然，这些领域的标准和解决方案，有效地将某些数据转变为“互联网操作系统”（internet operating system）的可靠的子系统，并将促成下一代的应用程序。　　关于数据，必须注意一个进一步的方面，那就是用户关心其隐私和对自己的数据的权限。在许多早期的网络程序中，版权只被松散地执行。例如，Amazon宣称对任何提交到其网站的评论的所有权，但却缺少强制性，人们可以将同样的评论转贴到其他任何地方。然而，随着很多公司开始认识到，对数据的掌控有可能成为他们首要的竞争优势来源，我们将会看到在此类控制方面强度更大的尝试。　　正如专有软件的增长而导致自由软件运动一样，在下一个10年中我们会看到专有数据库的增长将导致自由数据运动。在像维基百科全书这样的开放数据项目、创作共用（Creative Commons）、以及像Greasemonkey（让用户决定如何在其计算机上显示数据）这样的软件项目中，我们可以看到这种对抗势头的前兆。　　一些系统被设计为鼓励参与。在丹·布莱克林（Dan Bricklin）的论文“共用的丰饶”（The Cornucopia of the Commons）中，他指出有三种创建大型数据库的方式。第一种，已经由Yahoo!来体现了，就是付费给人们来实现。第二种，由开放源码社区的经验启发而来，就是让志愿者来完成同样的任务。开放目录项目（Open Directory Project），一个Yahoo的开放源码竞争者，就是该方式的产物。但是Napster体现了第三种方式。因为Napster将其默认设置为自动为任何已经下载的音乐服务，任何用户都自动地帮助建立共享数据库的价值。同样的方式已经被其他所有P2P文件共享服务所采用。Web 2.0时代的一个关键经验在于：用户增加价值。但是只有很小一部分用户会有意来为你的程序增加价值，而不怕麻烦。因而，Web 2.0公司均进行了这样的默认设置，即作为程序通常使用方式的副产品，来聚合用户数据并创造价值。正如上面所指出的，他们在搭建那种用户越多则效果越好的系统。　　米切尔·卡普尔（Mitch Kapor）曾经指出“体系是策略”。参与是Napster的本质，其根本体系的一部分。　　同更经常被引用的所谓“吸引志愿精神”的原因相比，这种体系结构上的洞察力可能更能抓住对开放源码软件成功的本质。互联网、万维网（World Wide Web）、以及像Linux、Apache和Perl这样的开放源码软件项目的体系结构，均是这样一种设计，使得作为一种自动产生的副产品，谋求其自身利益的用户们创建着集体的价值。这些项目中的任何一个都有一个很小的核心、一种设计良好的扩展机制、和一种让任何人来添加任何合乎规定的组件的方式，不断增长着被Perl语言的创始人拉里·沃尔（Larry Wall）称为“洋葱头”（the onion）的外部层面。换句话说，这些技术通过他们本来的设计方式，体现着网络的效应。

本页关键词：

上一篇：软件发布周期的终结下一篇：博客和大众智慧

您现在的位置： 首页 > 新闻中心 > 网页设计 > 详细内容

数据是下一个Intel Inside

您现在的位置：首页 > 新闻中心 > 网页设计 > 详细内容