IT学习者 | 文章大全 | 技术文档 | 桌面壁纸 | 实用查询 | 网络电台 | 成语 | 歇后语 | 网址 | 下载 | 周公解梦 | 生日密码 | 电视剧365 | Flash
 您现在的位置: IT学习者 >> 文章大全 >> IT业界 >> 搜索引擎行业新闻

Google:我的秘密

【 来源:计算机世界网消息  更新时间:2004-2-3 | 字体:
在“IBM中心高级研究研讨会”第十三届年会上发言时,Google公司的高级研究人员耐威尔-曼宁透露了Google公司的包括硬件投资较少在内的一些秘密。

  他说,廉价的硬件使得 每次查询能够使用更多的运算资源。软件和硬件之间的交易是,软件是为硬件出现故障而编写的,因此Google公司总是竭力保持硬件的简单。耐威尔-曼宁表示,我们希望利用商业性硬件强大的运算资源。

  Google公司“快速而廉价”的策略体现在它在全球部署的10000多台服务器上,它们每天能够在40亿个网页中执行2亿次查询。耐威尔-曼宁表示,通过使用商业性PC硬件,Google公司在其系统中构建了很高的冗余度,以弥补这样一个事实:Google每天的使用量相当于40机器年。他说,每台服务器有许多“同胞兄弟”,实现可伸缩性是必需的。

  通过保证许多不同层次和Google公司的数据中心使用的各种类型服务器之间的复制,Google公司弥补了它使用廉价硬件带来的问题。耐威尔-曼宁说,Google公司可以在全球部署许多完全相同的数据中心。

  由于一些服务器可以一周甚至更长的时间不连入网络,服务器的复制和维护可以慢慢作。Google公司还使用了一个监测系统监视计算机和应用软件,如果出现机器故障,管理人员就会立即清楚。耐威尔-曼宁说,由于系统使用了这种方式,如果计算机出现故障,也无需立即修理。通过这种慢节奏的方式,我们能够减少投资。

  尽管在车库运营的日子已经一去不复返了,Google公司仍然奉行“快速而廉价”的策略,从事其组织全球互联网信息的工作,使得这些信息能够被随处访问和对用户更有用。

  要求似乎很明朗,但在保持“快、好”的基础上保证搜索结果的相关性则仍然面临许多挑战。耐威尔-曼宁表示,对存储有超过3.9亿个图像的索引服务器进行升级是最耗费时间的任务,这也是该公司雇佣大量员工进行访问信息质量研究的原因所在。

  当一个查询进入Google后,它需要经过包括索引服务器和文档服务器在内的几个不同的服务器,所有这些服务器都有复制服务器。耐威尔-曼宁解释说,该系统基于用来搜索网站公共链接的算法。

  耐威尔-曼宁说,由于搜索结果的速度是用户关心的问题,随着时间的推移,使用搜索引擎的人们对搜索速度的预期越来越高。他表示,在Google中搜索的时间非常短,未来五年后搜索将越来越精确和越来越以用户为中心。
相 关 文 章
相 关 软 件

音乐
画心 放生 天亮了 牡丹江 那滋味 擦肩而过 放手去爱 北京欢迎你 依然在一起 吻得太逼真 牵手的右前方 坐上火车去拉萨 如果爱能早些说出来
心碎 稻香 从新爱 别碰我 魔杰座 红楼梦中 为你而活 一定要爱你 等爱的玫瑰 失落非主流 越单纯越幸福 最后一次的温柔 孤独的时候可以抱你
光荣 火花 下雨天 小酒窝 樱花草 为你写诗 无可取代 无情的温柔 寂寞才说爱 忘不掉的伤 爱上你是个错 陪你一起看草原 地球人都知道我爱你
假如 相思 女儿红 有缘人 舍不得 我的答铃 如何是好 外滩十八号 我们的纪念 摇滚怎么了 和寂寞说分手 爱上你是我的错 爱情里没有谁对谁错
加入收藏留言建议自助友情链接普通友情链接站长的Blog
版权所有   COPYRIGHT 2002-2008 ★IT学习者★ ALL RIGHTS RESERVED.