日志标签 ‘搜索引擎的基本工作原理’

搜索引擎的基本工作原理(图解)

2009年12月23日

现在互联网上存在的网页数量是数以百亿千亿计的,这些网站存储在不同的服务器上,
分布在世界各地的数据中心和机房。
对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据
来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。一方面原因是
抓取技术存在瓶颈,无法[......]

继续阅读