
什么是索引
我们在搜索引擎里输入一个关键词时,搜索引擎能在零点几秒钟就能从上万亿个页面中找出你想找的结果。当然搜索引擎不可能在这么短的时候内就能从上万亿个页面找查找一篇,然后挑出一部分结果展示出来。这背后隐藏着技巧就是索引。
一、什么是索引?
这个小标题其实是谷歌在招产品经理时提出来的一个问题,意思就是如何向从来不了搜索引擎的人解释索引。如果我们通过专业的知识去解释什么是搜索索引相信很多人都不能够去理解。
其实在日常生活们我们有很多地方都能见到索引,就像谷歌招产品经理那道题样的。方向正确的解释方式就是拿图书馆的索引卡做类比。每个网站就像图片馆里的一本书,我们不可能在图片馆的书架上一本一本地去找书,而是通过索引卡片去找到它的位置,然后直接上架拿书。
搜索引擎的索引原理其实与图书馆里的索引卡找书是一样的。
不过搜索引擎的索引需要通过非常复杂的布尔运算和各种权重算法综合在一起然后去检索进行进行排序,再建立索引。
搜索引擎的的索引是基本于数据库存存储的,数据库是可能查询语句SQL,支持各大种复杂的逻辑运算组合。
二、生活中觉的索引
书的目录、黄页大全、医院的指示牌、商场指示牌、小区平面试意图等等

三、建议网站索引文件
为了能让搜索引擎可以快速抓取网站的内容,我们可以为搜索引擎建立一些索引文件(搜索引擎服务商也非常希望网站主可以提交这些索引文件,特别是大站。这样的作法不是作弊的行为)。我们建立好这些文件后,可以给搜索引擎爬虫指引一个方向去抓取。
网站的索引有以下几种:
Sitemap.xml文件;
Sitemap.html文件;
新闻稿的入口