联系电话:18858105031
您当前的位置:杭州SEO中心 > SEO书籍 >

SEO书籍推荐:搜索引擎——原理、技术与系统(第一版)

关于一本介绍搜索引擎原理的书,市面上有很多都是老外写的,他们的分词系统都是针对英文的,并不太适合中文的搜索引擎,虽然有好大一部分都是通用的。
 
我在学习搜索引擎原理的时候,影响最大的一本书是,搜索引擎——原理、技术与系统,他是北大教授李晓明、闫鸿飞、王继民等着,这本书是我目前见过的,与现在主流的搜索引擎原理最接近的数,包括里面的中文分词算法等等,搜索引擎原理的书都比较难理解,如果你有,程序开发的基础那么可能会好一些,如果你有c语言的基础那就更加容易理解一些。
搜索引擎——原理、技术与系统(第一版)
这本书目前已经,到第二版了,第一版已经没有再印刷了,两个版本,我都有买了,我个人认为第一版本更加适合我们,第二个版本当中增加了很多关于云计算的,并且删减掉了第一版本当中的,一些我认为比较重要的内容,所以我推荐大家去看第一个版本,第二个版本增加的内容对我们来说不是特别实用,第一个版本如果买不到了,你可以选择电子书版本,只不过看起来可能会比较累一些,而且也不容易做笔记。

搜索引擎——原理、技术与系统图书目录
前言
第一章 引论
第一节 搜索引擎的概念
第二节 搜索引擎的发展历史
第三节 一些着名的搜索引擎
上篇 Web搜索引擎基本原理和技术
第二章 Web搜索引擎工作原理和体系结构
第一节 基本要求
第二节 网页搜集
第三节 预处理
第四节 查询服务
第五节 体系结构
第三章 Web信息的搜集
第一节  引言
一、超文本传输协议
二、一个小型搜索引擎系统
第二节 网页搜集
一、定义LJRL类和Page类
二、与服务器建立连接
三、发送请求和接收数据
四、网页信息存储的天网格式
第三节 多道搜集程序并行工作
一、多线程并发工作
二、控制对一个站点并发搜集线程的数目
第四节 如何避免网页的重复搜集
一、记录未访问、已访问IJRL和网页内容摘要信息
二、域名与IP的对应问题
第五节 如何首先搜集重要的网页
第六节 搜集信息的类型
第七节 本章小结
第四章 对搜集信息的预处理
第一节 信息预处理的系统结构-
第二节 索引网页库
第三节 中文自动分词
第四节 分析网页和建立倒排文件
第五节 本章 小结
第五章 信息查询服务
第一节 查询服务的系统结构
第二节 检索的定义
第三节 查询服务的实现
一、结果集合的形成
二、查询结果显示
第四节 本章 小结
中篇 对质量和性能的追求
第六章 可扩展搜集子系统
第一节 天网系统概述和集中式搜集系统结构
一、天网系统结构
二、集中式搜集系统
第二节 利用并行处理技术高效搜集网页的一种方案
一、节点间URL的划分策略
二、关于性能的讨论
三、性能测试和评价
四、系统的动态可配置性设计
第三节 本章小结
第七章 网页净化与消重
第一节 网页净化与元数据提取
一、引言
二、D0cview模型
三、网页的表示
四、提取Docview模型要素的方法
五、模型应用及实验研究
第二节 网页消重算法
一、消重算法
……
第八章 高性能检索子系统
第九章 用户行为的特征及缓存的应用
第十章 相关排序与系统质量评估
下篇 面向主题和个性化的Wed信息服务
第十一章 中文网页自动分类技术
第十二章 搜索引擎个性化查询服务
第十三章 面向主题的信息搜集与应用
参考文献
附录 术语
搜索引擎——原理、技术与系统下载

上一篇:没有了 下一篇:SEO书籍推荐:SEO实战密码(第2版)
如果您需要帮助,可以立即拨打我们的服务热线!
杭州SEO服务
售后服务
Totop