搜索引擎原理与实践 电子书下载 PDF下载

搜索引擎原理与实践
内容简介
随着搜索引擎技术的发展和不断完善,越来越多的人开始对搜索引擎原理和技术进行研究,越来越多的人喜欢上了搜索引擎。
  本书从教学的角度出发,全面地阐述了搜索引擎的原理和实践,包括搜索引擎的基本原理与技术、搜索引擎的数据结柳搜索引擎的爬虫、多媒体信息检索技术以及搜索引擎开发技术。
  本书适合高等院校计算机科学与技术专业及相关专业的高年级学生和研究生阅读参考,也适合相关领域的工程技术人员参阅。 ·查看全部>>
目录
第1章 搜索引擎概述
1.1 搜索引擎的概念
1.2 搜索引擎的历史
1.3 搜索引擎的分类
1.4 搜索引擎的关键技术
1.5 当代主要搜索引擎介绍
1.5.1 谷歌搜索
1.5.2 雅虎搜索
1.5.3 百度搜索
1.5.4 北大天网搜索
1.6 搜索引擎的发展
1.7 小结
思考题

第2章 搜索引擎的体系结构和工作原理
2.1 搜索引擎的体系结构
2.1.1 搜索器
2.1.2 索引器
2.1.3 检索器
2.1.4 用户接口
2.2 搜索引擎的工作原理
2.2.1 网页搜集
2.2.2 网页处理
2.2.3 查询服务
2.3 元搜索引擎
2.3.1 元搜索引擎的基本构成
2.3.2 元搜索引擎的分类
2.3.3 常用元搜索引擎介绍
2.3.4 元搜索引擎的特点
2.3.5 主要技术指标
2.4 小结
思考题

第3章 信息处理技术
3.1 检索模型
3.1.1 经典模型
3.1.2 代数模型
3.2 文本处理
3.2.1 词法分析
3.2.2 分词技术
3.2.3 无用词汇删除
3.2.4 词干提取
3.2.5 索引词选择
3.2.6 词典
3.3 文本压缩
3.3.1 基本概念
3.3.2 统计方法
3.3.3 字典方法
3.3.4 倒排文档压缩
3.4 Web信息处理
3.4.1 Web信息的特点
3.4.2 Web信息的表现方式
3.4.3 Web信息系统结构
3.5 小结
思考题

第4章 信息检索技术
4.1 顺排检索
4.1.1 表展开法
4.1.2 逻辑树展开法
4.1.3 BF算法
4.1.4 KMP算法
4.1.5 BM算法
4.2 倒排检索
4.2.1 倒排检索
4.2.2 倒排文档
4.2.3 逆波兰表达式
4.2.4 检索指令表的生成
4.2.5 检索实施
4.3 其他检索方法
4.3.1 布尔检索
4.3.2 后缀树和后缀数组
4.3.3 加权检索
4.3.4 全文检索
4.3.5 超文本检索
4.4 web信息检索
4.4.1 网页的搜集
4.4.2 网页的预处理
4.4.3 网页索引的建立
4.4.4 相似度计算与排序方法
4.5 小结
思考题

第5章 信息检索评价
5.1 相关性
5.1.1 相关性的特征
5.1.2 相关性类别
5.1.3 相关性模型
5.2 性能评价指标
5.2.1 有效性
5.2.2 查全率和查准率
5.2.3 其他指标
5.3 相关组织和会议
5.4 小结
思考题

第6章 网络搜索引擎技术
6.1 搜索引擎的基本结构
6.1.1 搜索引擎的结构分类
6.1.2 网页收集模块
6.1.3 网页索引模块
6.1.4 查询模块
6.1.5 用户界面
6.1.6 搜索引擎的主要指标及分析
6.2 搜索引擎的数据结构
6.2.1 存储结构
6.2.2 信息库
6.2.3 文本索引
6.2.4 词典
6.2.5 采样表
6.2.6 前向索引
6.2.7 后向索引
6.3 搜索引擎爬虫
6.3.1 网络爬虫
6.3.2 深度优先策略
6.3.3 广度优先策略
6.3.4 不重复抓取策略
6.3.5 网页抓取优先策略
6.3.6 网页重访策略
6.3.7 网页抓取提速策略
6.3.8 Robots协议
6.3.9 网页内容提取技术
6.4 小结
思考题

第7章 多媒体检索概述
7.1 多媒体信息
7.1.1 多媒体及多媒体技术
7.1.2 音频信息
7.1.3 图形与图像信息
7.1.4 视频信息
7.2 多媒体的基本概念
7.2.1 多媒体技术的特点
7.2.2 多媒体信息系统
7.2.3 多媒体数据库
7.2.4 多媒体信息检索
7.3 多媒体数据压缩
7.3.1 多媒体压缩原理
7.3.2 多媒体压缩编码
7.4 多媒体内容的理解
7.4.1 图像分割
7.4.2 特征提取
7.4.3 分类
7.5 多媒体信息检索的关键技术
7.5.1 信息模型和表示
……
第8章 基于内容的多媒体信息检索技术
第9章 搜索引擎开发技术
参考文献
Copyright © 2024 by topbester.com.
All Rights Reserved.
沪ICP备14027842号-1