移动搜索引擎原理与实践 电子书下载 PDF下载

移动搜索引擎原理与实践
内容简介
《移动搜索引擎原理与实践》对从事移动搜索引擎研发所需技术进行了全面介绍,内容涵盖广泛,面向实战,将技术与市场紧密结合,对移动通信技术、搜索引擎技术、3G技术、WAP及短消息技术、数据挖掘技术、并行计算技术进行了详细的介绍。
  《移动搜索引擎原理与实践》可作为从事移动搜索技术研究、设计和开发的科技人员的重要参考书,也可作为从事移动搜索技术研究的学者及研究生的参考书籍。 ·查看全部>>
目录
出版说明
前言
第1章 移动搜索引擎概述
1.1 引言
1.2 移动搜索引擎的特点
1.3 移动搜索引擎的分类
1.4 移动搜索引擎市场现状
1.5 移动搜索引擎的关键技术简介
1.6 移动搜索与3G
1.7 小结

第2章 移动通信技术概述
2.1 移动通信的分类
2.2 全球移动通信(GSM)网络
2.2.1 移动台(MS)
2.2.2 基站子系统(BSS)
2.2.3 网络子系统(NSS)
2.2.4 操作支持子系统(OSS)
2.2.5 移动搜索引擎与GSM网络
2.3 GSM的升级GPRS
2.3.1 GPRS的特点
2.3.2 GPRS的工作原理
2.3.3 GPRS的网络结构和网元功能
2.3.4 GPRS各个接口协议栈的功能
2.4 CDMA(CodeDivisionMultipleAccess)
2.4.1 CDMA技术的标准化
2.4.2 CDMA的优势
2.5 短信方式下的移动搜索引擎协议
2.5.1 SMS(ShortMessagingService)
2.5.2 EMS(EnhancedMessagingService)
2.5.3 MMS(MultimediaMessageService)
2.5.4 SMS、EMS、MMS三者技术对比
2.6 WAP
2.6.1 WAP的特点
2.6.2 WAP的优势及局限性
2.6.3 WAP的发展前景
2.7 CMWAP和CMNET
2.7.1 CMWAP与CMNET的区别
2.7.2 CMWAP与CMNET服务适用范围
2.8 小结

第3章 网页抓取技术
3.1 基于WAP的搜索引擎系统结构
3.2 WAP爬虫基本原理
3.2.1 网页抓取
3.2.2 内容提取
3.2.3 爬虫的难题
3.2.4 爬虫更新周期
3.3 WAP爬虫的关键技术
3.3.1 从种子站点开始逐层抓取(逐层抓取策略)
3.3.2 不重复抓取策略
3.3.3 网页抓取优先策略
3.3.4 网页重访策略
3.3.5 Robots协议
3.3.6 抓取提速策略
3.4 构建垂直搜索引擎
3.4.1 小天音乐垂直搜索引擎整体处理流程
3.4.2 小天音乐垂直搜索引擎服务器部分源代码
3.5 小结

第4章 网页信息预处理
4.1 结构化的数据和半结构化的数据
4.1.1 XML——最常见的结构化数据
4.1.2 半结构化的数据
4.2 网页信息结构化
4.2.1 网页信息结构化的基本流程
4.2.2 建立DOM树的原理
4.2.3 移动网页的信息结构化
4.3 中文分词
4.3.1 中文分词的概念
4.3.2 中文分词的难点
4.3.3 基于字典的分词方法
4.3.4 用统计学的方法解决新词识别问题
4.3.5 主流中文搜索引擎分词效果比较
4.3.6 典型的中文分词系统
4.4 小结

第5章 建立索引和实现查询
5.1 搜索引擎中的索引简介
5.1.1 基于索引的搜索引擎分类
5.1.2 索引器在搜索引擎中的作用
5.2 建立索引
5.2.1 倒排文件索引(InvertedFileIndex)的建立
5.2.2 后缀数组
5.2.3 签名文件索引(SigamtureFileIndex)
5.3 查询服务
5.3.1 查询器的实现原理
5.3.2 查询器的分页机制
5.3.3 查询扩展与结果集的动态分类
5.4 查询结果排序
5.4.1 PageRaNk算法
5.4.2 HillT0p算法
5.4.3 提升网页排序的方法
5.5 索引设计的典型案例
5.6 小结

第6章 WML转换
6.1 标记语言简介
6.1.1 HTML
6.1.2 XML
6.1 -3XHTML
6.1.4 WML
6.2 WAJP体系与结构
6.2.1 WAP体系结构
6.2.2 万维网模型
6.2.3 WAP模型
6.3 HTML到WML的转换
6.3.1 标记语言转换概述
6.3.2 HTML与WML的主要语法标记
6.3.3 HTML与WMHL的文档结构对比
6.3.4 HTML与WML的转换
6.3.5 正则表达式和Java开源项目
6.4 衡量搜索引擎性能
6.4.1 衡量搜索引擎的性能指标
6.4.2 搜索引擎的评价方式
6.5 小结

第7章 基于短信的移动搜索引擎
7.1 概述
7.2 互联网和短信并存的效应
7.3 短信平台
7.4 短信接入
7.4.1 协议规范
7.4.2 协议流程
7.4.3 接口更改
7.4.4 接口开发
7.5 短信搜索的功能设计
7.5.1 功能组织结构
7.5.2 短信监控功能设计
7.5.3 短信监控的数据库设计
7.5.4 分发平台功能设计
7.5.5 处理模块功能设计
7.6 小结

第8章 并行技术在移动搜索中的应用
8.1 并行计算
8.1.1 并行计算的概念
8.1.2 并行计算的发展
8.2 MPI简述
8.2.1 MPI的产生
8.2.2 MPI的语言绑定
8.2.3 目前主要的MPI实现
8.2.4 MPI程序结构
8.3 并行计算技术在移动搜索引擎中的应用
8.4 并行计算技术在索引/排序部分的应用
8.5 并行计算技术在移动搜索部分的应用
……
第9章 3G时代的移动搜索引擎展望
第10章 数据挖掘技术在移动搜索引擎中的应用
参考文献
Copyright © 2024 by topbester.com.
All Rights Reserved.
沪ICP备14027842号-1