图书介绍
搜索引擎与信息获取技术【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

- 徐宝文,张卫丰著 著
- 出版社: 北京:清华大学出版社
- ISBN:7302061351
- 出版时间:2003
- 标注页数:266页
- 文件大小:12MB
- 文件页数:282页
- 主题词:
PDF下载
下载说明
搜索引擎与信息获取技术PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 概述1
1.1 引言1
1.2 信息获取与数据获取2
1.3 信息获取技术的发展3
1.4 信息获取基本概念4
1.5 信息获取系统的过去、现在和将来5
1.6 信息获取的过程6
1.7 本书的结构7
1.8 本章小结10
第2章 信息获取模型11
2.1 引言11
2.2 布尔模型11
2.3 向量模型12
2.4 概率论模型14
2.5 神经网络模型16
2.6 基于命题逻辑的模型及其应用18
2.6.1 基本概念不相交及其与向量模型的关系19
2.6.2 基本概念相交及其与布尔模型的关系21
2.7 本章小结23
第3章 标记语言与文本操作24
3.1 引言24
3.2 标记语言24
3.2.1 HTML语言25
3.2.2 XML语言26
3.3 文本预处理29
3.3.1 文本的词法分析30
3.3.2 中文分词技术31
3.3.4 词干提取技术32
3.3.3 无用词汇的删除32
3.3.5 索引词条的选择37
3.3.6 词典37
3.4 文档聚类38
3.5 文本压缩39
3.5.1 基本概念39
3.5.2 统计方法40
3.5.3 字典方法41
3.5.4 倒排文件压缩42
3.5.5 文本压缩方法比较44
3.6 本章小结45
第4章 索引和搜索46
4.1 引言46
4.2 倒排文件47
4.2.1 倒排文件的搜索48
4.2.2 倒排文件的构造49
4.3 后缀树与后缀数组50
4.4 布尔查询52
4.5 顺序查询53
4.6 结构化查询54
4.7 对压缩文本的搜索55
4.8 模式匹配56
4.8.1 容错匹配56
4.8.2 正规表达式和扩展模式56
4.8.3 利用索引进行模式匹配57
4.9 本章小结58
第5章 信息获取系统评价59
5.1 引言59
5.2 相关性60
5.3 召回率和精度61
5.3.1 召回率与精度的计算61
5.3.2 汇聚技术62
5.4 复合度量64
5.5 本章小结65
第6章 查询处理66
6.1 引言66
6.2 基于用户反馈信息的查询扩展66
6.2.1 向量模型的查询扩展和词条权重重新计算67
6.2.2 概率论模型中的词条权重重新计算69
6.3 自动局部分析71
6.3.1 通过局部聚集进行查询扩展71
6.3.1.1 关联聚集72
6.3.1.2 距离聚集73
6.3.1.3 标量聚集74
6.3.1.4 搜索表达式的改变75
6.3.2 通过局部上下文分析进行查询扩展76
6.4 自动全局分析78
6.4.1 基于相似词典的查询扩展78
6.4.2 基于统计词典的查询扩展80
6.5 本章小结82
第7章 目录式检索服务与聚类分析83
7.1 引言83
7.2 目录检索服务的构成84
7.2.1 网页采集过程84
7.2.2 网页分类方法85
7.3.1.1 相似度86
7.3.1 文档关联度的衡量86
7.3 聚类过程86
7.3.1.2 相异度87
7.3.2 文档聚类88
7.3.2.1 基于相似度的分类过程88
7.3.2.2 基于相异度的分类过程92
7.4 基于聚类的信息获取94
7.5 本章小结94
第8章 基于因特网的搜索引擎95
8.1 引言95
8.2 基于因特网的搜索引擎的构成97
8.3 搜索引擎的主要指标及其分析98
8.3.1 搜索引擎的精度99
8.3.2 搜索引擎受欢迎的程度100
8.3.3 搜索引擎相关性考虑101
8.4 搜索引擎的数据结构102
8.4.1 Bigfile文件系统103
8.4.2 信息库103
8.4.3 文本索引104
8.4.4 词典104
8.4.5 采样表104
8.4.6 前向索引105
8.4.7 后向索引106
8.5 网页的获取107
8.6 建立索引的方法和过程108
8.6.1 搜索引擎建立索引的方法108
8.6.2 索引的过程111
8.7 搜索过程112
8.8 搜索结果排序方法112
8.9 搜索引擎的发展趋势116
8.10 本章小结118
第9章 元搜索引擎120
9.1 引言120
9.2 基本构成120
9.3 元搜索引擎分类122
9.4 与独立搜索引擎的比较124
9.5 主要指标及其分析126
9.6 元搜索引擎面临的问题、对策和发展趋势129
9.6.1 查询预处理131
9.6.2 搜索结果集成132
9.7 元搜索引擎调度策略研究134
9.7.1 GSE基本思想134
9.7.2 遗传算法在元搜索引擎调度中的应用135
9.7.2.1 编码方法136
9.7.2.2 适应函数和选择137
9.7.2.3 初始化种群139
9.7.2.4 重组139
9.7.2.5 变异140
9.7.3 GSE中的智能调度器141
9.7.4 实验——自适应过程运行周期的确定142
9.8 文档选择143
9.8.1 用户决定法145
9.8.2 权重分配法145
9.8.3 基于学习的方法146
9.8.4 确保取回法147
9.9 结果归并150
9.9.1 基本定义150
9.9.2.1 几种常用元搜索引擎结果集成方法及其存在问题152
9.9.2 元搜索引擎结果集成方法152
9.9.2.2 摘要排序法153
9.9.2.3 位置排序法154
9.9.2.4 摘要/位置排序法155
9.9.3 搜索结果集成技术比较155
9.9.4 实验分析157
9.9.5 元搜索引擎搜索结果集成技术展望158
9.10 元搜索引擎可扩展性159
9.10.1 XML与XSL语言160
9.10.2 可扩展元搜索引擎的基本结构161
9.10.3 元查询映射163
9.10.4 结果归并166
9.10.5 搜索引擎接入元搜索引擎的过程171
9.11 本章小结172
10.1 利用代理个性化搜索结果173
第10章 基于客户端的个性化应用研究173
10.1.1 用户兴趣模型174
10.1.1.1 个性化信息抽取与兴趣生成树174
10.1.1.2 词干抽取与信息预处理176
10.1.1.3 用户个人兴趣模型177
10.1.1.4 共同兴趣模型178
10.1.2 个性化搜索代理系统PSA180
10.1.2.1 用户个人兴趣代理180
10.1.2.2 共同兴趣代理181
10.1.2.3 利用兴趣剖像过滤搜索结果182
10.1.3 工作流程182
10.1.4 性能分析183
10.2 数据挖掘技术在Web预取中的应用研究184
10.2.1 简化WWW数据模型185
10.2.2 兴趣关联知识库与用户行为预测187
10.2.3 数据挖掘技术190
10.2.4 基于代理的Web预取技术193
10.2.5 实例研究195
10.3 本章小结196
第11章 基于服务器端的个性化应用研究198
11.1 引言198
11.2 带反馈自适应搜索引擎系统199
11.3 数据采集与反馈信息库的生成200
11.3.1 数据采集200
11.3.2 反馈信息库的生成及其算法202
11.4 反馈响应过程205
11.5.1 一个实验性带反馈自适应搜索引擎ASE207
11.5 自适应搜索引擎系统原型设计与实验207
11.5.2 实验208
11.6 本章小结211
第12章 搜索引擎策略——站点角度212
12.1 引言212
12.2 提高网站在搜索引擎中的排名位置的方法213
12.2.1 了解不同的搜索引擎213
12.2.2 关键词的选择214
12.2.3 标题217
12.2.4 Meta值的使用217
12.2.5 提升自己网站排名的技巧220
12.2.5.1 隐藏的表单input220
12.3 如何提交自己的网站221
12.3.1 提交工具221
12.2.5.2 不可见关键词堆砌221
12.3.2 如何跟踪222
12.4 阻止网络检索器索引网页222
12.4.1 阻止网络检索器的方法223
12.4.2 文件Robots.txt的格式224
12.4.3 Robots.txt使用实例分析225
12.5 本章小结226
第13章 搜索引擎策略——用户角度227
13.1 引言227
13.2 数学命令在搜索中应用229
13.2.1 查询条件具体化229
13.2.2 使用加号+229
13.2.3 使用减号-230
13.2.4 使用引号“”230
13.2.5 组合符号231
13.3 增强的搜索命令232
13.3.1 搜索标题232
13.3.2 搜索网站233
13.3.3 百搭命令(?)233
13.4 搜索引擎的辅助功能234
13.4.1 相关搜索234
13.4.2 搜索结果重组237
13.4.3 相近搜索239
13.4.4 延伸搜索条件241
13.5 搜索引擎功能特点分析图表242
13.6 本章小结245
附录1 搜索引擎导航246
附录2 术语250
参考文献252
热门推荐
- 1256065.html
- 2185484.html
- 1201567.html
- 1381971.html
- 1801478.html
- 894396.html
- 3768410.html
- 3591944.html
- 124500.html
- 3220408.html
- http://www.ickdjs.cc/book_2798966.html
- http://www.ickdjs.cc/book_2093390.html
- http://www.ickdjs.cc/book_822577.html
- http://www.ickdjs.cc/book_200286.html
- http://www.ickdjs.cc/book_3281419.html
- http://www.ickdjs.cc/book_445757.html
- http://www.ickdjs.cc/book_488499.html
- http://www.ickdjs.cc/book_2245057.html
- http://www.ickdjs.cc/book_3001857.html
- http://www.ickdjs.cc/book_3523358.html