互联网上除一般网页外,还如PDF,DOC,RTF,xls,PPT(S)等的文档文件,虽然这些文件不象 HTM文件那样多,但这些文件通常会包含一些别处没有的重要资料,因此具有独特的价值和吸引力!所以对网络中这部分资源的挖掘和利用也是搜索引擎的一个重要功能.对网络的这部分资源的挖掘和分析的水平也成了衡量一个搜索引擎完整与否,成熟与否的重要指标.多文档搜索是高级搜索的重要内容,与其他高级搜索功能一起,构成高级搜索功能体系.
我们就一些搜索案例的比较来给大家展示一些网络文档搜索的技巧,并对主要提供文档搜索的搜索引擎百度和google做一比较,这些比较和方法也许会对你进一步准确获得你想要的信息有帮助!
主要比较文档数量,语法使用的灵活性,准确性,多语法混合使用等等
数据 Query
|
参比引擎
|
百度 |
Google |
filetype:doc 搜索引擎 |
1050 |
743 |
filetype:doc 计算语言学 |
546 |
214 |
filetype:doc 计算机检索 |
17700 |
6080 |
filetype:ppt课件 |
13900 |
1480 |
filetype:ppt 软件开发模型
|
560 |
697 |
919000 |
697
|
filetype:pdf xml高级编程 |
55 |