(一)规则 1、Google不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。 2、Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。 3、Google的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。 4、Google对一些网络上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“+”。 5、Google在搜索中的所有符号(+ - "" :等)都必须是英文字符 6、Google会忽略掉检索词之间的大多数标点符号,但有两种情况例外!单引号和连字符,它们不能被省略,当输入了带有连字符的检索词后!即可检索带有连字符的检索词!也可检索不带连字符的检索词!因此如果不能肯定使用的词是否带有连字符!则应该总是使用连字符" 7、Google 首先匹配按检索式相同词序含有这些检索词的网页!所以应该按照检索词在句子中出现的词序输入检索词,Google 还优先匹配检索词相互邻接的网页 (二)语法:+、-、OR、filetype 1、Google无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。 2、Google用减号“-”表示逻辑“非”操作。 示例:搜索所有包含“专题讲座”而不含“计算机”的中文网页 搜索式:专题讲座 -计算机 3、Google用大写的“OR”表示逻辑“或”操作 注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询)。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果 4、搜索某一类型文件,可用“filetype”来搜索。 示例:搜索文献综述的PDF文件 搜索式:文献综述 filetype:pdf (三)高级搜索语法:site,link,inurl,allinurl,intitle,allintitle 1、site:表示搜索结果局限于某个具体网站或者网站频道(如 site:sina.com),或者是某个域名(如site:com)。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”(如 site:-com)。 示例:搜索中文教育科研网站(edu.cn)上所有包含“文献综述”的页面。 搜索式:"文献综述 site:edu.cn" 注意:冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“文献综述 site:edu.sina.com.cn/1/”的语法是错误的。 2、link:搜索所有链接到某个URL地址的网页。 示例:搜索所有含指向华军软件园“http://www.newhua.com”链接的网页。 搜索式:"link:http://www.newhua.com" 注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被Google忽略 3、inurl:返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。 示例:查找MIDI曲“沧海一声笑”。 搜索式:"inurl:midi 沧海一声笑" 注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。Google对“cgi-bin/phf”中的“/”当成空格处理。 4、allinurl:返回的网页链接中包含所有查询关键字,这个查询的对象只集中于网页的链接字符串。 示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。 搜索式:“allinurl:“cgi-bin“ phf +com” 5、allintitle、intitle:用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。 示例:苏东坡作品集 搜索式:"intitle : 苏东坡作品" (四)Google的罕用高级搜索语法:related,cache,info 1、related:用来搜索结构内容方面相似的网页。 示例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等) 搜索式:"related:http://www.sina.com.cn/index.shtml" 2、cache:用来搜索Google服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。 3、info:用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。 示例:查找和新浪首页相关的一些资讯。 搜索式:"info:http://www.sina.com.cn" (五)google查询外文期刊PDF技巧 当给goole输入要查的关键词时,会出现海量的资料,大部分是没用的,如果查找具体的文章,跟着再输入"pdf",但一般情况下还是多的没法看完。如果用"pii"代替“pdf",得到了理想的效果,查到的基本都是期刊文献,”pii"是期刊文献编号。 示例: 搜Camellia 搜索式:Camellia pii(代替Camellia PDF) (六)Google 给信息安全带来的隐患 Google 的强大检索功能给我们带来方便的同时,也给网络安全带来了极大的隐患—Google Hacking,它利用Google 的搜索引擎快速查找存在脆弱性的主机以及包含敏感数据的信息。利用Google 超强的搜索能力,即使是一个初等的黑客也可以轻易获取安装了后门或有漏洞的主机、INC 文件、用户名和密码等敏感信息。 要防范Google Hacking,我们只需要在所要保护的网页中加入以下代码便可以达到目的: <META. NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <META. NAME="ROBOTS" CONTENT="NOSNIPPET"> 以上代码的含义是阻止把本页面的特定内容和U R L连接记录到搜索引擎数据库中。不过,加入代码后,站点的信息不会马上在搜索引擎的数据库中消失,数据更新需要一个月的周期。另外,我们可以在服务器上安装过滤工具,如在IIS 服务上加载urlscan。还可以利用相关工具在互联网上进行搜索,如果发现站点的有关信息被滥用,就通过http://www .google.com /remove.html提交希望删除的信息。同样地Google 的更新也需要一段时间。 (七)查找软件注册码 goolge 或baidu 输入: 94fbr 软件名称 例如:94fbr XX软件 原理:94fbr 是 微软winxp 的注册码中的一项,凡是有注册码的网页都会有winxp的注册码,你要找的软件注册码一般也会在里面! (八)快速获取代理服务器 在搜索栏输入 +":8080" +":80" +":3128" ,回车后,就能得到很多端口为8080、80、3128的代理服务器名称。
特殊操作符 | 语法说明 | 语法规则 | 注意事项 | 用法举例 | site | 搜索结果局限于某个具体网站或者网站频道。 | site频道名.网站名.域名 如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。
| 网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。 | 搜索包含“LED盘”的中文网站页面,搜索: LED盘 site:ledpan.com
|
|