本文旨在教会你如何使用搜索引擎快速找到你需要的信息。本质是使用搜索引擎的高级语法实现。

引出问题
毫无疑问,在这个时代,你基本上可以获取到你想要知道的所有信息;但是你还得承认另一点,那就是网上绝大部分信息是对你无用的;并且通常情况下,这些无用的信息更加有迷惑性,有些信息甚至比你需要的信息更加有吸引力。下面是搜索引擎的搜索质量对比:
百度搜索
百度搜索结果

bing搜索
bing搜索结果

google
google搜索结果

基本建议

很显然百度的搜索质量是最低的,所以你应该尽可能不用百度搜索(顺便一提,360搜索也是屎)。在你有条件的情况下你可以使用Google,它收录的条目最多资源最全,如果你无法魔法上网你可以选择bing搜索。当然这样的搜索引擎大部分都是会收集你的隐私的。如果你想不跟踪,那你可以选择duckduckgo,当然它也是需要魔法上网的,国内可以使用秘迹搜索(不过国内的隐私搜索大多活不久,原因有很多,你能想到原因的基本上都是对的)。最后,微信也是可以搜索的,你也可以使用微信搜索。
加入你不会魔法而其他的搜索引擎都无法找到你要的信息的话,你就可以试试百度了。当然,你依然可以通过一些方法提高搜索质量。

高级搜索

  • 1.限定信息的来源网站(关键字 site:网址)
    信息都是通过爬虫从其他网站上爬过来的,site语法可以限制来自特定网站搜索结果。例如:ocr开源 site:github.com
    site效果
  • 2.全限定关键词("关键字")
    我们的搜索关键字默认是会进行分词的,假如你需要完全的限定关键字则需要使用英文引号。例如:"ocr开源"
    "语法效果
  • 3.不包括关键字(要搜索的关键字 -要剔除关键字)
    比如我们在搜索A的时候不希望结果带B,就可以使用-(减号)语法剔除。例如:ocr开源 -阿里云
    -语法结果
  • 4.同时满足与只需满足一个(关键字1 AND 关键字2 、关键字1 OR 关键字2)
    AND会筛选出同时满足关键字条件的结果。例如:ocr开源 AND 阿里云
    AND运算

OR会筛选出满足其中一个条件的结果。例如:ocr开源 OR 阿里云
OR运算

注:AND和空格等价,OR与 | 等价;这里与和或运算都有了,实际上 - 就表示非运算。

  • 5.限定文件类型(关键字 filetype:文件扩展名)
    目前似乎只能筛选出文档,对寻找文档的时候很有帮助。例如:ocr开源 filetype:pdf
    filetype结果

注:如果你要找专业论文或者学术相关的,建议直接知网,谷歌学术。

  • 6.限定关键字位置(位置: 关键字)
    有以下几个位置:网页标题(allintitle:)、网页内容(allintext:)、网址(allinurl:)、锚(这是个术语对普通人没什么用。allinanchor:)。例如:allintitle: ocr开源
    位置结果

注:上面的是全匹配策略,allintitle: 后面跟的所有的关键字都会出现在标题里。这些语法还有一个非全限定版本:比如: intitle:ocr开源 只表示intitle:后面的ocr开源关键字需要在标题。intitle:、intext:、inurl:、inanchor:。

  • 7.数字区间(关键字 数字1..数字2 单位)
    这个技巧并不好用,它不太严格。例如:ocr 2020..2021 年
    ..运算
  • 8.定义搜索(define:名词)
    在你查一个名词的定义的时候很有用。也就是可以查百科。例如:define:ocr
    define:结果
  • 9.股票搜索(stocks:公司)
    搜索股票信息且相关的财经信息也会被搜索出来。例如:stocks:google
    stocks
  • 10.天气搜索(weather:城市)
    搜索一个地区的天气状况且相关的天气信息也会搜索出来。
    weather
  • 11.ftp目录搜索(Index of 关键字)
    有时候你会需要找一些非文档资源。例如:Index of mp3
    ftp
  • 12.其他搜索符:

():括号内的将会优先运算。例如:开源 AND (ocr -阿里云) 会优先剔除阿里云
*:通配符,当一个关键词你不知道全称叫啥的时候可以使用通配符。例如:this * life 可以匹配上This Custom Life 。
related: :类似搜索。比如:related:https://www.zhihu.com 会找出与知乎类似的网页。这里的搜索结果有:https://www.douban.comhttp://36kr.comhttps://www.bilibili.com;看来在谷歌看来,这几个网站的首页是差不多的。

+:强制搜索,一些忽略的词比如the、who之类的词前加+可以强制搜索。比如:+who is XXX 会保留who。但是这条已经基本上没什么用了,应该是基本上已经废弃了,因为现代搜索是会通过你输入的语句分析语义的。
~:同义词一起搜出来。例如:~Silicon,会将Si 硅搜出来。但是实际上他也基本上没什么用了,因为现代搜索引擎会自动根据你的位置语言将合适的内容搜索出来。
cache: :查看一个地址在谷歌的快照。比如:cache:https://www.baidu.com 会取出百度在Google的快照。在有些网站倒闭的时候可以瞻仰一下遗容。
location: :位置限定。没什么用。
daterange: :日期限定。例如daterange:01032021-03042021。也没什么用。你可以使用工具限定结果(百度也有这个东西):
工具

补充
你可以使用https://support.google.com/websearch/?hl=zh-Hans得到搜索上的帮助。
可以使用https://www.google.com.hk/advanced_search直接构建高级搜索。
更多高级搜索:
https://www.google.com.hk/advanced_image_search 高级图片搜索
https://www.google.com.hk/advanced_video_search 高级视频搜索
https://books.google.com.hk/advanced_book_search?hl=zh-CN 高级图书搜索

在百分之九十九的情况下:"关键字" site:你的目标域名 再通过工具进行时间限制,这种方式可以满足你的搜索需求,并且它可以适用与所有的搜索引擎。

注:转载请标明出处与作者。有意见或者建议请留言评论。

标签: none

添加新评论