【知识分享】搜索引擎

    xiaoxiao2021-12-14  26

    背景

      搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。【百度百科】   搜索引擎之父乔纳森.弗莱彻发明了世界上第一个“网络爬虫(web crawler)”,开启了搜索引擎的新时代。   

    基本认识

      它是从简单的文件检索,又搭着互联网的顺风车一步步发展而来的。它是社会发展的必然产物,同时它又推动了社会的发展。只说两个阶段吧,20世纪90年代,搜索引擎,基本是Yahoo!的天下。后来发展的Google,Bing、Baidu陆续出现。2010年前程序员用Google的比较多,2010年Google退出中国市场后,Baidu基本成为搜索引擎的中流砥柱。   1.利用搜索引擎进行检索时搜索的不是网络,而是建好的数据库,数据库的建立是依靠“网络爬虫”技术。   

      2.搜索引擎并不能解决我们所有问题。比如说,我们要获取一些学术文献,商业数据库信息等,搜索引擎就可能搜不到了。虽然它很厉害,但是有时候不是最佳的获取信息途径。

    技巧说明

    1.简单关键字组合

      输入两个关键字,中间用空格隔开,表明这两个关键字是and关系。输入一个句子,百度会将其拆分成几个关键字进行检索。

    2.图片检索

      上传图片进行匹配这个功能很好,当你看到一个图片,但是你不认识里面的人或者里面的物件的名字的时候,就可以利用上传匹配功能进行在线匹配,根据反馈回来的相应信息,来获得自己想要的信息。当然我们更希望,我们随便拍一张照片,也可以匹配出来就好了,不过目前技术还不太成熟。   

      另外除了上传匹配的功能,图片检索另一个技巧就是:图片筛选,如图所示。我们可以选择我们要检索的图片的尺寸,颜色和类型,它可以让我们更加精确我们的选择。      

          3.条件检索

      搜索引擎都有一个检索条件的设定,你可以设定检索结果的语言、时间、类型和站点等。比如说百度,如图所示:   

      另外,百度右上角有一个高级搜索,也可以进行类似的限定,不再赘述。如图所示:

    4.命令检索

      intitle命令,限制检索内容出现在标题。如,intitle:琚建飞。   filetype命令,限制检索结果的格式。如,荷塘月色 filetype:ppt。   site命令,限制检索时的站点。比如我想知道我的老师有哪些主要事迹和获奖记录。我如果在百度文本框中直接输入老师的名字,很可能检索到的就不是他,因为重名的太多了,最重要的是跟老师重名而且还比老师有名气的也太多了。这个时候,如果我们将站点限制在廊坊师范学院官网中,那么我们就精确的多了。 如:输入:任建强 site:www.lfsfxy.edu.cn。(注意,site后面的冒号是英文字符下的冒号)如图所示:   

      那么我直接在这个站点直接检索不就行了,为什么这么麻烦呢?关键是,咱大廊院官网首页连个检索框都没有呀,这就尴尬了。另外,有些站点时需要你登录或者注册了才能检索。而这个方法可以绕过注册和登录直接检索。额外补充:site:edu.cn,表示在中国所有的大学上进行检索;site:cn,表示在.cn结尾的网站进行搜索;site:com,表示在公司类的网站进行搜索。

    利用搜索引擎解决问题成功与否的因素

      1.搜索技能。   2.背景知识。背景知识越深厚,关键字就确切,问题就具体。   3.解决问题的思路。   4.技巧的灵活运用。

    使用搜索引擎的三个层次

      1.只会用搜索框输入关键词;   2.能利用关键词组合,会一些逻辑关系,甚至会利用高级搜索来限定;   3.可以实现高效检索,直达结果(黑客水平);

    不同的搜索引擎区别

      1.数据收录范围不同   2.呈现方式不同   3.检索方式不同

    转载请注明原文地址: https://ju.6miu.com/read-962974.html

    最新回复(0)