转:学会用GOOGLE做research & 十大搜索技巧
Posted: September 28th, 2008 | Author: 李笑来
上一篇提到“没有输入就没有输出”。过去我们的主要信息来源之一是图书馆。今天互联网已经后来者居上,成为比图书馆更为重要的信息来源之一。互联网的信息被称为“海量”,所以“搜索引擎”就成了最被依赖的工具。
Google是我们这个时代最伟大的产品之一。有了Google,本质上谁都有能力做“research”(研究)——“research”在今天已经不再像许多年前那样是少数“精英”的专利了。我常常告诉我的学生,“research”其实一点都不神秘;所谓的“research”其实只不过是“search, search, and... REsearch!”在中文里,“research”除了“研究”之外还可以用另外一个说法来翻译——“做学问”。中文的“学问”这个词拆开来是两个字“学”和“问”。做学问的人一样要学,一样要问,只不过他们比别人把“学”和“问”重复更多遍而已。
Google是个可以用来research(做学问)的工具,而国内的百度相对来讲,在这方面差了不是一点半点。相对来看Google还是更讲原则 的一个产品。Google的搜索结果就是搜索结果,赞助商链接摆在旁边;而百度却为了赚钱把赞助商链接与搜索结果混在一起,并且更进一步,百度把赞助商链 接放在搜索结果之前。前阵子媒体就有过报道,有一位中年人为了治疗癌症上百度搜索,找了家医院,最后病情并未得到控制,钱倒是多花了许多。百度的这种做 法,直接导致人们无法分辨搜索结果与广告之间的区别,最终导致错误的判断。“如果提供假药信息,搜索引擎就是助纣为虐,谋财害命!”——国家食品药品监督 管理局新闻发言人颜江瑛说(网易新闻2008年9月18日)。
Google的界面非常简洁,很多人对此相当地推崇。但过分简洁副作用就是很多人也因此“过分简单化地使用Google”。然而,想做学问的人,花几分钟学学Google的语法是相当值得的;这几分钟里学到的东西用“终生受用”修饰都不过份。
在Google的输入框里,所有的空格都被Google理解为加号(+)。如果你输入的是【purpose of education】(本文中,【……】中的文字与符号就是指你在Google的输入框里输入的文字与符号), 那么Google返回的文章里既有“purpose”存在,也有“education”存在,但不一定有“purpose of education”存在。另外,过分常用的、单独存在没有意义的词汇往往被忽略掉,比如冠词“a”、“the”;介词“of”、“in”、“on”、 “at”、“to”;连词“and”、“or”、“but”;从属连词“that”、“which”、“when”;代词“my”、“his”、 “them”……等等。
如果你想要找含有“purpose of education”这个词组的文章,那么你必须输入【“purpose of education”】。现在的Google已经可以处理utf-8大字符集了,所以,即便你在输入的时候即便使用的是全角字符(不是半角字符的【"】而是【“】或者【”】)Google也照样能够正确处理。比较一下两种输入返回的结果:【purpose of education】vs.【“purpose of education”】。再试试【the most important benefit of education】和【“the most important benefit of education”】。这就是引号(“……”)的作用——返回“完整匹配”的结果。
为了进一步筛选搜索结果,还需要学会另外一个符号——减号(-)。比如,【"the most imporant benefit of education" - "united states"】要求Google返回含有“the most important benefit of education”但不存在“united states”的文章。
另外一个威力无穷的符号是型号(*)。Google支持通配符搜索,即搜索字符串中可以包含星号(*),用来替代任意字符串。比如,【“the most * examples of censorship”】将会返回含有类似“the most outrageous examples of censorship”、“the most brazen examples of censorship”、“the most heinous examples of censorship”、“the most stupidest examples of censorship”、“the most dangerous examples of censorship”、“the most egregious examples of censorship”、“the most prolific examples of censorship”、“the most absurd examples of censorship”……
在网上找例子的时候星号非常有用。比如,想找历史上“最怎么样的”老师的话可以搜索【“most * teachers in history such as”】,或者,想知道国外常见的软饮料品牌的话就搜索【“* soft drinks such as”】。星号还可以把Google当作搭配辞典使用,比如,想知道proof这个单词之前可以使用的量词都有哪些的话,可以搜索【“a * of proofs”】,返回的结果会让你知道,起码有这么几个:“a set of proofs”,“a variety of proofs”,“a number of proofs”,“a series of proofs”……
还有一个运用相当灵活、经常带来意外收获的符号是波浪号(~)。把波浪号(~)加在某个单词前面,是在告诉Google:除了给出的关键字之外,还要搜索与波浪号(~)后面的那个单词相关的词汇。比如,搜索【the importance of ~censorship】的结果中包含着“the importance of censorship”,也包含着与censorship相关的另外一个词汇“propaganda”——“the importance of propaganda”。
再学一个在指定网站中搜索的语法“site:”。比如,【“the purpose of education” site:http://www.time.com/】就是要求Google只返回http://www.time.com这个网站里的含有“the purpose of education”的文章。
2006年,Google推出了“co-op”服务(自 定义搜索引擎)。其中最常用的功能之一就是可以指定Google搜索一个或者若干个指定的网站——相当于前面提到的Google语法“site:”的扩 展。比如,我就为我的学生定制了一个Google cse(customized search engine)——“Search News Media”(在我的网站的导航栏上,有一个“自定义搜索引擎”,点进去也会看到这个cse)。不妨看看在这个自定义搜索引擎上搜索【censorship】返回的结果(GRE/SAT的作文考试中,都有很多关于“censorship”的作文题)。这个cse只搜索以下10个网站:
- http://www.economist.com/
- http://www.cnn.com/
- http://www.time.com/
- http://nytimes.com/
- http://www.washingtonpost.com/
- http://www.usnews.com/
- http://usatoday.com/
- http://www.reuters.com/
- http://www.bbc.co.uk/
- http://en.wikinews.org/
我还给学生定制过一个专门搜索百科类网站的cse:“Encyclopedia Search”。这个cse只搜索以下7个网站:
- http://en.wikipedia.org/
- http://encarta.msn.com/
- http://knol.google.com/
- http://www.thecanadianencyclopedia.com/
- http://en.citizendium.org/
- http://www.bartleby.com/65/
- http://www.eb.com/
如果你是Google的注册用户(现在几乎人人都用gmail),那么你也可以定制类似的cse,并且可以与其他人分享。关于更复杂的应用,只能查看Google CSE的帮助文档了。
另,stonewang留言推荐的文章也很好“Google搜索从入门到精通”。
Pure Pleasure - Reborn © 2008 - 转载本文时请保留此链接。
“十大高明的Google搜索技巧”,非常实用。
Posted: December 19th, 2006 | Author: 李笑来
转自月光博客。本文的英文原版地址,见文末注释。此文中文译文原本在IT168上。但讨厌的是,他们为了pageview,竟然把这样的文章分成10个页面。所以,还是转月光博客的好了。
前言:多数人在使用Google搜索的过程是非常低效和无谓的,如果你只是输入几个关键词,然后按搜索按钮,你将是那些无法得到Google全部信息的用户,在这篇文章中,Google搜索专家迈克尔.米勒将向您展示如何更智能、更高效地进行Google的系列搜索。
Google是一个非常精密成熟的搜索引擎,但大多数的用户都没有能完全地利用到它的能力。一般人就是在Google的搜索框中输入一两个关键字, 然后点击“搜索”按钮,等着Google显示出它第一页的搜索结果。这是一个相当简单模式匹配算法的搜索,不幸的是,通常此时出现的大部分都是并不需要的 结果。
其实,还是有更好的方式能够让搜索产生一些更少、更为准确的结果。你所需要做的事只是学习一些简单的技巧,你就能很快得到更多更好的Google搜索结果。
技巧一:使用正确的方法
无论你是使用一个简单或是高级的Google搜索,在此都存在你应该使用的某种可靠的方法。遵循适当的方法你就能获得非常准确的结果;要是忽略这条建议的话,你也许就会看到大量不相关的结果或是缺乏你想要的相关结果。
虽然有很多不同(且同样有效的)方法用于网络搜索,我保证这个特别的方法将能带来最棒的结果。这是一个分六步骤的过程,如下:
1、首先,想好你想要寻找什么。哪些词能够最好地描述你要寻找的信息或者概念?哪些词是你能够用来替换的?有没有那些词是可以不必包括在你想要搜索的更好定义你的需求之内?
2、构建你的搜索要求。使用尽可能多你所需要的关键词;越多越好。如果皆存在可能的话,试着用适当的搜索操作来使你的搜索更精炼——或者,如果你愿意的话,可以使用高级搜索页面。
3、点击“搜索”按钮进行搜索。
4、评估一下搜索结果页面上的匹配程度。如果一开始的结果与你想要的不一致,再精炼你的搜索要求并重新搜索——或转向更合适的搜索站点再进行搜索。
5、选择你想要查看的匹配的页面,点击进行浏览。
6、保存这些最符合你需求的信息。
换言之,这需要你在搜索之前思考清楚,接着在获得最初结果后精炼你的搜索。这些多做的努力都是轻微的,但确实很值得。
技巧二:合理利用一个“与/或”的搜索
大多数的用户都没有意识到,Google会自动假定一次搜索要求中所有的词之间都是一种“和”的关系。也就是,如果你输入两个词,它就会假定你所寻找的页面是包含这两个词的。它不会反馈给你仅包含其中一个词的页面。
这就使得你无须在输入搜索要求时输入一个“和”。如果你想要搜索的包括“Bob”和“Ted”,你所需要做的就是输入bob ted即可。Google会自己假定一个“和”,并自动地将它包括在内部的索引搜索内。
这与在所要求的词之间假定“或”是不同的。例如,对比输入的要求“bob ted”(记得,这个实际上是bob和ted)与“bob或ted”。根据第一个要求所得的结果所包含的页面会共同提到Bob和Ted.而后者,结果所包 含的页面会只单独提到Bob,也有些页面是单独提到Ted,还有一些是共同提到他们二者的。这是一个微妙的差异,但却是很重要的。
因此,如果你想要一个“与/或”的搜索——搜索包括一个或另一个词的页面,但不一定是都包括二者——你必须在两个关键词之间插入一个带有“或者”功 能的操作。当你输入这个“OR”的表示“或者”操作时,请确保所输入的要大写,否则Google会将它忽视为一个忽略的单词(stop word)——也我们接下去将要讲到的。
技巧三:你的搜索中包括或不包括的词
关于这些“and”和“or”的词,Google会自动地将这些在你输入的搜索要求中的不重要的、普通的词忽略掉。这些被称作是“忽略的单词”,包 括 “and”、“the,”、“where”、“how”、“what”、“or”(所有字母皆为小写,还有其它一些类似的词——包括一些单独的数字或单独 的字母(例如 “a”)。
在搜索中包含忽略的单词并没有什么大碍,不过会使搜索速度有些下降,这就是Google将它们剔除的原因。举一个例子,你想要搜索的是“how a toaster works”(烤箱如何工作),Google会移除“how”和“a”两个词,并自行按新的更短的关键词“toaster works”进行搜索。
如果你想要让这些一般的词包含在你的搜索要求内,你可以通过让Google必须在搜索中包含这些特定的词,使它不去排除“忽略的单词”。想要做到这 点,你可以在你确实需要的词之前加上一个“+”符号。例如,要在搜索要求中包含“how”,你应该输入“+how”。请确保在+符号之前有一个空格符,而 不是在它之后。
从另一方面来说,有时你会想要通过排除一些包含特定词的页面来精炼你的搜索结果。你可以通过使用一个“-”号来去掉搜索结果中不想要包括在内的词; 在你的搜索要求中任何之前加上了“-”符号的词都会自动地排除在搜索结果之外。同样地,也请记住在“-”符号之前留一个空格符。
例如,如果你想要搜索“bass”,你所得到的页面可能会包括男歌手一类的或是关于鱼的一类的。如果你仅向搜索的是歌手这类的页面,输入搜索要求时应如下:“bass -fish”。
技巧四:搜索近似的词
不确定你在一次搜索中想要搜索的词是正确的?你是否担心一些页面会使用可替代的词来描述你想要的东西呢?
幸运的是,Google能够让你搜索近似的词——叫做同义词——通过使用“~”符号。只要在想要搜索的词之前加上“~”符号,Google就会搜索所有包括这个词以及合适的近义词的页面。
例如,要搜索类似“elderly”的词,输入“~elderly”,所得到的页面就会不仅是包括“elderly”这个词,还会有包括“senior”、“older”、“aged”等等词的页面。
在此还有个额外的技巧:如果要只是列出近义词的页面,而不需要给出许多原先输入的那个词的页面,可以用“-”符号来连接“~”操作,例如 “~keyword -keyword”。这样就能在近义词所得的结果中排除原先输入的词。在先前的例子中,要得到仅有“elderly”近义词的搜索结果,就输入 “~elderly -elderly”即可。
技巧五:搜索特定的词组
当你搜索一个特定词组时,如果你只是简单地输入词组中所有的词你是无法得到最好的结果的。Google也许能够反馈出包含这个词组的结果,但它也会列出包含你所输入所有词的结果,却未必让这些词按照正确的顺序。
如果你要搜索一个特定的词组,你应该将整个词组放在一个引号内。这样就能让Google搜索规定顺序的精确的关键词。
例如,如果你要搜索“Monty Python”,你可以输入monty python作为你的搜索要求,接着你也许会获得可接受的结果;这些结果中会包含有着“monty”和“python”两个词的页面。但这些结果并不仅是 包含了关于英国喜剧团体的页面,还包括了名叫Monty的蛇以及名叫Monty的家伙,他养了蛇来当宠物,还有其它一些包括了“monty”和 “python”的词的页面,即使它们之间看起来似乎毫无关联。
为了将搜索结果限定在只关于Monty Python喜剧团之内,也就是你想要搜索的页面是按规定的顺序,将这两个词作为一个词组包含在内的,你就应该在输入搜索要求时输入"monty python"——确保这个词组在引号之内。这样的话,如果没有按照规定的顺序将这两个次匹配为一个精确的词组,这个页面就不会被列在搜索结果当中。
技巧六:列出相似的页面
你是否有发现过一个网页是你确实很喜欢的,又想知道是否还有与它类似的其它网页呢?不需要再疑虑地思考了;你可以使用Google的相关来寻找:这 个操作算符所显示的页面会与特定的页面在某些方面是相似的。例如,如果你很喜欢InformIT上的文章,你可以通过输入 “related:http://www.informit.com”来寻找类似的页面。
技巧七:通过其它的操作算符调整你的搜索
使用相关操作算符只是众多你可用来调整Google搜索结果的方法之一。所有的这些输入的操作算符都是以相同的方式工作的,将这些算符作为你搜索请求的一部分输入,再将变量紧接在这些输入的操作算符之后的冒号之后(而不是空格),就像这样:“‘操作算符’:‘变量’”。
有哪些搜索的操作算符是你可以利用的呢?以下是一个简短的清单:
- 算符 用途 用法
- allinanchor: 限制搜索的词语是网页中链接内包含的关键词(可使用多个关键词)allinanchor:keyword1 keyword2
- allintext: 限制搜索的词语是网页内文包含的关键词(可使用多个关键词)allintext:keyword1 keyword2
- allintitle: 限制搜索的词语是网页标题中包含的关键词(可使用多个关键词)allintitle:keyword1 keyword2
- allinurl: 限制搜索的词语是网页网址中包含的关键词(可使用多个关键词)inurl:keyword1 keyword2
- filetype: 限制所搜索的文件一个特定的格式 filetype:extension
- inanchor: 限制搜索的词语是网页中链接内包含的关键词 inanchor:keyword
- intext: 限制搜索的词语是网页内文包含的关键词 intext:keyword
- intitle: 限制搜索的词语是网页标题中包含的关键词 intitle:keyword
- inurl: 限制搜索的网页的地址 inurl:keyword
- site: 限制所进行的搜索在指定的域名或网站内 site:domain
技巧八:搜索特定的事实
如果你要搜索一些客观事实,Google也许能够帮得上忙。是的,Google总是能够反馈给你一个匹配你指定的搜索要求的清单,但只要你能够正确 地描述了你的搜索要求,且接着搜索的事实是Google已经预先鉴定了额,你就能在搜索结果页面的最顶端得到你所需要的精确信息。
我们在此谈到的有哪些类型的信息呢?是一些事实性的信息,例如诞生日、诞生地、人口等等。你所需要做的就是输入你想要知道的描述事实的搜索要求。例如:
要查询圣弗朗西斯科的人口,则输入“人口 圣弗朗西斯科”。
要查询马克·吐温在哪里出生,则输入“出生地 马克吐温”。
要查询总统比尔·克林顿什么时候出生,则输入“生日 比尔克林顿”。
要查询雷蒙德·钱德勒什么时候去世,则输入“去世 雷蒙德·钱德勒”。
要查询谁是德国总统,则输入“总统 德国”。
这些问题的答案就会显示在搜索结果页面的顶部。你能够获根据关联的网站得应对你的疑问的正确答案。点击相关的链接还能从这个资源里获悉更多的东西。
技巧九:搜索Google Directory
Google在它的搜索数据库中将成千上万的网页索引化——这就能使得不会产生压倒性数量的搜索结果。量确实已经够了,但有时你也许会更愿意得到一些高质量的结果。
由于质量较数量更为重要,就可以绕过主要的Google搜索引擎而使用Google Directory来代替。Google Directory是一个网页清单相对较小的数据库,它们都是通过一个人工编辑团队手动精心挑选的。Google Directory是有被注释和组织到相关的话题类目下的。你可以通过类目来浏览网页目录,或是搜索指定的项目。
Google Directory是一个可用来搜索大量Google网页索引实用选择。Google Directory的结果比起你在更大的搜索索引范围中的搜索结果更为集中且高质,也能够帮助你在任何给定的类目下更好地认识什么是可用的信息。另外,如 果你喜欢,你也可以利用浏览类目来替代搜索。
要进入Google Directory,点击Google主页上的“更多”链接,在接下来的页面中选择类别。当然,你也可以直接进入Google的Directory,只要在浏览器中输入directory.google.com即可。
技巧十:使用Google的其它专业搜索
Google Directory不仅仅是Google所提供的除了主搜索引擎之外的唯一选择。根据你所做的搜索类型,你也可以通过使用其中Google更为专业的搜索站点之一来得到更好的结果。它们包括:
Froogle可以用来搜索那些有着最低价格的特定商品的在线购物网站。
Google Answers所提供的服务是直接让你的搜索需求面向专业人员的小组,大多数都是用于当你有着更为复杂的问题,而无法通过简单的搜索来解答的时候。
Google Apple Macintosh Search主要是在apple.com域名中以及和其它与苹果相关的站点进行搜索。
Google Blog Search是用来搜索博客和博客文章的。
Google Book Search可以搜索成千上万的小说和非小说类图书的全文。
Google BSD UNIX Search可以搜索到大量专门为BSD版本的UNIX操作系统专业化的站点。
Google Groups可以搜索到Google Groups档案的相关文章。
Google Linux Search用来搜索大量与Linux相关的网站。
Google Microsoft Search可以搜索主要是microsoft.com域名中的内容以及其它微软相关的站点。
Google News可用来搜索大量有最新新闻和头条的新闻网站,也能够搜索历史的新闻资料,一直可以追溯到两个世纪之前。
Google Scholar在一个有着学术杂志、文章、报纸、论文和书籍的数据库中进行搜索,也能够选择大学或研究书库。
Google U.S. Government Search是用来搜索那些美国政府的网站——这是一个最好的用来搜索官方性政府举措、信息、报告等等的地方。
Google University Search能在一个有着超过600所大学网站的数据库中进行搜索——能够用来查询课程安排、入学资料等等。
原文作者:Michael Miller
原文标题:Ten Tips for Smarter Google Searches
原文地址:http://www.informit.com/articles/article.asp?p=675274&rl=1
编译人:雪影蓝风(IT168)
译文地址:http://publish.it168.com/2006/1213/20061213001101.shtml
0 只草泥马:
发表评论