2008年2月19日 星期二

利用Google來查詢食蟲植物的資料



利用Google來查詢網路上的資料,已經成為栽培食蟲植物時一項密不可分的工作。然而Google的搜尋能力是如此地強大,以致於我們得花費很多時間從中挑撿出有用的資料。其實如果能夠善加利用Google的進階查詢方法,將會更容易找到我們想要的資訊。

  ※     ※     ※

對於喜歡食蟲植物的人來說,看到世界上有各式各樣的食蟲植物,不免就會走上搜集的不歸路。由於食蟲植物分佈在世界各地,生活在各種特殊的環境之下,假如套用基礎的栽培方法,只恐怕食蟲植物只會一批一批地死去。

要得知某種食蟲植物的栽培方法,我們通常會想到要買本食蟲植物的書籍。不過,書上不見得有我們想要的資料,尤其是少見的品種或是新發現的品種。還是要從網路上找一找,看看是否有勇士已經成功征服,這樣才比較快。

從網路上獲得知識是便宜、快速而有效的方法。我們目前最常用的搜尋引擎就是Google,它的搜尋能力強大,然而如果不了解Google的運作方法,我們往往會搜尋到一大堆沒用的資料,然後花好多的時間來閱讀。其實Google有許多實用的搜尋方法,可以讓我們更精確、有效地找出我們所要的資料。

在網路剛出現的時候,因為網站數量很少,所以當時人們的入口網站都純粹是人工編輯的,就只像一個分類的電話號碼簿。最早成名的是Yahoo!,台灣在早期則為蕃薯藤Yahoo!奇摩。當時這些入口網站也有搜尋的功能,但僅限於這些入口網站內所收錄的資料而已。假如有某個網站沒有登記,那就找不到了。而且當時只能找到各網站的首頁,並不能找出各個網站裡面的特定網頁。

直到Google掘起之後就改變了。因為今日的網站太多,每天都有大量的新內容被放到網路上,光靠傳統的人工登錄以及分類已經難以應付,所以Google藉由自動化技術,利用機器人程式自動將網路上所有的網頁收集回去,並用電腦整理成一個資料庫。目前,Google仍是這方面的領導者,短時間內不太容易被其他的對手超越過去。

要用Google來查詢食蟲植物有關的資料很簡單的,我想大家都知道,只要到Google首頁,在那方框裡面輸入「食蟲植物」,就會出來一大堆的查詢結果了。


由於它在找資料上是這麼方便,所以「Google」這個字也已經被當作動詞,不時可聽見有人說:「去Goolge一下!」

因為網路上的資料如此的多,隨便輸入一個關鍵字,很容易就跑出數萬到數百萬筆以上的搜尋結果。然而我們可以發現,並不是每一種搜尋結果都是我們要的,往往大部份出現的是不相關的搜尋結果。這並不能怪Google,因為從搜尋的邏輯來說,只要是那個網頁裡面有出現相符的關鍵字,那就會成為搜尋的結果之一了。舉例來說,以「豬籠草」為關鍵字來查,除了會出現豬籠草的栽培、產地、生態相關的網站,或許連一篇文學創作也會出現,只因為作者在裡面提到「豬籠草」這幾個字。

所以很顯然地,我們必須要縮小查詢的範圍,精確地找出我們要的資料,才不用浪費很多時間來篩選資料。請記得電腦的自動化速度是絕對遠比人力處理來得更為快速,你只要花點時間稍微改變一下搜尋的方法,不用一秒鐘就能得到新的搜尋結果了,這絕對比你花費數小時逐一檢查來得有效率。

對於要收集食蟲植物的人來說,多半是要來查詢某種食蟲植物的栽培方法,有人可能就會在Google裡輸入這一個句子:

如何栽培豬籠草

雖然這樣做,還是可以找得到相關資料,不過這並不是正確的做法,因為目前的Google並不支援自然語言的查詢方法,目前的人工智慧還沒那麼厲害,能夠自動判斷出你真正所想要找的東西。Google目前是有能力把「如何栽培豬籠草」這樣的句子拆解成幾個關鍵字來進行查詢,然而句子中的「如何」或「草」這些字也會被拆解出來,以致於影響最後的搜尋結果。如果句子越長,帶有形容詞,越容易得到無關的資料。

現在就讓我們來學習正確的搜尋方法,可以讓搜尋結果更為準確。

Google的基本使用方法
無論是Google,還是學術的專業資料庫,要查資料的方法都是利用「關鍵字」來進行查詢的工作。大多數的關鍵字是名詞,而且常是專有名詞。所以,如果你想查詢某一種食蟲植物相關的資料時,至少要先知道那種食蟲植物的名字。我們先以「長葉茅膏菜」作為例子,來查查相關資料。請先在Google裡輸入:

長葉茅膏菜

很快的就會出現很多相關的資料了。如果我們想要進一步知道長葉茅膏菜的栽培方法,那就輸入第二個關鍵字「栽培」:

長葉茅膏菜 栽培

請注意,這兩個關鍵字的中間必須要打一個半型的空格,這樣Google就會知道這是兩個獨立的關鍵字了,只有當網頁同時含有這兩個關鍵字時,才會成為搜尋結果。如果想要再進一步限制搜尋條件,可以輸入更多的關鍵字,例如:

關鍵字A 關鍵字B 關鍵字C…(依此類推)

到這裡為止,都是Google的基本搜尋方法。雖然如此,我們仍然會得到許多無用的資料,因此Google提供「進階搜尋」,可以更進一步縮小查詢的範圍,來找出我們想要的資料。在進階搜尋所提供的搜尋方法,其實是幫我們輸入一些運算符號,讓Google進行特殊的搜尋。這些運算符號或指令也可以直接在原來的搜尋頁面來使用的,而且手動輸入往往更為方便而靈活,使用的方法分述如下:

利用雙引號讓搜尋結果必須完全符合關鍵字
你一定注意到,在前面的搜尋中,還是會出現好多和「長葉茅膏菜」無關的東西,這就是比較長的關鍵字的問題了,因為Google會拆字,就會把類似的搜尋結果一起列出來了,像是網頁裡只要有「茅膏菜」這幾個字,也是搜尋結果。

在Google中,有一個辦法可以強制「長葉茅膏菜」這五個字是一個完整的名詞,只有當文章裡,這五個字是相連在一起出現的,才符合查詢的條件。這個方法就是在關鍵字的前後用英文的雙引號「""」括起來,如下:

"長葉茅膏菜" 栽培

我們就可以發現,查詢的結果精確多了,只出來和「長葉茅膏菜」有關的網頁。用雙引號對於查詢英文資料特別重要,因為植物的學名都是由兩個英文單字所組成的,假如不使用雙引號,Google會把學名視為兩個無關的字。所以在查學名時,一定要用雙引號,例如:

"Drosera indica"

當然,我們可以將多組關鍵字各別用雙引號標示起來,例如:

"關鍵字A" "關鍵字B" "關鍵字C"...(依此類推)

排除某些關鍵字
當我們在查詢時,有些無益的搜尋結果是可以用別的方法來加以排除的。這個方法是採用數學符號的減號「-」(也是英文的連字號)來作為運算符號。以前面查詢「長葉茅膏菜」為例,我們可能會發現裡面摻雜一些水生植物的資料,所以我們可以將網頁裡面有出現「水生植物」這幾個字的網站給排除掉,做法如下:

"長葉茅膏菜" -"水生植物"

只要在關鍵字前面加上符號「-」就能排除掉相關的網站了,當然還可以排除多個關鍵字,只要記得「-」之前必須要空一格。

-"關鍵字A" -"關鍵字B" -"關鍵字C"...(依此類推)

只想搜尋某一個網站內的資料
有些網站內的資料量極為龐大,想要從中找出某些資料很費時間,這個時候就可以用「site:」這個指令了。例如要查詢「食蟲植物記」裡有關「捕蠅草」的資料,那就輸入:

捕蠅草 site:www.cp-essay.com

請記得「site:」前面要空一格,冒號之後不要有空格,搜尋引擎才能正常運作。假如想要同時搜尋幾個網站內的資料,那可以照下面方式輸入:

site:網址A site:網址B site:網址C...(依此類推)

排除某個網站的資料
假如你覺得找資料時,老是出現某一家網站的資料,令人感到厭煩,那就排除它吧!這個操作所用的語法是「-site:」,例如你用「食蟲植物」這個關鍵字時,老是會出現「食蟲植物記」這個網站的資料,那就輸入:

食蟲植物 -site:www.cp-essay.com

這樣就會顯示其它來自「食蟲植物記」之外的資料了。請記得「-site:」的「-」符號前面要空一格,冒號之後不要有空格,搜尋引擎才能正常運作。當然也可以同時排除多個網站,輸入方式如下:

-site:網址A -site:網址B -site:網址C...(依此類推)

搜尋食蟲植物的圖片
一直以來,很欠缺完整的紙本食蟲植物圖鑑,所以想要知道某種食蟲植物長什麼樣子,還是上網路找會比較快。在Google的首頁左上角有一排切換功能的連結,點選「圖片」,就切換成圖片的搜尋模式:


再輸入你所想要找的食蟲植物品種,最好是學名,別忘了用雙引號括起來,再進行查詢,就會找出來許多帶有該種食蟲植物照片的網頁了。


當然,這種搜尋結果並不是很精確,你必須多看幾個網頁,才能確定那種植物的外觀。如果你常在找食蟲植物的照片,有一個簡單的網頁正是為此而設的,「Carnivorous Plant Photo Finder」。

現在,你已經知道Google裡還有這些進階的查詢方法,不妨下次在找資料時試用一下這些查資料的方法,一定會對你有很大的幫助。