從事生態工作,最常被誤解的是:你們的工作真棒,可以天天到處跑到處玩。
每當聽到這句話,心理的OS總是:不然你來一個月出20天野外+5天內業試試。其實對於大多數的生態工作者來說,野外工作縱然辛苦,但總能在與那動物、植物、昆蟲等相遇時,找到那驅使著我們不斷往野外跑的動力,不過當遇到資料整理、報告撰寫時,要把「天生過動」的生態工作者「固定」在電腦桌前乖乖完成內業工作,相對地就需要莫大的毅力(或美味的垃圾食物)才能做到了。因此,為了公司夥伴們的身、心健康,如何利用電腦、手機、網路等現代科技的優勢來盡量將內業工作簡化,就非常重要了!
在內業工作中,打字key in是免不了的項目,而許多動、植物的中文名稱並非一般常用字。什麼「食蟹獴」、「鼬貛」、「堀川氏棕蝠」、「臺灣山鷓鴣」、「鴨跖草」、「圓葉澤瀉」、「臺灣桫欏」,其中許多字可能一般人都讀不出正確的讀音,因此在選字上往往需要花費不少時間,影響打字的速度。雖然現在的輸入法多有自動學習的設計,在經過一陣子的「訓練」之後,詞庫就會越來越完整,打字的效率也就越來越高。然而「訓練」的過程非一蹴可幾,而換了一台電腦如果沒有把訓練好的詞庫一併搬過去,那就得從頭訓練起,實在惱人!如果,訓練好的輸入法字庫可以帶著走,甚至在「手動」訓練前就事先把動、植物名錄等專有名詞餵給輸入法,那無疑對提升打字速度有莫大的幫助呀!
正體中文的輸入法其實有幾個常見的系統,包含早期號稱打速最快但不易上手的倉頡、選字麻煩但人人會打的注音、後來才發展出來也有不少愛用者的無蝦米…。今天就先針對最多人使用的注音輸入法來做介紹。
能夠自建字庫的輸入法其實不少,例如約10年前yahoo奇摩開發提供免費下載使用的yahoo!奇摩輸入法,就有自建字庫的功能,可惜目前已經停止更新。老牌的自然輸入法是付費軟體(也有功能較陽春的免費版本),最新的V12版也有提供CSV檔匯入字庫的功能。自然輸入法也有不少愛用者,只是過去曾有不少系統衝突,造成office當機等問題,後來花了不少的時間才修復,對於付費購買的消費者來說,體驗上實在不太OK。縱使如此,自然輸入法仍是我自己目前主要使用的輸入法。但今天要介紹的也不是他XD
前一陣子購入了蘋果電腦,自然輸入法也有出mac版本,在官網上與windows版分開來賣,單獨買mac或是windows版是2500元一套,也有兩個平台都可以用的「共通版」是3800元一套。寫信去客服詢問我已經有一套windows版,能否付費升級共通版,得到的回應是一句冷冰冰的「我們沒有這樣的服務」。umm…看來只好自立自強了。上網搜尋到一個基於中州韻輸入法引擎的跨平台的開源輸入法,在Linux、windows與mac上分別叫做:中州韵、小狼毫、鼠鬚管輸入法(好複雜XD),不但支援倉頡、注音、拼音…許多不同的輸入方式,還有極為強大的自訂功能(不過自訂設定上是有一點門檻)。而即便不使用他的自訂功能,中州韵/小狼毫/鼠鬚管的字庫學習能力也很強,推薦給大家(尤其是mac使用者)可以下載來試試。(中州韵/小狼毫/鼠鬚管下載網址)
其實關於中州韵/小狼毫/鼠鬚管輸入法,在網路上可以找到不少的設定教學,也有許多網友的優化版本,這邊建議可以選用符合臺灣打字習慣的「洋蔥版」,以下是基本的安裝方法:
1. 至中州韵/小狼毫/鼠鬚管下載網址下載安裝輸入法。windows版本安裝後即可在螢幕右下角點選切換到小狼毫輸入法。Mac版本則需要到「鍵盤偏好設定」裡,新增輸入方式,並在「簡體中文」裡頭找到「鼠鬚管」輸入法後新增。(雖然是從簡體中文裡頭新增,不過完全相容正體中文,不用擔心)


- 2. 打開輸入法的設定資料夾:小狼毫 @ windows可以在視窗右下角用右鍵點擊「中」的icon叫出功能表,選擇「用戶文件夾」直接開啓。鼠鬚管 @ mac則是在右上角點開輸入法後,選擇「用戶設定」。接着刪除資料夾下的所有檔案(即Rime資料夾下的所有檔案)。然後到以下網址下載洋蔥版設定檔 :https://github.com/Ponpon55837/Squirrel 解壓縮後直接複製到上面的小狼毫/鼠鬚管的設定資料夾中。


- 3. 在複製完成的設定檔中,找到「bopomo_onion.extended.dict.yaml」檔案,使用記事本或notepad++等純文字編輯軟體開啓(mac則直接點擊就能開啓編輯),可以看到文件裡頭有自建詞庫的範本與空間。從範例裡頭可以看到,自建字庫是由左方的中文與右方的漢語拼音及音調所組成,只要有符合格式的純文字清單可以直接貼在檔案下方,就能建立屬於自己的字庫。

問題來了,如果需要自建字庫的數量不多,或許還可以一筆一筆慢慢key in,但本文提到的物種名錄,少說也有數百筆,是不可能這樣一筆一筆key的。事實上,過去可以自建字庫的yahoo!奇摩輸入法,雖然有更方便的自建字庫界面,但也是卡在需要一筆一筆輸入的困擾。然而資訊時代的好處就是,有問題網路上就有解方。同樣開源的「深藍詞庫轉換」一舉解決了這個問題。在以下網址下載後解壓縮直接執行exe檔即可進入轉換界面。https://github.com/studyzy/imewlconverter
深藍詞庫轉換的界面十分簡單,第一欄點擊右方三個點即可開啓檔案總管選擇想要轉換的詞庫檔。左方是既有詞庫的格式,我們可以直接選擇選單最下方的「無拼音純漢字」,右方則選擇「Rime中州韵」,類型記得選「注音」,然後選擇正確的作業系統,即可順利轉出.txt檔的純文字詞庫。

至於詞庫的來源,就看大家的需求囉!包括中華鳥會鳥類紀錄委員會維護的臺灣鳥類名錄、中央研究院所維護的臺灣物種名錄等等,相信各位生態工作者必然在熟悉不過了!只要將名錄下載後,利用excel等軟體編輯,保存中文名的部分,並轉存爲utf-8編碼的csv檔,再用記事本或notepad++等純文字編輯軟體開啓csv檔,並另存爲txt檔(不只接用excel轉存爲txt檔,是因爲excel預設爲big5編碼,直接轉存txt會有許多字變成?號,例如「鵐」、「鴴」等等)
最後,將整理好的詞庫txt檔案,讀入深藍詞庫轉換工具,並按照上面的方式轉爲中州韻的詞庫格式,同樣儲存爲txt檔,再打開複製貼上到上面提到的「bopomo_onion.extended.dict.yaml」檔案中,儲存後回到步驟2的功能表,點選「重新部署」,即可在輸入法中順利使用自建字庫囉!



以上分享,多拜google大神與許多github上的開源軟體所賜,我這邊只是把尋找到的資源做簡單的整理與說明,讓大家方便一些。如果對這個輸入法的其他更多強大的自定功能有興趣的朋友,不妨再利用其他網路上的資源深入研究囉!