西班牙語資料建置,最早源於我個人對國內西語研究的一個想法或者興趣,當時基於「未雨綢繆」的規劃,想到未來方便自己學術研究搜尋資料。因此,遠在 2000 年之前,開始執行類似的研究計畫時,就慢慢自己蒐集彙整資料。大約是 1996 年,那時也開始嘗試使用中華電信的 email,用打電話接通連線的土法煉鋼方式,我的帳號是屬於元老級的 ms2.hinet.net (聽說 ms1 是中華電信內部員工編碼,因此 ms2 就是「科技先進」人士了)。那時候的資料尚未電子化,搜尋引擎也不強,也尚未有足夠的空間可以容納線上資料。因此,資料彙整是「純手工」:最先從國內的西書中譯做起,接著蒐集相關期刊、報章雜誌有關西語和西語文化的論文、報導,從文學語言延伸到藝術、歷史、政經…等領域,同時連結起國內的西語教學單位,彙整人才庫,讓西語學界知道彼此在做那些研究,從事那些教材編纂,有那些出版品……。
當時想到國內的第二外語研究,就資料蒐集與彙整介面而言,西班牙文要追本溯源,要做到齊全完美,相對於日文、法文、或是德文,都簡單許多,是最有可能做到比其他第二外語更好的外文領域。這是逆向思考,是西語的一項「優勢」,因為國內的研究和學習,西語相對少,相對小,相對不普及,因此,要完整、要齊全、要善美,時間、人力和成果將會事半功倍。
當然,也因為在計畫成形之前,我蒐集的西語資料建置已有若干成果,因此,執行計畫付諸行動時,相對順利便捷許多,有種駕輕就熟,渾然天成之感。2001-2003 教育部顧問室的「台灣巴別塔第二外語網站計劃暨世界文學季刊發行」,是我個人參與的第一次三年期整合型計畫,我受邀加入第二外語團隊,負責西語的部分,當時由日文負責總體資訊彙整與網頁處理,三年下來,建立不少資料庫,也出版九期的《世界文學》季刊。2004-2006,2010-2012 科技部 (當時的國科會人社中心)分別補助兩個兩年期計畫「匯文網第二外語研究資料庫建置規劃」整合型計畫,這兩個計畫有英、日、法、德語,沒有西語研究人員加入,計畫名稱雖是「第二外語研究資料庫」,由經驗豐富的英語學門學者主導,我觀察該計畫執行期間,雖沒有西語研究人員加入,但匯文網有定期零星的西語資料建置。倒是 2010-2011 這年度,適逢中華民國建國百年,因此人文領域有一項大結合的一年期整合型計畫:「百年人文傳承大展計畫(圖錄部份)」,我在外文學門也執行一項子計畫:「西班牙語文學學術建制史」。
2013-2016 科技部延續「英語&第二外語資料庫建置」整合型計畫,英語和第二外語依據專業需求分開執行,第二外語這次納入西班牙語,因此,我負責「西班牙語文學資料庫建置」的子計劃,整體第二外語仍由日文主持領航。2003-2013 這十年間,我雖然沒有參與「第二外語資料庫建置」的計畫,但因一開始就不是以計畫為動機,並不因為沒有計畫就終止資料庫的建置,也因此,2013 年西語重新加入後,似乎沒有銜接的問題,反而很快將累積起來的資料可以排列組合、重整更新,參與的人力也更有動力。這當中,也因為資料庫建置源於個人學術研究興趣,而有目前個 人與群體的資料混合匯整的情況,看似個人網,又似公眾網,這個考量是,鑑於若干以往經驗,不希望網頁資料的建置隨著計畫終結而終結或消失。
此次整合型計畫,比較特殊的是國外期刊的引介,這也是第二年的計畫重點:希望建立一些國外知名西語期刊資料庫,讓西語學界同儕針對所建置的資料提供建議,因此拋磚引玉,先蒐集了一些較優質知名的西語學術期刊,簡介其性質與類型供參。這只是滄海之一粟,後續還需要戮力為之,或是等待西語領域普及拓展到跟其他語言一樣,一般學者和研究人員都耳熟能詳的境界,許多學術資料自成圭臬,不需要特別建置,那就是西語研究者之福。但是看來,這還真是 Mission Impossible。
2016 年中研院工程科學組新科院士,臺大電機系李琳山教授 7 月 20 日在校內電資學院主辦的「跨領域研究交流」演講〈芝麻開門-語音技術的前世今生〉,他提到在網路線上資訊大爆炸的時代,未來大數據的功能在於能夠迅速蒐集彙整、並明確分類提供查詢者所需要的有效性資訊,而不會陷於每日面對數以百萬計上傳的資料而無法找到自己想要的東西的困境。我私自遐想,近 20 年來,線上資訊從無到有,如今面臨這種「都是資料資料無用」的圍城,像是魚塭和汪洋大海的差別,魚塭,主人知所捕獲,網一放隨意一撈都是魚,都可以煮食; 汪洋中海底都是魚,卻不知往何處尋,千辛萬苦抓了一隻小丑魚,不能吃或捨不得吃。因此,資料庫建置又變成一個必要策略,發揮汪洋羅盤的功能,指引方向,便捷抵達目的地。
目前建置的資料庫,除了國外期刊該項,都以國內為主。以國內西語的出版量而言,此資料庫應不算滄海一粟,但必然有滄海遺珠,在可能的人力支持與心力堅持下,這個資料建置不會因計畫啟動或終止而跟著波動,而必須、也會跟著資料的源源不絕而日新又新。
在有限的支援與資源可以進行下去時,「西班牙語文學資料建置」會一步一步邁進,積沙成塔,也請有志同好隨時提供意見與建議。
致謝:
科技部專題研究計畫
題 目:第二外語資料庫建置–西班牙語文學資料庫建置
執行期限:2013.09.01 ~ 2016.08./31
計畫編號:102-2420-H-002-057-MY3
補助單位:科技部
2001-2016 這 15 年來,我的諸多研究助理,無論是網頁設計或是資料蒐集,中西文翻譯……等等,對今天這個資料庫的建置都貢獻了他們的心力,而這兒的資料還只是我教學研究的 El Dorado (黃金寶山)開採建置的部分而已。謹在此表示謝意。
網頁設計維護:José Saúl Yang‧Eva Chen‧Úlises Chuang‧Urbano Lee‧Morgan Kao.
資料蒐集翻譯:José Saúl Yang‧ Pedro Chang‧Andrés Wu‧Vicente Hung‧Benito Wang‧Lolita Kuang‧Bernardo Lin‧Eva Chen‧Enrique (Henry) Lin‧ Aurora Tsai‧ Esther Huang‧ Judy Yang‧Yolanda Cheng‧ Rafael Lin‧Henry Yang‧ Sofía Liu‧ Aiden Chung‧ Ellen Chung‧ Carlos Chang‧ Esperanza Hou‧ Daniel Yen‧ Gonzalo Yang‧ Jessica Fan‧ Emma Chou‧ Pilar Hsu‧Paola Huang‧Felipe (Philip) Chen‧ Irene Chien‧Alberto Chang‧ Jaime Kao。