e化時代來臨,人們依賴電子郵件聯繫的情況越來越高,世界一家已不再僅止於空泛的理想,不過,伴隨著科技便利,也產生不少系統運作效能打折的危險因子,如病毒、蠕蟲、垃圾信、間諜軟體等。其中從各家調查報告發現,垃圾信影響對依賴電腦程度極高的現代人來說,是一大困擾。一天的開始打開信箱,卻發現竟有百分七、八十的垃圾信,尤其每天面對同樣的轟炸,令現代人煩不勝煩。最令人難以忍受的是,當你不小心點開時,你很有可能同時不小心點開附加的病毒檔、間諜程式或木馬程式,「搶救電腦大作戰」的戲碼當場悲慘上映。
Nopam,stop the spams with no pain 讓人停止痛苦的科技
在七月中旬發表一項郵件過濾產品-Nopam,其產品效能高達97%,這對飽受垃圾郵件之苦的企業、學術與個人來說,真是令人振奮的一項消息。其技術突破傳統過濾方式,採垃圾信「行為」作判別依據,使得這項產品不受地域性或語言上的限制,不論在哪裡,使用者為何,都能輕易揪出垃圾臭蟲,不必再飽受漫天垃圾的困擾,可以在更乾淨、更有效率的電子化環境快樂工作。
這項計畫說起來有點意外,一次對談中,中正大學計算中心主任李新林與吳昇談論到垃圾郵件對學校造成的困擾,希望能徹底改善目前面臨的窘境,一番討論後,吳昇決定暫時停下手邊研究-因資源不足,搜尋引擎技術遲遲無法向前推進-召集夥伴投入垃圾郵件過濾軟體的開發,非常幸運的是,10個月後,漂亮地向世界詔告他們的成果。
從前,垃圾郵件過濾軟體的主要技術不外乎黑名單、白名單、法則基準(Rule Based)、貝式郵件過濾演算法(Bayesian Filter)等,其中Bayesian filter更是資訊過濾技術裡的主流。Bayesian Filter的基本原理是運用統計的分析,在樣本信件訓練出屬於垃圾信件的關鍵字群組,再利用這些內容特徵來評估一封新信件垃圾信傾向的分數。然而此種內容過濾技術的缺陷是,夠大又精確的樣本空間不容易建立,而且誤判的危險性偏高。比方說,垃圾信樣本裡有很多信件的標題有「很重要」的字句,而正常信樣本裡沒有,經過訓練的內容過濾器很有可能會誤殺一封標題含有「很重要」的正常信件,而誤殺的代價通常極難挽回。
多數垃圾信過濾系統需要較複雜的設定,例如設定白名單、黑名單、砍殺分數點(threshold),並且需要使用者設定上的參與,使用者利用回報機制調教系統。除此之外,它還有多項令人頭痛的使用上困擾。有些系統可以選擇排除垃圾信的機制是輕度、中度、還是強度,或者讓管理者決定砍信的基準線,這意味著使用者必須在信箱的乾淨度與誤殺度之間做痛苦的抉擇!基於快樂享用科技的原則,歸納幾項研發重點;垃圾信的誤殺率要低、處理速度要快、系統穩定性及可靠性要高、易於安裝及設定,最重要要達到不分語系及地域性,準確地掌握垃圾信的關鍵。
根據研發團隊的觀察,垃圾郵件與正常郵件最大的分野在於行為而非內容。舉例來說,為躲過郵件的過濾機制,垃圾信有幾項慣例性行為。我們可以先定義特徵行為,再加以分析整個信件是否造假或行為前後不一。如發信欄位造假、表頭(header)造假、主旨造假等,記錄到特徵的資料庫中,同時再進階技術,若未能在特徵資料庫中找到相似特徵時,會根據郵件的行為內容分析比對,找出垃圾郵件的新特徵,一方面可阻擋未曾發現的特性,另一方面可以更新現有特徵資料庫中。另外,還發展出「個人郵際關係分析」(Relational Closure Analysis)技術來保護使用者正常郵件慘遭誤殺的困擾,將誤殺率降至最低。
在目前的郵件過濾軟體來說,大都是利用Perl來撰寫,Perl本身屬高階組譯語言的一種,本身執行的時候比較耗機器效能,因此執行上的效率就會打折。Nopam在設計系統之初,為達軟體執行最高效率,採用C語言撰寫系統,包括演算法,也將過程複雜對效率的耗損列為評估要項。取得演算法、資料結構設計複雜度及嚴謹度的平衡,整個系統才能呈現最佳的效能。所以Nopam在效能測試上,Intel P4機器一天就能夠消化一百萬份以上的郵件。研發團隊套用搜尋引擎的經驗,歷時10個月,達97%過濾功能的確相當不簡單;他們目前正希望衝破97%,達到99%的目標,現在他們已完成安裝程式,歡迎各公益團體或學術機構使用,待這些使用者回報更多數據,他們有信心可以達到預定目標。
研究員實踐社會學家的夢想
談起主導整體技術開發的核心人物,吳昇,特殊的人格特質,令人印象深刻,他從Gaise實驗室、搜尋引擎開發、到最近的郵件過濾器,每一項學術研究都可以看到他對社會的關心。過去在他的研究發展中,都會談到社會回饋計劃,這些規劃中,他主動地將三分之一盈收撥作公益用途。尤其,去年南亞海嘯時,其成立的公司雖尚未回收,包括他與其他同仁仍舊慷慨地捐助一筆為數不小的金額幫助其他人。這樣的精神,正是回應他當初成立公司的精神-一家公司所有員工都能開心工作的環境,員工不用為了績效,犧牲家庭及個人私有時間,為了賺錢而賣命;公司的運作不僅止於營利,樂意與需要幫助的人分享公司成果。他以實驗精神成立這家「以人以仁為本」的公司,在他的公司裡,實踐工作不出賣快樂的理想,如果有成功的一天,他希望出版書籍,與全世界分享他的實驗成果。
吳昇,是一位研究發明仍擁抱社會大愛的夢想家。這名夢想家當年在面臨聯考組別的選擇上,面臨極大考驗。當年的他,對資訊研究並不是特別濃厚,最感到興趣的是社會關懷與人際互動的研究,不過礙於父母對前景的憂心,最後屈服父母的要求,選擇一條未來工作發展比較平穩的學科。即使如此,並沒有因此放棄他的理想,他在每項作品的研究上,都希望能實質地為人類的進程帶來一部份改變,甚至在盈收之餘,投注部分心力在對台灣土地的關心。這次Nopam的計劃也不例外,其包括蘭嶼的回饋計畫與環保台灣計畫,值得一提的是,過去台灣為經濟發展而犧牲環境,讓我們今日飽受漠視的惡果,為了讓環境生養復原,鼓勵開發讓台灣得以永續生存的產業,他認為「零污染」的資訊軟體業再適合台灣不過,所以他願意提供經費支持學界勇於開發系統平台的研究計畫,以促進軟體產業在台灣的發展與生根。一向具有正義感的他認為,要求蘭嶼接收台灣的核廢料是不公平的,台灣人對環境保護的關心是冷淡的,對學界的研究是不夠關心的,對軟體產業的研發是淺薄的,他深切地關心所有生態問題,不論是自然或經濟,化為實際地行動,他相信能做得更多。
支持 讓幸福的種子散佈
台灣有許多傑出的研究人員,研究成績是國際有目共睹,不論是國產的科技研發公司或是吳昇本人過去在搜尋引擎的開發,過去搜尋量曾高出至今搜尋龍頭Google的1.7倍,比較主機的使用量,Google高達1萬多台,台灣卻只要70多台,就能有達到如此高的效能,可惜的是,礙於研究資源缺乏,其搜尋引擎的進度只好暫時停工;轉向郵件過濾系統開發,甚至日後,發展一套更完整的郵件系統;建立郵件資料庫提供郵件長期備份、搜尋、重要文件保護、資料探勘分析到知識管理等進階功能。
這項計畫採自由定價制度,使用者可在使用軟體後,自行決定匯款金額,1.0試用版在10月15日已經推出了,只要填寫申請單送出後,就可以免費試用這套軟體,除此之外,他們針對使用者回應,快速修改小部份過濾的邏輯,短短兩天內,立即推出1.1版升級版,郵件過濾器的高速效能,申請試用的單位早已破200名,其中學術單位佔三成四,中小企業佔三成一,個人也佔二成五,相信不久就能達到預期的目標。過程中,希望各界多多給予這群默默耕耘的農夫鼓勵,不論是在信件或其他支援,現在就開始,他們會擁有更強壯力量朝夢想邁進,創造讓人類更多樂趣的幸福科技。