
唐能翻譯君按語:
2013年底我和搭檔魏勇鵬創辦公司的時候,他說了兩件事:一是,谷歌機器翻譯幾乎不再聘請語言學專家了,由懂得統計、計算的計算機專家主理開發。二是,谷歌有世界上豐富的多語言語料數據,但對這種基于數據統計訓練而成的翻譯引擎來說現狀有點尷尬,更多語料能帶來效果不再明顯了,盡管谷歌的語料、用戶量和使用量都在日益增多。
在我們運營公司的兩年多時間里,遇到了很多客戶和投資人,他們問的一句話是:“你們機器翻譯能達到什么樣的準確度?”這個問題意味深長,我一般只能回答說:“在某些垂直領域,我們比谷歌翻譯要好?!边@句帶有挑釁意味的話讓聽者將信將疑卻無從反駁,因為Ta從未得到過無瑕的機器翻譯體驗——像科幻影視文學、類似《星際迷航》里展現的,那邊阿凡達星語說出來,這邊火星人聽進去,毫無停頓卡帶的痕跡。
行內人用專業尺度評價機器翻譯的現實是這樣:美國商務部下屬的國家標準與技術研究所NIST舉辦的一項機器翻譯研究水平評測,采用BLEU(Bilingual Evaluation Understudy)標準。 其原理是比較機譯結果和人譯結果的相似度,完全一致得分為1(當然不同的人的翻譯很難“完全一致”,所以得分1為理想值)。2008年NIST的英文-中文的機器翻譯評測結果,谷歌翻譯得分0.4142,微軟亞洲研究院提交的測評是0.4099,廈門大學得分0.2502;谷歌和微軟亞洲的中文-英文機翻得分分別是0.2999和0.2901,中科院自動化所的得分是0.2407。
2015年9月第十一屆全國機器翻譯研討會(CWMT 2015)上,中國超過10所科研所和大學參加了機器翻譯的評測。同樣以BLEU值為標準,英漢新聞平均得分接近0.35,漢英新聞則接近0.25,日漢新聞質量很好——高分超過0.5;英漢科技則普遍超過0.35,高分0.43。國內語種的機翻效果更好,藏漢政府文獻的很高分0.61,維漢新聞的很高分0.54。
囿于測試所選文檔和評測方法,該數值結果和普通人閱讀體驗有可能偏差很大。權當參考:機器翻譯中有40%左右的結果,用戶可以較為容易理解使用。和阿凡達電影場景的效果,和此時此刻用戶/投資人對人工智能產業的期待相比,還是弱爆了。不過,2013年谷歌翻譯每天的用戶量超過2億人、翻譯10億次,每天翻譯的文字相當于100萬冊圖書,超過全球專業翻譯一年的工作量,他們用的就是BLEU值40%左右的機器翻譯。
“人工智能領域沒有取得任何進展,”英國理論物理學家戴維·多伊奇在其著作《無窮的開始》里說:“因為在其核心里有一個懸而未決的哲學問題:我們還不了解創造性如何運作。一旦解決了這個問題,編程實現人工智能將不是難事。圖靈發明了圖靈測試,希望繞開這個哲學問題。換句話說,他希望在解釋這項功能之前就實現這項功能。不幸的是,類似這樣的情形極為罕見?!保▓D靈測試由計算機科學和密碼學的先驅阿蘭·圖靈于1950年設計:如果電腦能在5分鐘內回答由人類測試者提出的一系列問題,且其超過30%的回答讓測試者誤認為是人類所答,則電腦通過測試,它被認為具有智能。)
“現在我們談的比較多的是人機鏈接,就是把大腦和計算機相連,用機器擴展人類的思維能力。我覺得這一點利用目前的老式計算機是無法實現的,因為人腦在我看來更接近于量子計算機,我們人類與電腦的區別在于,電腦你輸入什么,它輸出什么,先進的例外是它死機了。而輸入相同的信息,人類的輸出是不可預知的,這就是人類的自由意志。我認為人類的自由意志是以量子計算為基礎,是一種模糊的計算而不是邏輯計算。”中山大學天文與空間科學研究院院長李淼說。
按照中國人工智能泰斗、中科院院士張鈸教授的分析,人工制造的智能機器即使有了自主意識,也是機器的意識,比如“有一個機器人會做勺子,而且它像人一樣‘有意識’自主工作,這個機器人可能耗盡地球的資源來生產勺子,因而對人類產生威脅”。
雖然數據在增加,但是主要基于統計計算的人工智能不能滿足人的意志和情緒需求。至少在基于邏輯計算的機器翻譯領域,語料數據的增長與翻譯準確度不再成正比,讓機器理解人的努力嘗試卡在半山腰。
在用戶和投資人對人工智能有愛有期待的時候,這個夢醒得有點殘酷。不管所謂機器智能是否是真正的智能,在某些場景下,它已經開始發揮價值。我的一個朋友、中科院自動化所的博士生黃國平講的話很有力量:“即使是現在的機器翻譯,用好了照樣震爆世界?!彼囊馑际牵簷C器已經做了40%、垂直領域的引擎能提供超過50%的有效結果,理論上很好的翻譯項目能提高50%的效率,機器的生產能力同樣令人乍舌。
可預見的時間里,機器翻譯一直都會不完美有遺憾。其實這也是一個好消息,它給人留了尊嚴和安全感,保留了翻譯職業,甚至為譯員提供了更多的商業需求和更多的工作崗位。
不人性的一面
我在翻譯生產中遇到了三個譯員(以下用化名),三個案例和機器翻譯的關系層次分野清晰。
23歲天秤座張林林姑娘,南京某大學英語系大四學生,參加譯后編輯(基于機器翻譯結果作人工優化)培訓2個月,她的感受是“譯后編輯很大程度上提高了翻譯的效率,但是會對譯者的翻譯的風格和思維有一定影響和改變”,工作效率從初每小時完成2件任務提高到了3-4件,兼職月收入達到了3500元。
24歲水瓶座孫青青姑娘,河北某大學商務日語系畢業,對譯后編輯的感受是“比如有些句子比較難懂,句子結構組織起來比較困難,機器譯文起到了好的提示作用”,培訓半年后轉為全職譯員,一小時穩定完成4件,月收入超過1萬。
第三位是25歲的白羊座小伙子小韓,大連外語大學日語畢業生,他說“有的機器翻譯只需調整語序即可,跟純手動翻譯相比,極大地提高了翻譯效率和準確性”。他的效率是一小時完成5件,兼職做翻譯月收入9千元。
從受機翻結果影響,逐漸到以機翻結果為主做優化,譯后編輯的譯員的工作方式和傳統人腦翻譯、詞典輔助的模式有很大區別。他們的工作流程發生了明顯變化,從90%的時間進行逐字逐句翻譯,轉變為超過一半的時間來理解術語和機翻結果,真正動手“翻譯”句子段落的時間僅為過去的小一半。結果是“翻譯”時間越少的譯員,效率很高,收入也很高。
2015年第四季度,麥肯錫全球研究院發表報告《如何利用AI重新定義工作》,開篇的一句話就是“隨著體力工作和知識工作自動化的進步,許多工作至少在短期內,會被重新定義而不是被消除”。我們在譯后編輯譯員身上看到的是機器翻譯并沒有改變翻譯職業,但是新的流程卻改變了譯員。譯員在工作中術語的選擇、詞句段落編排等過程在系統中都被記錄下來供機器學習,譯員是語言數據和系統的使用者,也是數據生產者。有效的狀況可以被描述為:譯員是機器翻譯的研發和生產的延伸,其思維和行為被技術化了。
好的一面,麥肯錫的報告說“到2025年將有50萬億美元的價值會被人工智能和機器人創造出來”,壞的一面則是有些譯員會覺得不適,不適應的結果是拿不到好工資甚至新的翻譯工作不需要Ta,可能被批評為反人性。我自己倒是覺得不能說帶個大頭盔看VR的技術是人們喜聞樂見,而改變思維、工作習慣的譯后編輯是不人道的,就像上個世紀初把走路變成踩油門、把方向盤的開汽車一樣?!叭藱C鏈接”無法實現的時候,“人機結合”是人與機器之間有效的合作方式,也是一個更準確、讓大眾更安心的用詞。
與譯后編輯類似的場景,出現在醫療大數據的應用里。醫生診斷時,能看到的是機器給出來類似的病例和對應的診斷匯總,也許還給出狀況接近案例的診斷處方推薦。機器不會直接給人看病,醫生和譯后編輯譯員一樣選取Ta中意的參考再給出診斷。不過人們對此的擔心少很多,“醫生為自己的診斷書負責嘛,機器干不了這個事?!?
億級需求
新的互聯網翻譯還有一條路徑是屬于共享經濟的社會化生產,國內外的翻譯行業誕生了很多眾包翻譯服務平臺,但是效果堪堪,一直沒有實現期待中的結果。原因是眾包平臺為需求匹配到合適譯員的成本,高于網絡眾包生產的效率收益,生產過程和結果的非標準化帶來的工程管理成本更高了。
就在為眾包困局很困擾的時候,我與中國很大的非標服務眾包平臺豬八戒網的朋友有過幾次深入的交流,雙方達成的共識很特別:服務眾包的核心在于供應端,而不是互聯網經濟的主流思維“客戶一、需求至上”。豬八戒網的一個主要品類“建筑設計”,包括供應商的招募、生產和質量、客服等的運營管理交給了豬八戒與設計行業某上市公司的合資公司來打理。
翻譯也是一樣,個人、企業和機構的需求時刻都存在,但是中國超過3萬家提供“翻譯”服務的公司,很大的年收入只有3億元,規模狹小甚至還不夠成為一個行業,而大部分的需求沒有被好好滿足,譯員該掙的錢掙不到。行業短板非常明顯:小規模、幾個兼職譯員的公司用師傅帶徒弟的作坊生產方式,能提供的服務能力有限,更談不上質量、客服標準化。
由機器來統一基本勞作規范,完成部分翻譯量,組合大量譯員完成剩余優化任務的模式,有望推進輾轉不前的眾包翻譯來完成行業的跳躍發展。發展動力的基礎是機器翻譯,其實更主動的是人(譯員)。譯員在理解和使用機器翻譯輔助軟件,改變翻譯習慣以更好使用機翻結果,不同學生的可塑性不一樣,導致工作效率和收入的差異。因此翻譯的人機結合催生了一個重要的學習培訓需求,其教學過程甚至是重新探索了譯后編輯這個職業的從業標準。
翻譯服務能否從小作坊升級到互聯網上的富士康? 我看不出不能的障礙在哪里。計算機技術工具&大數據學習,基于互聯網平臺管理、培訓和生產,以及中國少有的全語種外語教育體制和數量一的外語人才儲備,地利和人和都在了,下面看看市場需求的天時到沒?
全球化的深入不再是只有部分人出國觀光,從吃買玩,到投資學習工作,乃至生老病死都不會是局限在出生國家的事情。圣經里上帝讓各族人說不同語言的設計制造了天成的剛需,多語言交流需求不是敢不敢想,而是能不能做的問題。它意味著產能巨大、穩定和低成本的翻譯服務,滿足這一需求的新翻譯生產方式,一定是包含了機器翻譯軟件、基于互聯網的供需眾包和協作生產、以及譯員用以學習、分享的互聯網社區培訓平臺。
能不能讓淘寶、亞馬遜的商品全部被不同國家的顧客直接看懂,讓中國的股民了解所有紐交所、納斯達克股票交易的信息和后面的公司行業資訊,讓國內外新發表的論文文獻同步多語言出版,讓美國很大的醫訊網站整站的優質內容占領目前被莆田醫生籠罩的中文網絡?使用谷歌、有道免費翻譯工具自助閱讀的人越來越多,這顯然不會是互聯網社會大規模多語言交流的先進方式——如上面所說,缺點太明顯,對用戶的知識、技能挑戰過高,只是因為免費才可以容忍。
擁有行業和外語知識人士提供的專業翻譯服務的需求會更旺盛——只要價錢合適;更重要的是合格的翻譯能力才能對接有質量要求的商業內容,促成有利潤的商業項目。翻譯服務體量從每單幾百元、上千元,提升到每單幾千萬、上億元,成本則下降40%-80%。二十年的互聯網經驗告訴我,一個互聯網項目億元的運營成本不可怕,投資人和運營人擔心的是每年數億元的投入能否帶來倍增的收益。翻譯僅僅是打破語言障礙的一步,進一步的知識管理和服務,是信息里蘊藏的更大金庫。
從這個邏輯來說,人機結合的翻譯花得起億級的錢,也掙得到10倍以上的收入和可觀的利潤,它在抄過來的路上。
本文轉自:英國《金融時報》中文網“商業”專欄,作者系商鵲網聯合創始人、首席執行官鄒劍宇 。本文僅代表作者觀點。