作者:复旦大学哲学学院教授 徐英瑾
复旦大学外文学院教授陆谷孙先生,最近不幸因病医治无效而辞世。我不是学习英语专业的,但因为关心与机器翻译相关的人工智能哲学问题,故而平素也较为留意陆先生发表的一些真知灼见。
陆先生于2015年发表过一篇讨论翻译技巧的短文。文中指出,翻译要讲求做到“飞跃”与“抵达”,即飞跃源语言与目标语言之间的文化隔阂,准确抵达目标语言中相应文化气场中的那个“着陆点”。因为不同的待译文本具有各自的文化气场,所以译者就需要根据语境的变化机敏地选择最恰当的“飞跃路线”,在译文生成过程的终端实现最顺当的“文化软着陆”。
陆先生举过一个案例,来说明这种“飞跃”与“抵达”。某出版社曾咨询陆先生,如何为一篇题目为《租界》的中文小说,安上一个妥贴的英文标题。直译当然是“The Concession”,但陆先生读完小说发现,作者说的是发生在旧上海法租界的故事,所以就译为了“In the French Concession”,并用“in”强调了租界本身只是故事发生的场所,而非小说的真正描述对象。尔后,出版社又改了主意,觉得题目应当换成小说主人公的名字,即“中国排骨”。这又怎么译成英文呢?陆先生觉得,若直接译为“Chinese ribs”,洋人肯定会误认为这是菜谱,而“排骨”在汉语语境中所具有的“纤弱秀气”意思就全丢净了。或许其意思更接近于“Bony Green Knight”吧,但此词带有中世纪色彩,放置到小资味浓郁的上海租界语境中,有点关公战秦琼的违和感了;翻译为“Bony She-Man”则脂粉气过浓。根据陆先生的描述,他就像直升机一样在作为对象语言的英语领地上空盘旋,为寻找一处最佳的着陆点而费心烦神。
可见,面对此类高度复杂的翻译任务,译者需要付出极大的心智努力才有可能呈现信、达、雅的译作。其间的脑力付出,有时甚会至远远超出用母语进行思想原创。面对如此艰巨的脑力任务,做人工智能研究的工程师或许会“想入非非”:倘若能够根据陆先生的翻译精神编制一种程序,让机器自动进行文本翻译,该有多好啊?
凡事都是“说易行难”。现有机器翻译的主流思路,分为“符号进路”与“统计进路”两种。很可惜,这两种进路都无法忠实地落实关于“飞跃与抵达”的翻译经验谈。
先来看“符号进路”。按此进路,在机器翻译中可以先做一个巨型双语语料库,并凭借现有的双语翻译词典,搭架起一座桥梁。更精细的建模工作,甚至还要求对个别词汇进行语义框架构建。譬如,“排骨”这词的框架,就自带有与诸如“猪皮”“高汤”“蹄髈”之类词汇相关的推理关系表征。这样,系统一旦触发一个特定词汇,就会形成与之相关的语义框架,并由此使得一些简单的语义推理成为可能。
然而,对于“符号进路”的机器翻译路径而言,需要编程员预先对大量双语语料对应关系及各个词汇自身的语义框架进行建模。工作的繁琐度就不提了,其不灵活性更是一个致命伤。具体而言,信息再完备的此类系统,也很难对前面提到的“中国排骨”这样古怪的词语进行准确的信息解码。通常状态下,若不对整部小说有一定了解,恐怕就只能被译为“Chinese ribs”这样的菜名了。但是,对于现有的翻译系统来说,对整部待译小说进行“宏观把握”,却是一个几乎不可能完成的任务。
再来看统计学机器翻译路径。它是由所谓“深度学习”系统来实现的。概而言之,“深度学习”是一个升级版的人工神经元网络系统。其基本工作原理是,在亚符号层面上将语义对象解析为一个复杂的特征簇,然后通过神经元网络的多层次加工,从中逐层将高阶语义重新构造出来。照此进路,一个诸如“排骨”这样的词汇,其原始形态只有数学特征、没有语义特征。由于允许系统对语义相似关系作出模糊处理,因而其灵活性显然超过“符号进路”系统。
不过,与陆先生的翻译智慧相比,“深度学习”网络的火候还差得远。且不提此类系统的运行所需要消耗的大量计算资源,光在一个问题上就完败了:它必须有大量的训练样本,以帮助其在一类源语言词汇与另一类目标语言词汇之间预先搭建起大致的相关性关系簇;然后,它才能够依循成例,摸索出与之比较接近的“跨越方式”。但是,像陆先生那样进行创造性“跨越”的大本领,此类系统还是学不来的。
这是不是意味着陆先生的翻译智慧,任何机器都无法模仿呢?我当然也不这么悲观。现有的机器翻译进路之所以有问题,与其说是因为超级人工智能不靠谱,还不如说是业内人士太满足于玩弄工程学层面上的“奇技淫巧”了,不爱琢磨学理层面上的抽象问题。
考虑到这一点,机器翻译就不宜作为一个单独的研究项目“孤军深入”,而应当成为人工感知、类比推理机制等相关领域内的研究成果的衍生产品。这一条新进路,在国际上一般被称为“通用人工智能”。或者说得更通俗一点,按此新进路,人工智能专家与其模仿陆先生的资深翻译能力,还不如先去模仿陆先生咿呀学语时的“通用智力”,然后再求日益精进。此路看似曲折,实际上才是人工智能研究之“正道”。