xulihang's blog 2019-10-11T15:11:51+00:00 xulihanghai@163.com 语言符号与意义 2019-10-11T14:46:50+00:00 xulihang blog.xulihang.me/words-carrying-meaning 语言学之父索绪尔指出语言符号具有任意性,它的意义是和其它符号一起出现时才能表示出来,比如dog之所以是指狗,是因为cat、pig这些词不表示狗。

但有些语言符号其实是和意义有关联的,这类词叫做表意词(ideophone),它的发音或者形状和人感官感受到的内容相符合。比如zigzag,反映了弯弯曲曲的形状;bang则是拟声词,表示碰撞。

语音表义现象(sound symbolism)专注和发音有关词,主要有以下几种分类:

  1. 拟声词(Onomatopoeia),比如汉语的喵。
  2. 聚合(Clustering)。有相同前缀或者后缀的词,它们有相似的部分发音,而且意思也有关联,比如glare、gleam、glow都和光有关联。汉语的声旁应该也算这一类。
  3. 形象(Iconism)。在p前面加上m,可以是动作变得有力,比如step->stomp、tap->tamp。添加字母r可以给单词添加动态效果,比如tamp->tramp。
  4. 拟态词(Phenomimes)。日语中存在大量拟态词,比如くたくた(kutakuta)形容疲惫的样子。

这类词是如何被创作出来的,在创作过程中怎么就遵循了这类规律,提出语音表义的Margaret Magnus觉得似乎是上帝的安排。

参考文献

https://en.wikipedia.org/wiki/Sound_symbolism

]]>
翻译与音韵 2019-10-11T11:19:50+00:00 xulihang blog.xulihang.me/translation-rhyme-and-rhythm 前一天在网上找到了SQ的英文版,看到一条用户的评论:

@justanothermanganerd: holy shit I wish there was a good full picture of trickery detected with just that bubble and no speech

对应的原文图片(链接):

译文图片(链接):

哇,果然很有感觉!

然后我想“发现有坑”应该怎么翻译。

坑要说也是一个网络流行语,比如挖坑、填坑等等。坑的引申意思就是让人深陷其中的东西,如果要翻译成英文,直译可以是pit,引申一下就是陷阱:trap。

发现有坑,如果翻译为日语:罠を発見した,感觉很顺畅。

那翻译为英文呢,Found a trap?首先句式得调整,改成Trap Found,但似乎没什么味道。

把Found改成译文中的Detected:Trap Detected,感觉好了很多。但还是译文的Trickery Detected更好。

仔细观察后,我觉得Trickery除了能突出诡计这一意思,还和detected的发音相匹配,两个都是3音节词。语言毕竟是要念出来的,如果能朗朗上口,给人的印象也更深。

不过我觉得主要是英语太难听。法语和日语,元音和辅音的比例接近于1:1,而英语的辅音比例要高得多。

文学性质的翻译通常更讲究音韵,用哪个词不免要推敲一番。

有一个网站叫rhymezone,可以用于查找和某个词押韵的词。除此之外,还能查看其释义、在维基百科和诗词中的示例、发音相近的词、同音异形词、同义词反义词、相关联的词、短语等等。不过我在搜ebony时没有显示ivory,可能还是有不完善的地方。《Ebony and Ivory》是一首歌的名字,在《老友记》中出现过。

本科上翻译课时,老师给我们讲抑扬格、头韵尾韵中间韵,我是从来没怎么听懂,对这些不感兴趣。但其实当自己尝试去创作时,会发现这些知识还是有用的。

]]>
平行文本对齐 2019-10-05T08:00:50+00:00 xulihang blog.xulihang.me/parallel-text-alignment 平行文本,指存在对应关系的原文及其译文。

平行文本对齐,主要是将对齐的粒度细化。比如原来是篇章对齐,现在要进一步对齐到段落、句子甚至是单词。

文本对齐可以基于各种信息,比如以一行原文、一行译文保存的Word文档,可以比较容易地基于这一特点做段落对齐。比如漫画,文字是存在于气泡中的,对齐文本相当于对齐气泡。比如字幕,句与句之间一般有时间间隔,可以根据时间轴信息做句子的划分。

下面再讲一下句对齐。

Gale & Church 算法1假设文本已经做好了段落对齐,原文句子和译文句子存在6种对应关系,增加、对应、删除、一对二、二对一。这就类似于编辑距离的计算,两个文本之间有增加、替换和删除三种关系。该算法主要根据句子长度来确定转换关系。具体的介绍可以看此文

hunalign 对齐工具使用了上述算法,并且结合了词典信息,它有一个桌面版的前端叫做LF Aligner

Bleualign借助机器翻译的结果进行对齐。使用机器翻译的目的是用目标语表示原文的大概意思,然后和译文进行比较(通过修改版的bleu得分)。

另外还可以参考特殊字符,可以当做对齐时用的锚点,比如各种数字。

实际任务中使用得多的常见工具:

  • SDL WinAlign(内置在Trados里)
  • ABBYY Aligner
  • TMXMall
  • 雪人CAT
  • OmegaT(内置了对齐工具,使用维特比算法和前向-后向算法)
  • BasicCAT Aligner

我写的BasicCAT的对齐工具原理很简单,首先进行段落对齐,然后根据SRX断句规则进行断句,如果段落的句子数量不一致,就用空白片段填补。提供手动调整的功能。

这有一篇句对齐的集合贴:Getting started with sentence alignment

再讲下短语和词这样亚句级的对齐。这通常用于统计式机器翻译当中。它一般使用的无监督机器学习的方法,通过观察文本,得出词之间的概率关系。2

词和短语的对齐还可以用在双语语料库的检索时高亮显示原文对应的译文,以及CAT软件从翻译记忆中提取有用的片段翻译(Trados的upLift功能)。

参考文献:

  1. William Gale, Kenneth Church. A Program for Aligning Sentences in Bilingual Corpora 

  2. https://en.wikipedia.org/wiki/Bitext_word_alignment 

]]>
互文性 2019-10-03T11:58:50+00:00 xulihang blog.xulihang.me/intertextuality 什么是互文性

互文性(intertextuality)是由保加利亚裔法国语言学家,克里斯蒂娃(Julia Kristeva),在巴赫金的对话理论基础上提出的。

在1969年的《符号学》一书的《词、对话、小说》(Word, Dialogue, Novel)一文,她给出了如下定义:

any text is constructed as a mosaic of quotations; any text is the absorption and transformation of another.

翻译:

任何文本就像马赛克铺的墙一样,一片片“引用”就是组成它的马赛克;任何文本都是对另一文本的吸收和转化。

具体来说,一个文本是和其它文本相关联的,读者要了解一段文本的含义,需要去了解相关的文本,受到所处的社会和时代环境的影响。文本不是不变的,它被读者吸收后,又能生成新的文本。

互文性通常体现在以下几种形式:引喻(allusion)、引用(quotation)、仿造(calque)、抄袭(plagiarism)、翻译(translation)、模仿(pastiche and parody)。1 当然也可能体现在其它细微的方面,比如某个语篇类别下的文本有独特的风格。

宏观层面的例子:乔伊斯的《尤利西斯》的故事改编自《荷马史诗》。

微观层面的例子:He was lying so obviously, you could almost see his nose growing.(说谎的人鼻子会变长,来自匹诺曹的故事)

互文性中的文本可以不单单指文字,还能引申到其它形式,比如绘画、电影等等。很多电影中的经典桥段,台词,在后续的作品中得到引用,这也算是互文。更多例子可以看这个视频:What is intertextuality? Media concept explained!

Youtube上一个叫Uplife的频道对什么是互文性有更详细的介绍:WHAT IS INTERTEXTUALITY? LITERARY THEORY COURSE

互文性与翻译

翻译由理解和表达两个过程组成2,译者首先是原文的读者,需要自己构建原文的意义。之后,译者又变成了作者,用目标语将自己获得的意义表达出来。理解过程需要译者查阅相关文本,而生成过程,也需要译者阅读相关文本,目的是了解这类文本的文体特点、相关概念和表达。原文和译文本身也构成一对互文关系,但往往因为语言和文化因素存在不可译现象。

功能语法学派

Hatim和Mason在《语篇与译者》(Discourse and the Translator)中对互文性的引用做了具体的分类:

  1. 来源有说明的引用。
  2. 陈词滥调。
  3. 引喻。
  4. 自引。
  5. 固定表达。
  6. 习语

以及:

  1. 类别相似,比如商务信函
  2. 主题相似,比如讨论日本原子弹
  3. 结构相似,比如复合词Reagonomics
  4. 功能相似,比如对不起和抱歉

同样的文字,可能是对不同文本的引用,译者要根据具体情况,从语篇目的的角度选择翻译方法。

模仿(parody)是体现互文性的一个形式。比如我们要翻译这样一句话3

饭后百步走,能活九十九

这是关于健康的一则短语,我们可以想一下,英文中是否有类似的表达,而且语篇类型相同。

我们可以找到这一表达:

An apple a day keeps doctors away

我们模仿这一表达,可以得到以下译文:

100 steps after dinner keeps doctors away

互文性能给翻译提供一定的指导,不过如何找到相关联的文本需要长时间的积累才行。

相关人物与名词

  1. 索绪尔,现代语言学之父。他提出了“所指(signified)”和“能指(signifier)”的概念,“所指”即语言所指代的事物,“能指”指具体的文字或者声音。两者需要结合起来才能形成符号(sign)这一概念。他也开创了符号学。
  2. 结构主义。我们要从整体来看待问题,并发现结构之间的相互关系。语言学的例子就是符号是由能指和所指组成的。
  3. 后结构主义。后结构主义和结构主义唱反调,认为不存在固定的结构,意义是不确定的。
  4. 巴赫金的对话理论。对话理论和互文性的概念基本相同,只是后者更专注与文本。以下是它的一个观点:说话者所表达的话语不可避免的和之前所用的话语和语篇在某种程度上发生联系。而且,这些话语也和后面的回应保持关联。4

互文性与文献阅读

在阅读互文性相关的文献时,我也深深体会到了互文性。

我在看克里斯蒂娃的那篇《词、对话、小说》时看得一头雾水。因为这篇文章是对索绪尔、巴赫金等人的理论的一个阐释和延伸,使用了很多专业术语,什么狂欢文本、二值性、所指能指等等,而且使用的学术语言,非常难懂。为了读懂这一篇文章,我得去看很多其它的文章。文本的意义是由自身和相关的文本共同组成的。

史忠义翻译的《符号学:符义分析探索集》基本是直译,并附带了很多译注,不是很容易看懂。董小英的《再登巴比伦塔 巴赫金与对话理论》,因为是用中文原创的,有很多中文的例子,相对好懂很多。

但在我看来,关系复杂、内容艰深的学术文献文本给自己构建了一道门槛,外人很难一窥究竟,所幸我不是这方面的学术研究者,只需借鉴理论来指导实践即可。

参考文献

  1. https://en.wikipedia.org/wiki/Intertextuality 

  2. 祝朝伟. 互文性与翻译研究[J]. 解放军外国语学院学报, 2004, 27(4). 

  3. 何飞. 互文性理论指导下的汉英翻译教学研究[J]. 安徽工业大学学报(社会科学版), 2018(02):78-80. 

  4. 王春宇, 娄德平. 巴赫金对话理论研究[J]. 北方文学:下, 2016(2):107-108. 

]]>
个人发展 2019-10-02T11:56:50+00:00 xulihang blog.xulihang.me/personal-development 个人发展(Personal Developement)是一个专有名词,通常包含以下活动:提高自我意识,实现个人才华和发挥潜力,实现愿望或加强身份等等。 1 个人发展并不单纯是自我帮助(self-help),它还包括人与人之间互相帮助,比如瑜伽老师教导学生。

之前玩Dweep时打开了该游戏制作公司的链接,发现跳转到了一个关于个人发展的博客。当时还是第一次知道这个概念。现代的人常常淹没在不断发展的社会中,看不清自己存在的意义,也不清楚该如何做好个人发展,因为社会的压力而感到焦虑,个人发展似乎是一个有趣的话题。

我打开的这个博客是一位叫Steve Pavlina的人写的,他的这一个人发展的博客非常知名。17岁前,Steve Pavlina受家人影响,信仰天主教,但后来成为了一个无神论者。他被加州大学伯克利分校录取,但并没有好好学习,反而偷窃上瘾,差点因为大额盗窃罪判刑两年,好在当时法院以为他是初犯,只判了他两个月劳动改造。这次偷窃被捕是一次转折,因为他之前的价值观(context)被打破了,他意识到偷窃是不对的,他需要做出改变。此后,他用三个学期完成了加州州立大学计算机科学和数学的双学位课程,并创建了游戏公司,发布游戏。在2005年,他转行做个人发展的博客。

Steve Pavlina有一个系列文章叫做《人生的意义》(The Meaning of Life),涉及到个人发展的许多问题,主要分为六个部分:

  1. 介绍。
  2. 我们如何生活。
  3. 如何寻找目标。
  4. 将目标付诸行动。
  5. 转型。
  6. 意识进化。

这系列文章总的来说还是比较啰嗦的,而且成文于2005年,不过有很多的观点还是很有启发意义。

第一部分作者主要介绍自己的生平经历,阐述价值观和意义对人的影响。

第二部分讲我们该怎么活,我们为什么活。他介绍了古希腊哲学家亚里士多德提出的Eudaimonia。这词一般翻译为happiness,幸福感。具体而言,主要指做符合道德的事情,经常内省。但还是很模糊,具体该怎么做呢?作者给出了8种值得拥有的品德:诚实、关爱、勇气、公正、贞洁、牺牲、高尚、谦虚。然后,就人生的最优解问题,他把人的发展比做爬山,最高的山峰即最优解。但人所在的区域太大了,没有办法一下子找到那座最高的山,只能先爬上一座眼前较高的山。但并不是一定要爬上每座山,因为人有想象力,可以想象之后发生的事情,想象最适合自己做的事情。对于作者来说,他认为最值得他做的事情就是帮助人类进化,发展自己,帮助别人发展。

第三部分讲如何寻找目标。目标通常需要内省去发现。作者给出了一个20分钟罗列目标,直到有一种发现自己目标后想哭的冲动的方法以及一个根据自己的环境和价值观进行推理的方法。

第四部分讲如何付诸行动。主要涉及时间管理、计划制定、情绪调节等各种方法。如果目标设定合理,应该大胆去做。有人会有这样的顾虑:觉得事业、爱情、健康不能兼顾。其实这几者都是互相关联的,只有健康了,才能好好工作,工作稳定了,可能能有更多时间陪对象。

第五部分讲转型。人的目标不是一成不变的,周边环境和价值观变化后,你可能想做一件全新的事情。比如作者从游戏发布者转型关于个人发展的写作和演讲者。他给出了很多建议,比如彻底改变生活的环境、交往的人。

第六部分讲意识的进化。人生物学上的进化已经趋于稳定,但人有改变自己意识的能力。过去的很多观点是错的,人们需要自主地去让自己的意识进化。

人生的意义其实是一个哲学问题,我之前的文摘就介绍过存在主义哲学的观点。人的出现是一个偶然,人的意义是由自己来定义的。

个人发展领域有很多新的概念和方法可以帮助我们不断成长。不过我们还是要专注于实际的事情,毕竟它的很多内容是通用的内省法,如果只花时间在想,而不去做的话是不能实现个人发展的。个人发展这一概念本身是引进自西方的,我们要结合自己的情况去吸收好的部分。市面上有很多相关的书,不少是基于商业化的目的,也要批判地去阅读。

参考文献:

]]>
配眼镜 2019-09-30T11:35:50+00:00 xulihang blog.xulihang.me/how-to-buy-glasses 我初一配的第一副眼镜,到现在也已经12年了,但是我还真没有好好研究过配眼镜这件事情。以前都是去眼镜店,跟着爸妈在店员指引下配的眼镜。如今在北京,我一个人去配,被店家坑了才发现配眼镜也是挺讲究的一件事情。

去实体店配眼镜的流程一般是这样的:

1. 挑选眼镜架。

一般来说,眼镜架的形状要和脸的形状匹配,并且大小和脸的大小匹配。一般半框、全框眼镜适合大多数人和使用场合,圆形会让人显得柔和与可爱。眼镜太大会遮挡面部,一般眼镜上沿不应该遮盖眉毛,眼镜太小,则显得脸和眼镜的比例不协调。眼镜的尺寸也会影响镜片的厚度,一般度数高的话还是得配尺寸小的,对脸部的变形效果也可以不那么明显,但是尺寸小对视野有影响。这时还是推荐长方形的眼镜,和眼睛的形状匹配,小的圆框做出来视野容易受影响。

其它还有眼镜边框的粗细、颜色和细节设计等等。不过规则都是可以打破的,比如哈利波特长大后脸变方了,但戴着圆框眼镜还是很好看。

就我个人而言,我是椭圆脸,理论上各种形状的眼镜都合适。长相秀气,但一字粗眉又增加了一丝硬朗,可以选择和眉形匹配的半框眼镜,增加一分英气。

大多数人不是明星,日常生活还是选择正常一点,看上去舒服的就行。去店里挑眼镜可以多试几款,最好找人陪着。另外最好戴隐形眼镜,不然看着模糊的自己会把自己美化500%。如果找不到合适的就不买,不要不好意思,可以去别的店或者网上再看看。

镜架的常见参数:镜片宽度、镜片高度、鼻梁长度、镜架长度

材质:钛、不锈钢、tr90

2. 配镜片

验光其实找眼镜店的专业验光师不见得比医院的差。

一般流程是上验光机测合适的度数,测瞳距。另外会确定哪只眼睛是主视眼,一般主视眼的视力要好一点,那么主视眼的矫正视力也可以稍好一点。

镜片的差价很大,有几十的也有几千的。一般有条件还是买品牌的,像依视路和蔡司有防伪标识,容易辨识是否是正品,高档镜片透光好,还有多种镀膜。

镜片的折射率会影响镜片厚度,度数高的话,如果要保持镜片边缘薄,就得提高折射率。

镜片材质现在一般是树脂,玻璃材质易碎,但是折射率高。

眼镜行业的水深,我这里也只是讲一些目前我知道的注意事项。最近网上找了一家丹阳眼镜店,花了68元配了一副,感觉也挺清晰,而且第一次戴也不晕。

附一张戴着板材眼镜的小哀:

参考资料:

]]>
漫画翻译的难点 2019-09-29T12:08:50+00:00 xulihang blog.xulihang.me/comics-translation-the-difficulties 符际翻译

漫画的特点是文字与图像结合以传达语义,很多时候我们要做符际翻译,而不是单纯的文字转换。比如画面中蜘蛛侠撞断了柱子,这时英文使用了自己创造的拟声词rnchh。这时翻译就不是文字的转换,而是将图像表示的内容用目标语来表示。结合语境,我们这里可以翻译为砰。

关于拟声词的更多内容可以见此文:漫画翻译之拟声词

口语文本

漫画文本多是人物的对话,属于口语语体,语言可能不规范,会使用很多习语。

如果译者不是目标语母语者,那很难保证翻译的地道性,而且理解原文的含义也不是一件容易的事情。

我们可以看一下这个Calvin and Hobbes的例子,中文版由MaxPayen999翻译。

Calvin问一些奇怪的请求,目的是想让妈妈给他饼干,但是妈妈看穿了他的小心机。这里用到了一个习语:be on to sb,表示看穿某人。

MaxPayen999的翻译版本并不贴切,应该是对这一习语不够熟悉。

幽默

这里的幽默主要是一些文字游戏。因为和语言本身息息相关,直接翻译就会失去效果,这时往往需要译者自己想出一个好的笑话。

这里引用Killing the Frog — The Challenge of Translating Jokes的一个例子。

其中一个角色向另一个角色问类似脑筋急转弯的问题。图中的问题是,什么虫子总是摔倒。

いつもころんでいる虫はなんだ

答案是

テントウ虫(天道虫,即瓢虫)

这里的日语,天道和転倒(表示摔倒)的发音相同,都是tentou。但是你要翻译成中文瓢虫就没有这种效果。

这篇文章的作者自己想了一个版本:

“What kind of bug is always spinning?” “a spider!”

]]>
漫画的形式 2019-09-29T08:48:50+00:00 xulihang blog.xulihang.me/comics-forms 漫画的分类方法有很多,有按题材、按读者、按篇幅等各种分类方式。

本文主要讲漫画有哪几种形式。

  1. 单幅漫画

    时局图具有讽刺意义。

    古代的水墨画常常有配上诗文,和画面交相辉映,丰子恺的漫画作品采用了这一形式,但内容更加朴实、生活化。

  2. 连环漫画(comic strips)

    这类漫画通常登载在报纸,图为Calvin and Hobbes以及《一支驳壳枪》。

  3. 短篇或长篇故事

    这类多以漫画书或者漫画杂志的形式出现。美国漫画书(comic book)比较多,欧洲和日本的漫画多登载在杂志上。图为《哆啦A梦》。

  4. 在线漫画

    传统的漫画多是根据报纸、书的大小进行制作的,一页有很多的分格,叫做格漫。而随着智能手机的出现,出现了可以无限下来的竖状漫画,叫做条漫。

    条漫最初是在韩国流行的,英文叫做webtoon。微博上的很多漫画,比如《一条狗》、《SQ》也都属于条漫。

    SQ示例:https://weibo.com/1300957955/I4NDou3CK

]]>
漫画翻译概述 2019-09-29T07:54:50+00:00 xulihang blog.xulihang.me/understanding-comics-translation 本文是一个漫画翻译相关文章的集合。

什么是漫画

《Understanding Comics》1给出的一个简单的释义是一种具有顺序的艺术(Sequential Art),但漫画的定义一直是一个值得争论的问题。

现代汉语中的漫画一词还是由日本引进的,指比较随意的绘画形式,而后来它的含义也延伸到用图像表示的长篇剧情故事或者具有讽刺意义的图画。2

这篇文章就几种漫画的形式给出了具体的示例:漫画的形式

漫画的制作流程

漫画一般先由编剧写好脚本,然后由插画师进行绘制,当然也有编剧和绘画是一个人完成的,国内很多漫画都是这样。

漫画翻译之漫画脚本

漫画排版

排版和漫画形式有关,比如条漫和格漫,可以参见上文给出的链接。

这里再列出和文字排版相关的内容。

STEAM教你漫画排版

美漫嵌字的文法和规范

漫画翻译的流程

一般网上的漫画都是做的扫译,就是爱好者扫描纸质版,然后把翻译的版本免费发布到网上。

这时一般流程是修图(去噪,擦去原文)-翻译-校对-嵌字。

如果是做的正版漫画,有原始文件,比如idml、psd和ai则会方便很多。

文字提取和替换可以参见此文:漫画翻译之文字提取与替换

漫画翻译的特点

漫画翻译的难点

漫画制作工具

  • Adobe InDesign,用于漫画书
  • Adobe Illustraror,用于适合出版的漫画图像制作
  • Adobe Photoshop,通常用于在线版漫画,国内作品用得多一点

漫画翻译工具

  • LabelPlus,译员在漫画的文字区域进行标记并翻译,之后可以利用脚本生成PSD,在对应的文字区域添加文字。
  • mangaEditor,能够自动识别气泡并擦除里面的文字,提供有限的嵌字功能。
  • ImageTranslate,图片翻译工具,能自动识别文字区域并遮盖原文,手动调整字体,支持OCR和机器翻译,翻译和排版紧密结合。
  • 秒翻picpaw,功能和ImageTranslate类似,国人出品。
  • ImageTrans,自动识别文字区域和气泡,支持OCR和机器翻译,支持手动调整,使用文字识别、翻译和排版相分离的模式,可以导出PSD供后期修改。

在线漫画平台

  • 腾讯动漫,腾讯是很多日本漫画的正版发布平台。
  • 有妖气,有妖气是做得比较早的国内原创漫画发布平台。
  • mangarock,原先是扫译版漫画的集中平台,现在转型做正版漫画。
  • tapread,纵横文化的海外版,发布从中文翻译过来的网文和漫画。

相关链接

参考文献

  1. Scott Mccloud. Understanding Comics: The Invisible Art. 1994 

  2. 漫画一词的意义变化:https://blog.xulihang.me/meaning-changes-of-the-word-manhua/ 

]]>
混合主动交互模式 2019-09-23T09:09:50+00:00 xulihang blog.xulihang.me/mixed-initiatives 混合主动(mixed-initiative)是一种人机交互的模式,在完成任务的过程中,人与机器会互相给出意见并主导任务。有混合主动模式,那也有不混合的模式,即人或机器占主导地位的模式。

用对话的例子比较好说明,比如两个人要去吃饭,如果是一方主导:

小张:我们周五晚上去吃饭吧?
小李:好啊。
小张:我知道五道口有一家不错的火锅店,去那里吧?
小李:好啊,那就这样定了,周五再联系。

如果是双方互相给意见:

小张:我们周五晚上去吃饭吧?
小李:好啊,去哪里吃呢?
小张:我知道五道口有一家不错的火锅店,去那里吧?
小李:我想吃清淡一点的,我们去XX吧。
小张:好啊,那就这样定了,周五再联系。

混合主动的概念虽然是70年代提出的,但定义和用法一直比较模糊。在1999年的SIGCHI人机交互小组会议上,微软研究院的Eric Horvitz介绍了他们总结的混合主动的设计原则,并给出了一个叫做LookOut的程序作为例子。这一设计原则可以让自动化程序和人有机结合起来。

以下是设计原则的英文和对应的译文:

  1. Developing significant value-added automation. It is important to provide automated services that provide genuine value over solutions attainable with direct manipulation.

    开发能添加价值的自动化。 自动化服务需要提供真正的价值,并能供用户直接操作。

  2. Considering uncertainty about a user’s goals. Computers are often uncertain about the goals and current the focus of attention of a user. In many cases, systems can benefit by employing machinery for inferring and exploiting the uncertainty about a user’s intentions and focus.

    考虑用户目标的不确定性。 计算机常常不能确定用户的目标和当前的关注点。在许多情况下,系统可以通过某种机制来推断和使用用户目的和关注点的不确定性。

  3. Considering the status of a user’s attention in the timing of services. The nature and timing of automated services and alerts can be a critical factor in the costs and benefits of actions. Agents should employ models of the attention of users and consider the costs and benefits of deferring action to a time when action will be less distracting.

    服务触发时机需要考虑用户的注意状态。 自动化服务和提醒的性质和时机可能是操作的是否有用的一个关键因素。Agent应该使用用户注意的模型,并考虑将操作推迟到分散用户较小的注意力时的效益。

  4. Inferring ideal action in light of costs, benefits, and uncertainties. Automated actions taken under uncertainty in a user’s goals and attention are associated with context-dependent costs and benefits. The value of automated services can be enhanced by guiding their invocation with a consideration of the expected value of taking actions.

    根据效益和不确定性,判断理想的操作。 在用户目标和注意不确定的情况下采取自动化操作的效益与操作的场合相关。自动化服务的价值可以在考虑操作的预期价值的前提下,通过适合的调用机制来得到加强。

  5. Employing dialog to resolve key uncertainties. If a system is uncertain about a user’s intentions, it should be able to engage in an efficient dialog with the user, considering the costs of potentially bothering a user needlessly.

    使用对话框来解决主要的不确定性。 如果系统不确定用户的操作意图,它应该能用一种有效的对话机制和用户互动,并考虑是否有必要打扰用户。

  6. Allowing efficient direct invocation and termination. A system operating under uncertainty will sometimes make poor decisions about invoking— or not invoking—an automated service. The value of agents providing automated services can be enhanced by providing efficient means by which users can directly invoke or terminate the automated services.

    允许有效的直接调用和终止操作。 具有不确定性的系统常常会错误地调用或者不调用自动化服务。用户可以高效地直接调用或终止自动化服务,以增强提供自动化服务的Agent的价值。

  7. Minimizing the cost of poor guesses about action and timing. Designs for services and alerts should be undertaken with an eye to minimizing the cost of poor guesses, including appropriate timing out and natural gestures for rejecting attempts at service.

    尽量减少对行动和时机的错误猜测带来的成本。 服务和提醒的设计应该能最小化错误猜测带来的成本,比如添加合理的超时设计和用于拒绝提醒的自然手势设计。

  8. Scoping precision of service to match uncertainty, variation in goals. We can enhance the value of automation by giving agents the ability to gracefully degrade the precision of service to match current uncertainty. A preference for “doing less” but doing it correctly under uncertainty can provide user’s with a valuable advance towards a solution and minimize the need for costly undoing or backtracking.

    调整精确度的范围,以匹配不确定性和目标的多样。 Agent要能调整服务的精确度以匹配当前的不确定性,从而加强自动化的价值。在不确定的情况下,做得少,但做得对,既能够帮到用户,也能减少不必要的修改和回溯操作。

  9. Providing mechanisms for efficient agent−user collaboration to refine results. We should design agents with the assumption that users may often wish to complete or refine an analysis provided by an agent.

    提供Agent和用户互相合作以完善结果的机制。 用户常常希望能够完善Agent提供的结果。

  10. Employing socially appropriate behaviors for agent−user interaction. An agent should be endowed with tasteful default behaviors and courtesies that match social expectations for a benevolent assistant.

    利用合适的方式来进行Agent与用户的互动。 Agent要想成为一个好的助手,应该具有满足社会期待的良好的行为举止和礼貌。

  11. Maintaining working memory of recent interactions. Systems should maintain a memory of recent interactions with users and provide mechanisms that allow users to make efficient and natural references to objects and services included in “shared” short-term experiences.

    保存有关近期操作的工作记忆。 系统应该保存用户的近期操作,并提供一种让用户高效而自然地利用这一短期记忆的机制。

  12. Continuing to learn by observing. Automated services should be endowed with the ability to continue to become better at working with users by continuing to learn about a user’s goals and needs.

    通过观察进行持续学习。 自动化服务应该能够通过学习用户的目标和需求更好地与用户进行合作。

下面简单介绍下论文中给出的LookOut程序,这是一个从Outlook的邮件中自动提取信息建立日历的应用。

LookOut会分析收到的信息,提取其中的日期、事件等信息,自动建立日程(基于贝叶斯、SVM分类文本是否可以用于建立日程)。如果它对提取的内容不确定,则会让用户手动操作,或者以更低的精度(天->周)列出。

LookOut还提供一个Social-agent模式,以拟人化的小助手的形象与用户进行交互。

因为人机互动和对话非常相近,我们也可以借鉴语用学的知识,比如合作原则。

  • 量的准则(Maxim of Quantity):提供所需的信息,不提供冗余信息
  • 质的准则(Maxim of Quality):内容有质量保证
  • 关系准则(Maxim of Relevance):内容要有相关性
  • 方式准则(Maxim of Manner): 注意提供信息的方式方法
]]>