同样语义的问题表达方式往往是多样的,比如不论是how many people are there in Shanghai? 还是 what isthe population of Shanghai,都是在问上海人口。又或者形式上看上去很接近的问题,实质语义相差很大,比如“狗咬人了吗”与“人咬狗了吗”语义完全不同。
当问题答案来自于知识库时,这类问题就属于KBQA(面向知识库的自然语言问答)的研究内容。KBQA的核心步骤是建立从自然语言问题到知识库中的三元组谓词的映射关系。比如上面的两个与上海人口相关的问题,都可以映射到知识库中的Population这个谓词。一种简单的办法是让机器记住问题到谓词的映射规则,比如机器记住“How many people are there in Shanghai?”映射到上海这个实体的Population谓词上。但这种方法没有把握问题语义本质,如果用同样的句式问及北京、南京,甚至任何一个城市人口呢?难道机器需要为每个实例记住这些映射么?显然我们人类不是如此理解问题语义的,我们是在“How many people are there in $City?”这个问题概念模板层次把握问题语义的实质的。利用概念模板不仅避免了暴力式的记忆,同时也能让机器具备类人的推理能力。
比如,如果问到“How many people are there in XXX?”,机器只要知道XXX是个city,那么这个问题一定是在问XXX的人口数量。那么我们怎么生成这种问题概念模板呢,我们用概念图谱。概念图谱里面含有大量的类似shanghai isa city,beijing isa city 这类知识。充分利用这些知识可以得到自然语言问题的有效表示,从而实现机器对于自然语言问题的语义理解。
知识将成为比数据更为重要的资产。前几年大数据时代到来的时候,大家都说“得数据者得天下”。去年,微软研究院的沈向阳博士曾经说过“懂语言者得天下”。而我曾经论述过,机器要懂语言,背景知识不可或缺。因此,在这个意义下,将是“得知识者得天下”。如果说数据是石油,那么知识就好比是石油的萃取物。如果我们只满足卖数据盈利,那就好比是直接输出石油在盈利。但是石油的真正价值蕴含于其深加工的萃取物中。石油萃取的过程与知识加工的过程也极为相像。都有着复杂流程,都是大规模系统工程。我今天的报告就是在当前的时代背景下重新解读图灵奖获得者,知识工程的鼻祖,费根鲍姆曾经说过的一句话“knowledge is the power in AI”。这句话已经出现几十年了,在当今语境下需要重新解读。
在《学习在不使用地图的情况下在城市中进行导航》这篇论文中,我们呈现了一种交互的导航环境,它使用了来自谷歌街景 (Google Street View)的第一人称视角照片,并将该环境进行游戏化以训练人工智能。根据街景图片的标准,人脸和车辆牌照都被模糊了且无法辨认。我们建立了一个基于神经网络的人工智能体,它可以利用视觉信息(来自街景图像的像素)来学习如何在多个城市中进行导航。请注意,这项研究是关于广义的导航的,而不是驾驶;我们没有使用交通信息,也没有试图对车辆控制进行建模。
第一次拜访金老师,是在他的家里,印象里满屋子书,灯光灰暗,我们在书的缝隙里相对而坐。我的主要意图,是向老师讲述我个人不断拐弯的经历,讲述我思考的问题,我为什么要考博,以及前两年的考博经历。
我那时受了一点儿自由主义的毒害,听闻美国大学里,导师与学生都是直呼其名,学生说到自己的导师,会说I work with someone,介词是with,不是under。两者是平等的合作关系,而不是上下指导的关系。作为一个自高自傲自卑自怯的人,我向往这样的关系。武侠小说里常写,师父选徒弟,徒弟也选师父。所以投考之前,一定要先见师父,看是否投缘。
我曾经对人文学术有很多理想主义的想象,觉得京城的学术圣殿里面坐着的,都是自带光环的大学者,学问高深,道德高尚。回想第二次考博,如果事先能够与临时被指派的导师沟通,可能是另一个结果。
面试中,某位老师问了一个很常规的问题,为什么要考科哲。我便讲了我对这个专业的长久向往。比如早在吉大物理系读书时,就自费订阅了《自然辩证法通讯》,表明我对作为哲学的物理学比物理学本身更感兴趣。似乎也讲到我在南大物理系思考科学与人类幸福的关系,并且得出了一个反科学的结论——两者并不存在正相关,甚至可能正好相反——这成为我厌学物理,以至于最终决定退学的重要原因。我把自己讲得兴奋起来,顺口讲了下面的故事。
在退学之前,我有一个转学哲学的可能性。当时南大天文学系陆埮教授在哲学系与一位教授联合带研究生,研究对称性问题。而我对这个问题恰好有兴趣,有能力。陆老师在与我谈过之后,同意我转到他的门下,介绍我找这位教授再谈。不料这位教授说:“你们学物理的,物理学不好,就转到我们哲学系来,把我们哲学系当什么了!”这话让我诧异,其一,一位老师,面对一位前来求教求助的学生,没有给出一个正当的拒绝理由——他完全可以敷衍我,比如说,你的哲学基础不够,不能要你;又或者说,如果你有意学哲学,还需要作哪些哪些努力,读哪些哪些书……而这个理由实在太可笑了,让我觉得,这不是一个好老师;其二,一位哲学教授,如此爱面子,这人的哲学境界,也未免太差了点儿。哲学不该是爱智之学吗?既然如此,转不成也好。虽然错过了陆埮先生,有所遗憾。但此事对我并不是一个打击,而是一个笑话。
我天真地认为,大多数人应该与我有同样的想法,尤其是学哲学的。我讲了这个十年前的笑话,以明我向哲之心。不料话未落地,几位考官的表情就变了。
最后,各位考官不留后路地给我面试不及格!笑话变成了黑色幽默。
11 史上最大规模机器人“面相”调查:157张脸背后的人类感受
原标题:史上最大规模机器人“面相”调查:157张脸背后的人类感受
这是一次迄今为止最大规模的机器人“面相”调查。
机器人该长什么样子?不同的机器人脸部长相,会给人类怎样不同的感受呢?
在刚结束的ACM/IEEE国际人机交互大会上,来自华盛顿大学的Alisa Kalegina等人发表了一篇名为Characterizing the Design Space of Rendered Robot Faces的论文。
研究人员收集了157张不同的机器人脸,通过76个维度进行了统计分析,想调查清楚人类对不同长相的机器人体验有何不同。
交通期刊最新论文
13
(1)Transportation Research Part A: Policy and Practice,
Volume 111, (May 2018). 第10篇.
Are public private partnerships that rigid? And why? Evidence from price provisions in French toll road concession contracts, Pages 174-186
(2)Transportation Research part B: Methodological,
Volume 110, (April 2018). 第5篇
Strategic investment in enhancing port–hinterland container transportation network resilience: A network game theory approach. Pages 83-112.
(3)Transportation Research Part D: Transport and Environment,
Volume 62, (July 2018). 第9篇.
The effect of residential housing policy on car ownership and trip chaining behaviour in Hangzhou, China, Pages 125-138.
(4)Transportation Research Part E: Logistics and Transportation Review,
Volume 113, (May 2018). 第8篇.
Integrated relief pre-positioning and procurement planning in humanitarian supply chains, Pages 123-146.
(5)Accident Analysis & Prevention, Volume 115, Volume 114 (May 2018). 第9篇. Latent class analysis of accident risks in usage-based insurance: Evidence from Beijing, Pages 79-88.
(6)Journal of Traffic and Transportation Engineering 2018年01期. 第13篇. 基于统计与假设检验的高速公路交通事故数据分布特性:139-149.