合肥师范学院论坛

标题: 科学新闻早餐 (2018.4.6星期五) [打印本页]

作者: mikeshinoda    时间: 2021-5-2 02:42
标题: 科学新闻早餐 (2018.4.6星期五)
点击标题下“武理工国家水运安全中心”快速关注
编辑:武汉理工大学智能交通系统研究中心
           国家水运安全工程技术研究中心
来源:科学网、交通部、教育部、科技部、国家自然科学基金委,中国交通新闻网,智能交通,啸谈阡陌,车云网,青塔网,搜狐网易科技,新浪科技,央视网
内容提要
微信论科教
  • 2018年青年千人引进,哪些高校待遇高?
  • 真正先进的外星文明不会向外扩张 | 维尔切克专栏
  • 史上最猛烈的科技革命,将如何改变未来?
  • 人工智能将走向何方?有一场盛会或许能给你一些启示
  • 复旦大学肖仰华:深度剖析知识图谱与认知智能
    科学网、科技网、交通新闻网
  • 今日Nature: 如同SARS, 中国致命猪瘟病毒又源自蝙蝠!
  • 误报率太高! 人工智能在安防行业应用依旧挑战重重
  • 不用地图如何导航?DeepMind提出新型双路径强化学习「智能体」架构
  • “海龙Ⅲ”潜水器完成4500米级海试
    凤凰科技网、网易科技等
  • 择师如择父——怀念金吾伦先生
  • 史上最大规模机器人“面相”调查:157张脸背后的人类感受
  • NASA公布火星怪诞照:陨石坑形似细菌
    交通期刊最新论文
  • Transportation Research Part A-F、AAP,中国公路学报、交通运输工程学报、交通信息与安全

    微信论科教
    1
    2018年青年千人引进,哪些高校待遇高?
    青年海外高层次人才引进计划简称青年千人计划,是国家引进海外高层次人才的重要战略之一。作为我国高层次人才的青年中坚力量,青年千人被寄予引领科研创新的厚望,各地区的高校也争相开出各具特色和差异性的优越待遇。
    为了解各大高校和科研机构青年千人引进待遇的差异,青塔整理了中国7大区域、21个省市区、23个城市的37所高校(含研究所)的2018年度青年千人引才计划(部分为2017年度),对各高校的人才引进待遇情况进行了深入分析。


    入选青年千人的基本条件是什么?
    整理发现,各高校提到最多的是不满四十岁、博士学位、以及3年以上海外科研经历。这也与“千人计划”青年项目评审工作小组相关最新要求相吻合。同时,比较重要的条件是能拥有海外正式教研职位、归国不满一年、归国需全职。
    有5所高校提出了归国需要全职3年的要求,这也体现了学校希望引进人才能够长期为学校做贡献。当然,这些只是基本条件。在国际顶级期刊发文、获得国际奖项等经历能够进一步体现申请者的科研水准和学术能力,助力青年千人的申报工作。
    学校将提供什么样的职位?
    学校提供的职位
    在我们分析的37所高校中,有21所明确提出了青年千人将获得正高职称,其中16所高校为教授,4所高校为研究员,1所未明确具体职称。有16所高校提出青年千人将获得博士研究生导师资格,另外21所高校没有明确青年千人将获得怎样的导师资格。
    可以看出,青年千人一入校就能够获得国内教职的最高职称,这也反映了各高校对青年千人的重视程度,以及对其学术水平的强烈认可。青年千人一入校就能够获得博士生导师资格,这将对他们之后的科学研究和人才培养工作提供相当的便利。
    国家和省市将提供什么样的条件?
    国家将统一提供50万元的一次性生活补助,以及100-300万元的科研经费。而在各地区的不同高校,能够申请的其他补助和经费也各不相同。
    如香港中文大学(深圳)表示,青年千人还可以申请广东省补贴和配套科研经费100万元、深圳市补贴200万元、龙岗区补贴100万元,可谓是十分慷慨。杭州师范大学提出青年千人可获得浙江省提供一次性科学技术奖励100万元,并可获得杭州市一次性配套补助100万元。浙江大学提出青年千人可获得浙江省提供一次性科学技术奖励100万元。中科院大连化学物理研究所提出青年千人将获得大连市和研究所补助80万元。青岛大学提出青年千人可获得山东省的50万补贴和青岛市的50万补贴。厦门大学提出青年千人将获得福建省、厦门市的62.5万元补贴。
    广东、浙江等省份的引才条件较为丰厚,对海外青年人才具有较大的吸引力,深圳、杭州、大连、青岛、厦门等城市也对青年千人的引进作出了较大的投入。在分析的37所高校中,其他高校也表明如四川、重庆、陕西、天津、湖南等省份也纷纷提出了自己的补贴方案。
    学校能够提供什么样的资助条件?
    首先是年薪,图中数据只是年薪的基础部分,学校提供的薪水还包括激励、奖励、成果转化等部分。从提供的年薪数据来看。南开大学的最低年薪为65万元,这一数字反映了南开大学对人才引进的极度重视。一般而言,学校开出的最低年薪为45万-50万之间,这一年薪标准已经远远高于高校普通教职工的薪酬水平。
    除了年薪之外,学校还会提供不同额度的科研经费。比如武汉理工大学将提供包含国家配套经费在内一共400-800万科研经费,中国药科大学将提供400万科研经费,哈尔滨工业大学将提供200-400万科研经费。从校级科研经费的投入密集程度来看,高校对青年千人的重视程度和期待程度不言而喻。
    学校能够提供什么样的科研条件?
    绝大部分学校提出,将保证青年千人的办公条件和实验环境,对设备、资源进行优先调配。除此之外,学校还提出了招生、科研方面的优待。
    比如,有8所高校明确提出青年千人将获得博士招生指标,9所高校提出青年千人将获得硕博招生指标,剩下的20所高校未提及招生事宜。有14所学校明确提出将为青年千人配备博士后、科研助手甚至学术团队。这将为青年千人的科研工作提供极大的帮助。
    这些学校的青年千人将获得在招生、科研上的明确支持。但同时也应该注意到,作为科研工作的主要贡献者之一,青年千人在任何一所学校都将最大限度地得到学校在科研上的支持。
    如何解决青年千人的后顾之忧?
    首先是住房的问题。几乎所有高校都提出了给与安居补贴或者安家费。比如,河北工业大学给出了200万元的住房补贴和安家费。北京、上海、合肥的4所高校给出了150万元的安家补贴,这也与各地的当前房价有所关联。银川的宁夏大学也给出了150万元的安家补贴。大连、哈尔滨、武汉、厦门、成都、长沙等地的高校也给出了80万-120万元的安家补贴标准。
    除了安家补贴外,兰州大学、青岛大学、武汉大学、武汉理工大、哈尔滨工业大学、哈尔滨工程大学等高校还将提供80-130平米不等的人才住房,以保证青年千人及其家庭能够拥有稳定、舒适的居住条件。上海交通大学、北京理工大学等校也纷纷表示提供人才住房。除此之外,青年千人还享有一些学校优惠购买职工住房的资格。
    一半以上的学校表示要协助解决青年千人配偶的工作问题,这些学校大多分布在北京、上海等就业竞争较为激烈的一线城市。同时,北京的高校大多提出可以解决配偶、子女的北京户口问题,而其他的高校城市均未提及。
    有28所高校提出将解决青年千人子女入学的问题,这表明学校对青年千人的子女教育问题极度重视。北京航空航天大学、武汉大学、青岛大学甚至提出将提供从幼儿园至高中的一条龙教育服务,这对于青年千人而言,极大地减轻了负担,可以安心从事教学、科研活动。
    申请了青年千人但是没有入选怎么办?
    各学校基本上考虑到了青年千人生活中的方方面面,怎么会忽略这么重要的一条呢?毕竟每年青年千人申报4000人左右,仅600人能够通过终审。
    哈尔滨工业大学、北京理工大学、武汉理工大学、武汉大学等高校纷纷表示,对于通过函评但未最终入选的青年千人候选人,可参照青年千人提供相关待遇。电子科技大学。北京理工大学、南昌大学等表示,对于进入会评但未最终入选的青年千人候选人,可聘为校百人计划特聘研究员、校特立青年学者、校学科带头人。河北工业大学表示将继续提供有竞争力的待遇。这些温馨的举措进一步为青年千人的引进铺平了道路。
    从上述条件可以看出,无论是国家层面,还是省级、市级、区级层面,都对青年千人寄予厚望。学校更是不遗余力地位青年千人提供各种优待条件。虽然各地、各校存在一定差异,但基本上均尽最大可能地优待青年科研人员,希望青年千人在优厚的条件下,能够为国家取得更大的突破性进展。

    2
    真正先进的外星文明不会向外扩张 | 维尔切克专栏
    传奇的意大利裔美国物理学家恩里克·费米(Enrico Fermi)当年提出的一个问题,在我脑海里萦绕了四十多年。费米问道:“他们在哪里?”这个他们,指的是外星人。

    人类的科技文明只有大约300多年的历史。它指数式的增长预示着,在不久的将来,比如1000年后,人类活动将发展到在银河系的每个角落都能看到的程度——只是由于光速有限,消息需要几万年以后才能传到银河系的边缘。

    我们的银河系有大约1000亿颗恒星,以及10倍于这个数量的行星和卫星。费米据此推断有很多科技文明会在银河系中产生。其中有些文明应该已经演化了几十亿年,发达程度远远超过我们,活动中心足以辐射整个银河系。那么,为什么我们还没有接触到它们?

    一个可能的解释是这样的文明极其罕见。生命的出现可能并不寻常。但这和我们地球的历史不符。尽管我们还不理解生命起源的细节,但我们已经找到了几种可能的生命起源方式,并且知道当地球变成一颗稳定的、温度合适的星球后,生命很快就诞生了。所以在类似地球的行星上,生命应该是普遍存在的。

    若要形成更先进的、可以创造技术的智慧生命体,则需要更长的时间。而且,从变形虫到人的进化之路充满了偶然事件。因此,我们或许是银河系唯一的智慧生物。但我怀疑事实并非如此,因为物种演化可以做许多大胆、复杂的实验,而创造出智慧的实验,会给生物带来极为出色的适应能力。照此看来,在太空深处应该有很多更古老的技术文明。

    那么他们到底在哪里?我认为有两个最可能的答案,我把它们分别叫做“过度扩张”和“沉默是金”。

    “过度扩张”假说来自爱德华·吉本(Edward Gibbon),他认为罗马帝国的衰落是“过度扩张带来的自然和不可避免的结果……庞大的架构屈服于自身重量带来的压力。” 西班牙和英国等其他帝国的衰落告诉我们,复杂的文明可能具有内在的脆弱性。我们现在的文明就可能毁于核战争或灾难性的气候变化。所以,更高级的文明大概已经不可避免地消亡了。

    我给出的第二个答案 “沉默是金”,则是受了最近量子计算机发展的启发。量子计算机具有强大的功能,但它们非常精致而脆弱,需要置于又冷又暗的环境里才能发挥最佳功效——这样它们才可以免受辐射和热的影响。同理,一个超级发达、受人工智能主导的文明可能也不想被打扰,这样它可以优化智能和思考能力。

    最近,我听了物理学家理查德·沃尔夫森(Richard Wolfson)一个关于计算的报告。由此,我有了一个关于先进文明更具体的想法,可以涵盖我刚刚描述的几个想法。我把它叫做“小而慧”。它建立在两个相互关联的原则上:原则一是有效的计算必定涉及相互作用;原则二是光速为通信的极限速度。以此推论,最有效的思考——即快速而同步的思考,只能在一个较小的空间内进行。

    考虑一个10 GHz的计算机,这比你今天能买到的计算机快不了很多。在每步运算所花的时间内,光只能前进大约1英寸。那么,一群强大的思考单元,如果它们遵守物理定律并且需要互相传递最新信息,彼此的间隔就不能超过这个距离。对于那些身处最前沿,发展超级先进的技术的思考者而言,为了兼具快速和协调,就会尽量将这类技术小型化。

    所以,基于信息技术的真正先进的文明可能选择向内扩展,从而获得更快的速度和更高的集成度,而不是向外扩张——那样他们会在等待中失去耐心。如果的确如此,那么对于费米的问题“他们在哪?”我们可以这样回答:他们一直都在,只是太不起眼了。

    3
    史上最猛烈的科技革命,将如何改变未来?
    智能家电、智能手机、人脸识别、智能机器人……不知不觉,人们的生活已经进入智能时代。人工智能已经战胜人类棋手,正在超越医生诊断,未来也许将取代司机等人类职业。

    西湖大学讲席教授、耶鲁大学兼职教授许田认为,当生物科技遇上人工智能,将带来人类历史上最猛烈的一次科技革命。《极简宇宙史》的作者、霍金的学生克里斯托弗·加尔法德认为,人工智能将帮助人们更好地了解整个世界,了解生物的生命起源,帮助我们进行时空旅行,到另外一个星球去。清华大学计算机科学与技术系教授孙富春提出,未来,人工智能时代最重要的一个特点将是人与机器共生。以前,人与机器的关系是单向的、百分之百服从的。但是未来机器一方面将服从人的指令,另一方面人的决策也将受到机器的影响。

    2018年3月28日,在共青团贵州省委主办的“触摸科学大咖 遇见科技未来”主题讲座上,西湖大学讲席教授、耶鲁大学兼职教授许田、《极简宇宙史》作者克里斯托弗·加尔法德、清华大学计算机科学与技术系教授孙富春、贵州师范大学副校长谢晓尧等科学家在贵州师范大学展开头脑风暴,向1000多名来自贵州各高校的老师和学生揭示了人工智能的发展将如何改变人类的未来。


    生物医学×人工智能

    在人类近代史上,科技革命推动了一波又一波的社会变化。许田认为,下一波改变人类生活和生命的科技革命将是生物科技。“科技革命普遍有一个特点,三十年缓慢的孵化、三十年后快速推动经济和社会发展,六十年左右的时间之后,技术已经老化,很难产生新的推动力。”许田认为。“生物科技已经过了三十年的缓慢增长期,进入了十年的快速增长期。”而人工智能从20世纪80年代开始,刚好过去了30年。“当生物科技与人工智能两波科技革命相遇,将产生无与伦比的力量。”许田说。

    许田最早关注人工智能是在2012年,当时美国的新闻报道称,斯坦福大学吴恩达教授的一项科技成果,使得计算机可以学习并识别一只猫,许田认为这是一件激动人心的事情。虽然他一直深耕生物领域的研究,没有学习过计算机的相关知识,自认为数学基础也不太好,但他认为,这是他一定要做的事情,决定重新进行数学和计算机的学习。学习之后他对人工智能有了更深入的认识,也许普通人认为以深度学习为代表的人工智能打败了围棋世界冠军,是因为他计算速度快、容量较大,但其实并不尽然,“现在的深度学习,更像人的智能了。”许田说。
    西湖大学、耶鲁大学教授 许田
    此前,许田和罗斯伯格的团队已经开始研究,如何用人工智能进行生物医学的诊断和治疗。基于研究成果,他们制造了一个新型成像仪,加载高分辨的新型超声波芯片,与手机连接即可进行诊断,目前,该产品已经由美国国家FDA批准上市,“这是第一个人工智能用于大健康的产品。”许田说。从前,超声波检查需要由专业的超声波医生才能够操作,但是现在包括普通医生、护士甚至个人都可以进行超声波检查的操作,结合远程医疗,可以说是一次医学的革命。

    在药物研发方面,人工智能也会给目前效率低下、时间密集、不断试错的药物研发过程带来重大变革。据许田介绍,用传统的方法进行新药的研发,成本越来越高、花费的时间也越来越多,目前,研发一个新药的成本平均在200亿美金,时间平均为14年。但是将人工智能用于药物研发,效率的提升是显著的。目前,将人工智能与药物研发相结合,许田与他的团队用四年时间,使得四种药物进入临床二期和一期,“这是非常惊人的速度。”

    目前,许田与他的团队正在研究用神经网络处理分子生物学的复杂信息,他们创建了一个两万人的样本,每一个样本都有24000个基因表达,他们希望提取、简化人类基因表达的性状。最终,他们希望建立人类基因组的基因表达神经网络,未来,这不仅有助于癌症的诊断,也将有助于其它疾病的诊断。

    人工智能的发展会带来生物医学的变革,与此同时,生物医学的研究成果反过来也可以促进人工智能的发展。“人工智能中的深度学习最早就是模拟了哺乳动物视神经网络,以及学习的方法。这个领域在未来显然会是最热门的领域,最有前途、最有新发现的领域。”许田说。


    人与机器的共生

    “人工智能从以大数据和深度学习为代表的弱人工智能,现在正在进入从特征象能空间,下一步就是强人工智能。”清华大学计算机科学与技术系教授孙富春说。“我觉得强人工智能更接近于人的智能,最高形式将是碳智能和人机混合智能。”

    20世纪80年代时,汉斯·莫拉维克(Hans Moravec)等人曾经提出,与传统假设不同,对于计算机而言,实现逻辑推理等人类高级智慧只需要相对很少的计算能力,而实现感知、运动等低等级智慧却需要巨大的计算资源。语言学家和认知科学家史蒂芬·平克(Steven Pinkder)认为,经过35年人工智能的研究,人们学到的主要内容是:困难的问题是简单的,简单的问题是困难的。

    一个三岁的孩子具有的辨识人脸、自由走动、回答问题、情感交互等基本能力,甚至是下意识的动作,对于计算机来说却是很困难的问题。而下棋这样一个对人来讲比较困难的问题,对于机器来说却很简单,类似于下棋这样需要运算能力的智能,被称为硅智能。

    “未来,人工智能时代一个最重要的特点是人和机器共生。”孙富春说。过去人和机器的关系是单向的,机器百分之百服从人,但是人工智能时代人和机器的关系是双向的,机器要服从人,同时人的决策会受到机器的影响。未来,人所下达的命令,机器可能会提出不同的观点,比如人会让机器做什么事情,机器会说这种方式不好可能另外一种方式更好。“这种生态我们叫人工智能的共生生态。”孙富春说。


    发现宇宙未知

    数据是人工智能发展的燃料,而天文学正面临着数据洪潮,因此在天文研究中,以机器学习为代表的人工智能正扮演着越来越重要的角色。此前,在谷歌和美国德克萨斯大学奥斯汀分校的合作中,采用机器学习算法,对美国宇航局开普勒天文望远镜获取的数据进行分析,成功的找到两颗新的行星。

    而在中国的贵州,拥有世界最大的射电天文望远镜“中国天眼”,“中国天眼”能够捕捉到海量的宇宙原始数据,但是这些数据本身并不能立即告诉人们哪些是人类未知的天文现象,需要数据处理中心进行处理,才能进一步研究。为了对“天眼”数据进行及时深入的处理,贵州师范大学建立了贵州省射电天文数据处理重点实验室。

    “我们用机器学习算法建立了天文大数据计算和候选体的人工智能识别。”贵州师范大学副校长谢晓尧说。“如果不能够对海量数据进行及时的计算,这些就只是数据垃圾,现在我们已经把计算速度提高了1000倍,在天文界达到了国际领先水平。”
    目前,贵州师范大学的实验室协助国家天文台,已经发现了11颗脉冲星和54颗候选体,可以说,数据中心在脉冲星搜索计算和人工智能识别等方面,达到了世界领先水准。

    当然,除了脉冲星的发现,宇宙那么大,还有更多未知需要探索。“人工智能会帮助我们更好地了解整个世界,了解生物的生命起源,帮助我们进行时空旅行,到另外一个星球去。”克里斯托弗·加尔法德说。“此前,我和霍金教授一起为BBC拍摄了一部纪录片,我们希望征服宇宙里的其他地方,我们希望用人工智能让我们更好地了解这个宇宙。我们需要有一个开放性的心态,去更好地理解人工智能。”


    4
    人工智能将走向何方?有一场盛会或许能给你一些启示
    如果说2017年是人工智能技术爆发的“元年”,那么2018,图像、视频和语音等交互技术的进展会让机器更加懂你。没错,“人工智能”的时代来了,总理在说,科技大佬在说,风投资金在说,连出租车司机都在说,似乎一夜之间我们就被另外一种智能包围了,还首次写入政府工作报告,并成为了“两会”期间的热点议题,以大数据+人工智能为代表的媒体表现也颇为亮眼。

    科技的进步与发展总是令人兴奋,尤其是引领新一代科技革命的人工智能。从能够帮助城市疏导交通的城市“大脑”,到进入千家万户的智能音箱,再到智能手机里的刷脸登录和指纹支付……人人都知道人工智能在深刻地影响着我们的工作、生活。

    但许多人并不懂其中所应用的卷积神经网络、深度学习技术是什么,也不明白人工智能下一个研究风向标在哪,甚至不知道未来世界将对人工智能依赖到何种程度……关于人工智能的种种问题,4月10日到13日O’Reilly和Intel人工智能大会2018北京站上可能给你一些启示。

    如今 AI 主题会议也是层出不穷。不管你是想时刻紧跟潮流,还是仅仅希望稍微了解一下人工智能,全世界每时每刻总有一些大会在等着你,而这次的大会就是将硅谷和中国融合在一起,创造一次全球人工智能专家难得的相聚。

    这场以“探索在业务中应用人工智能的机会”为主题的世界性前瞻人工智能应用大会,将汇集众多人工智能领域的顶尖专家以及科技企业大咖,他们会告诉我们人工智能应用的方向和方式。来自Google、IBM、Intel及Microsoft等一众讲师将分享案例研究和技术内容,绝对会让你受益匪浅。作为此次O’Reilly人工智能大会主办方之一的英特尔,也将带来最先进最前沿的AI技术成果。

    作为一家成功转型的数据公司 ,英特尔近年来在人工智能界也是动作频频。从举办英特尔人工智能论坛,到成立人工智能产品事业部和人工智能应用实验室,从亮相CES、新智元峰会、CITE 展览会……到宣布完成收购Mobileye延伸无人驾驶技术布局,英特尔在人工智能领域的全面布局引起了业界的高度关注。

    这些都表明英特尔一直致力于驱动人工智能技术创新理念,同时也为将人工智能普及到各种应用中而努力。在2017CITE 展览会上,各种融合了英特尔技术的人工智能产品让人大开眼界。然而,英特尔在建立相关学院、开发各种产品等诸多努力的最后,都是为了确保人工智能能够回馈社会。
    如今,人工智能已经处于爆发的临界点。在即将到来的O’Reilly和Intel人工智能大会2018北京站,计算机领导者英特尔为更好的助攻人工智能行业,将为我们展示5个产品:

    基于英特尔至强可扩展处理器的人工智能物体检测和对象识别,从计算到网络技术、存储技术都可以非常灵活的按照人工智能的应用复杂度来搭配;

    基于Apache Spark的分布式深度学习框架的应用--BigDL,借助现有的Spark集群来运行深度学习计算,并简化存储在Hadoop中的大数据集的数据加载,速度可与主流GPU匹敌,而且能够扩展到数十个Xeon服务器;

    基于英特尔 FPGA可编程加速卡构建的卷积神经网络(CNN)系统,可以提供“实时人工智能”技术,使云基础设施能够以超低延迟来尽可能快速地处理和传输数据,目前在京东有着广泛的应用场景;

    基于英特尔Movidius神经计算棒的物体检测和对象识别技术的应用演示,作为世界首个基于USB模式的深度学习推力工具和独立AI加速器,Movidius神经计算棒在超低功耗下部署基于设备的神经网络和计算机视觉应用的尖端解决方案;

    英特尔人工智能学院Software.intel.com/ai,协助学生与相关领域研究人员对AI开发平台使用训练。

    在为期4天的人工智能大会上,除了以上英特尔为代表的龙头企业的最新研发和应用成果的展示,我们同样也期待那些走在AI最前沿的技术领袖的声音,现场近百名专家、近百场论坛将与你见面,精彩不容错过。

    贴心的英特尔还为我们带了两场主题演讲、一堂辅导课以及六场精彩论坛,内容涉及保健和医疗、零售与电子商务领域等多个领域的人工智能技术的最新应用以及发展前景。届时,数位技术专家将最前沿技术进行面对面讲解和最深度的分析,为您带来更具技术前瞻性和商业适用性的洞察。

    这场原汁原味的人工智能饕餮盛宴,是否已经让你迫不及待了?听那些站在人工智能最前端的领袖授之以渔,绝对会给你不一样的体验!

    5
    复旦大学肖仰华:深度剖析知识图谱与认知智能
    肖仰华教授1万5千字雄文带您深度剖析知识图谱与认知智能,对知识图谱技术与落地应用中的一系列关键问题做了系统梳理与解答。

    获取完整PPT,请前往
    http://kw.fudan.edu.cn/workshop/intro2018

    今天跟大家分享的主题是《知识图谱与认知智能》。

    知识图谱自2012年提出至今,发展迅速,如今已经成为人工智能领域的热门问题之一,吸引了来自学术界和工业界的广泛关注,在一系列实际应用中取得了较好的落地效果,产生了巨大的社会与经济效益。那么到底是什么在支撑着知识图谱技术的繁荣景象?是一股什么力量让知识图谱技术吸引了如此多的关注?换句话说,知识图谱到底能解决什么问题?何以能够解决这些问题?今天的报告主要围绕着这些问题,给大家做一个初步的解答。

    先简单介绍一下整个报告的总体思路。人类社会已经进入智能时代,智能时代的社会发展催生了大量的智能化应用,智能化应用对机器的认知智能化水平提出了前所未有的要求,机器认知智能的实现依赖的就是知识图谱技术。

    我想大家已经深刻地感受到我们身处在一个智能化的时代。

    从2012年Google的图像识别错误率显著下降,机器在图像识别方面接近人类水平;到2016年AlphaGo战胜了人类围棋冠军;再到2017年AlphaZero战胜了AlphaGo,以及DeepMind去尝试星际争霸游戏,这一系列AI发展的标志性事件让我们看到了人工智能技术帮助解决人类社会发展若干问题的希望。我们已经见证的这一系列人工智能技术的发展,本质上是受益于大数据给人工智能带来的数据红利。

    这一波人工智能热潮是在大数据所给予的海量标注样本以及超强计算能力这两个强大的支撑作用下所形成的。可以说,这一波人工智能的发展本质上是大数据喂养出来的。到了今天,可以很自豪地宣告机器智能在感知智能和计算智能等若干具体问题上已经达到甚至超越人类水平。现在,在语音识别与合成、图像识别、封闭环境有限规则的游戏领域等问题上,机器智能水平堪比、甚至超越人类水准。

    这一系列人工智能技术的突破性进展,促使各行各业纷纷走向了一条智能化升级和转型的道路。智能化技术尤其为我国传统行业的发展带来了全新机遇,对于我国经济结构升级,以及传统实体行业摆脱当前一系列发展困境带来了全新的机遇。智能化升级和转型已经成为各行各业的普遍诉求。各行业走向智能化的发展道路,在某种意义上也是人类社会发展的必然趋势。

    自计算机面世以来,人类社会在经历了计算机技术发展的一系列浪潮之后,基本完成了信息化的使命。信息化时代最重要的任务是数据记录与采集,这势必造就大数据。当我们迈进大数据时代之后,我们势必对大数据的价值挖掘提出诉求。大数据的价值挖掘需要智能化手段。因此大数据时代的到来,某种意义上只是智能化时代的短暂序曲。我相信,未来若干年,计算机技术的主要使命是帮助人类社会实现智能化。

    在各行业的智能化发展进程中,AI+或者AI赋能成为了传统行业智能化升级和转型的一个基本模式。在AI的赋能下,传统行业面临着非常多的机遇,其所关心的一系列核心问题,比如增加收入、降低成本、提高效率和安全保障等,都将显著受益于智能化技术。比如智能客服系统已经在很多行业大规模应用,大大降低了人工客服的巨大劳动力成本;一些企业利用知识图谱,对企业内部的研发资源进行管理,显著提升研发效率,这些都是AI可以赋能传统行业的具体体现。

    智能化的升级和转型对整个传统行业产生的影响将是颠覆性的,将重塑整个行业的形态,革新传统行业的各个关键环节,智能化技术将逐步渗透到传统行业的各个角落。最近几年我们看到越来越多的传统行业将人工智能领域升格为企业的核心战略,在电商、社交、物流、金融、医疗、司法、制造等很多领域涌现出越来越多的AI赋能传统行业的发展案例。

    智能化对机器的智能水平提出了要求,包括机器的计算智能、感知智能,尤其是机器的认知智能。所谓让机器具备认知智能是指让机器能够像人一样思考,而这种思考能力具体体现在机器能够理解数据、理解语言进而理解现实世界的能力,体现在机器能够解释数据、解释过程进而解释现象的能力,体现在推理、规划等等一系列人类所独有的认知能力上。

    相较于感知能力,认知能力的实现难度更大,价值也更大。前几年在深度学习的推动下,机器感知能力显著提升。但是感知能力动物也具备,比如我们家里的小猫小狗也能识别主人,识别物体。所以让机器具备感知能力只是让机器具备了一般动物所具备的能力,还不是那么值得“炫耀”的事情。但是,认知能力是人类独有的能力,一旦机器具备认知能力,AI技术将会给人类社会带来颠覆性革命,同时也将释放出巨大的产业能量。所以实现机器的认知能力是人工智能发展进程中具有里程碑意义的重大事件。

    随着大数据红利的消失殆尽,以深度学习为代表的感知智能水平日益接近其“天花板”。以深度学习为代表的统计学习严重依赖大样本,这些方法只能习得数据中的统计模式。然而,现实世界很多实际问题的解决单单依靠统计模式是不够的,还需要知识,特别是符号化的知识。

    我们人类的语言理解、司法判案、医疗诊断、投资决策等等很多领域都是显著依赖我们的知识才能实现的。很多从事自然语言处理的研发人员普遍有个深刻的感受:即便数据量再大,模型再先进,很多自然语言处理任务,比如中文分词、情感分析达到一定准确率之后,就很难再改进了。

    比如,中文分词的一个经典案例:“南京市长江大桥”,不管是分为“南京市长+江大桥”还是“南京市+长江大桥”都依赖我们的知识。如果从上下文我们得知是在讨论南京市长,并且有个人叫“江大桥”,我们会倾向于分为“南京市长+江大桥”,否则我们会根据我们已有的知识断句为“南京市+长江大桥”。不管是哪种情况,我们都在利用我们的知识。我记得我国知名统计学者徐宗本院士在去年年底一个论坛上说过:“数据不够模型补”。我想传达类似的观点:“数据不够知识补”,甚至“数据足够了,知识也不能缺失”。而知识图谱就是这种不可或缺的知识的重要表现形式之一。

    机器认知智能绝不是束之高阁、高高在上的前沿技术。它是一类能够实实在在落地的、有着广泛且多样的应用需求的、能够产生巨大社会经济价值的技术。机器认知智能的发展过程本质上是人类脑力不断解放的过程。在工业革命和信息化时代,我们的体力被逐步解放;而随着人工智能技术的发展,尤其是认知智能技术的发展,我们的脑力也将会逐步解放。越来越多的知识工作将逐步被机器所代替,伴随而来的将是机器生产力的进一步解放。机器认知智能在应用方面是广泛和多样的,体现在精准分析、智慧搜索、智能推荐、智能解释、更自然的人机交互和深层关系推理等各个方面。

    认知智能的第一个应用抓手就是大数据的精准与精细分析。如今,越来越多的行业或者企业积累了规模可观的大数据。但是这些数据并未发挥出应有的价值,很多大数据还需要消耗大量的运维成本。大数据非但没有创造价值,在很多情况下还成为了一笔负资产。这一现象的根本原因在于,当前的机器缺乏诸如知识图谱这样的背景知识,机器理解大数据的手段有限,限制了大数据的精准与精细分析,从而大大降低了大数据的潜在价值。

    举个亲身体验的例子,在娱乐圈王宝强离婚案刚刚开始的时候,新浪微博的热搜前三位分别是“王宝强离婚”、“王宝宝离婚”和“宝强离婚”。也就是说,当时的微博平台还没有能力将这三件事自动归类到一件事,不知道这三件事其实说的是一件事。机器在统计事件热度的时候就分开统计了,这就是因为当时机器缺乏背景知识,不知道王宝强又称为“王宝宝”或“宝强”,所以没有办法做到大数据的精准分析。

    事实上,舆情分析、互联网的商业洞察,还有军事情报分析和商业情报分析都需要大数据的精准分析,而这种精准分析就必须要有强大的背景知识支撑。除了大数据的精准分析,数据分析领域另一个重要趋势:精细分析,也对知识图谱和认知智能提出了诉求。比如很多汽车制造厂商都希望实现个性化制造。个性化制造希望从互联网上搜集用户对汽车的评价与反馈,并以此为据实现汽车的按需与个性化定制。为了实现个性化定制,厂商不仅需要知道消费者对汽车的褒贬态度,还需要进一步了解消费者不满意的细节之处,以及消费者希望如何改进,甚至用户提及了哪些竞争品牌。显然面向互联网数据的精细化数据分析必需要求机器具备关于汽车评价的背景知识(比如汽车的车型、车饰、动力、能耗等等)。因此,大数据的精准和精细化分析需要智能化的技术支撑。

    认知智能的第二个非常重要的应用抓手是智慧搜索。下一代智慧搜索对机器认知智能提出了需求。智慧搜索体现在很多方面。

    首先,体现在搜索意图的精准理解方面。比如在淘宝上搜索“iPad充电器”,用户的意图显然是要搜索一个充电器,而不是一个iPad,这个时候淘宝应该反馈给用户若干个充电器以供选择,而不是iPad。再比如在Google上搜索“toys kids”或者“kids toys”,不管搜索这两个中的哪一个,用户的意图都是在搜索给孩子的玩具,而不是玩玩具的小孩,因为一般不会有人用搜索引擎搜孩子。“toys kids”和“kid’s toys”中两个词都是名词,要辨别出哪一个是核心词,哪一个是修饰词,在缺乏上下文的短文本上,仍然是个具有挑战性的难题。

    其次,搜索的对象越来越复杂多元化。以前搜索的对象以文本为主,现在大家希望能搜索图片和声音,甚至还能搜代码,搜视频,搜设计素材等等,要求一切皆可搜索。

    第三、搜索的粒度也越来越多元化。现在的搜索不仅能做篇章级的搜索,还希望能做到段落级、语句级、词汇级的搜索。尤其是在传统知识管理领域,这个趋势已经非常明显。传统的知识管理大都只能做到文档级搜索,这种粗粒度的知识管理已经难以满足实际应用中细粒度的知识获取需求。

    最后,是跨媒体的协同搜索。传统搜索以面向单质单源数据的搜索居多。比如针对文本搜索难以借力视频、图片信息,针对图片的搜索主要还是利用图片自身的信息,对于大量文本信息利用率还不高。最近的趋势是跨媒体的协同搜索。比如前几年,明星王珞丹在微博上晒了张自家小区的照片,然后就有好事者根据她的微博社交网络、百度地图、微博文本与图片信息等多个渠道多种媒体的信息,通过联合检索准确推断出其所在小区位置。所以,未来的趋势是一切皆可搜索,并且搜索必达。

    认知智能的第三个应用抓手是智能推荐。智能推荐表现在很多方面。

    首先是场景化推荐。比如用户在淘宝上搜“沙滩裤”、“沙滩鞋”,可以推测这个用户很有可能要去沙滩度假。那么平台是否能推荐“泳衣”、“防晒霜”之类的沙滩度假常用物品呢?事实上,任何搜索关键字背后,购物篮里的任何一件商品背后都体现着特定的消费意图,很有可能对应到特定的消费场景。建立场景图谱,实现基于场景图谱的精准推荐,对于电商推荐而言至关重要。

    第二、任务型推荐。很多搜索背后的动机是完成特定任务。比如用户购买了“羊肉卷”、“牛肉卷”、“菠菜”、“火锅底料”,那么用户很有可能是要做一顿火锅,这种情况下,系统推荐火锅调料、火锅电磁炉,用户很有可能买单。

    第三、冷启动下的推荐。冷启动阶段的推荐一直是传统基于统计行为的推荐方法难以有效解决的问题。利用外部知识,特别是关于用户与物品的知识指引冷启动阶段的匹配与推荐,是有可能让系统尽快渡过这个阶段的。第四、跨领域的推荐。

    当阿里刚刚入股新浪时,我们在设想是否能将淘宝的商品推荐给微博的用户。比如,如果一个微博用户经常晒九寨沟、黄山、泰山的照片,那么为这位用户推荐一些淘宝的登山装备准没错。这是典型的跨领域推荐,微博是一个媒体平台,淘宝是一个电商平台。他们的语言体系、用户行为完全不同,实现这种跨领域推荐显然商业价值巨大,但却需要跨越巨大的语义鸿沟。

    如果能有效利用知识图谱这类背景知识,不同平台之间的这种语义鸿沟是有可能被跨越的。比如百科知识图谱告诉我们九寨沟是个风景名胜,是个山区,山区旅游需要登山装备,登山装备包括登山杖、登山鞋等等,从而就可以实现跨领域推荐。第五、知识型的内容推荐。在淘宝上搜索“三段奶粉”,能否推荐“婴儿水杯”,同时我们是否能推荐用户一些喝三段奶粉的婴儿每天的需水量是多少,如何饮用等知识。这些知识的推荐,将显著增强用户对于推荐内容的信任与接受程度。消费背后的内容与知识需求将成为推荐的重要考虑因素。

    所以未来的推荐趋势就是精准感知任务与场景,想用户之未想。推荐技术演进的重要趋势是从单纯基于行为的推荐过渡到行为与语义融合的推荐。换言之,基于知识的推荐,将逐步成为未来推荐技术的主流。
    认知智能的第四个应用抓手是智能解释。2017年年底的时候,微信上流传Google17年最流行的搜索关键字是“how”,这说明人们希望Google平台能做“解释”。类似于“如何做蛋炒饭”,“怎么来北理工”等这类问题在搜索引擎上出现次数日益增多,这些问题都在考验机器的解释水平。一个更有意思的例子是,当我们在Google上搜索“Donald Trump”相关的问题时,你会发现Google会自动提示询问“为什么特朗普的老婆嫁给他”而不再是“特朗普老婆是谁”这类简单事实问题。“why”和“how”问题在现实应用中越来越多。这一趋势实际上体现了人们的一个普遍诉求,那就是希望智能系统具备可解释性。所以可解释性将是智能系统一个非常重要的体现,也是人们对智能系统的普遍期望。

    可解释性决定了AI系统的决策结果能否被人类采信。可解释性成为了很多领域(金融、医疗、司法等)中阻碍AI系统落地应用的最后一公里。比如在金融领域的智能投资决策,即便AI决策的准确超过90%,但是如果系统不能给出作出决策的理由,投资经理或者用户恐怕也是十分犹豫的。再比如在医疗领域,即便系统判断疾病的准确率在95%以上,但是如果系统只是告诉病患得了什么病或者开了一个药方,却不能解释为什么作出这类判断的话,病人是不会为此买单的。

    智能系统的可解释性体现在很多具体任务中,包括解释过程、解释结果、解释关系、解释事实。事实上,可解释人工智能最近受到了越来越多的关注。在学术界,机器学习,特别是深度学习的黑盒特性,日益成为学习模型实际应用的主要障碍之一。越多越多的学术研究项目旨在打开深度学习的黑盒。美国军方也有项目在尝试解释机器的学习过程。我个人也曾做过《基于知识图谱的可解释人工智能》的研究与思考,旨在强调知识图谱在可解释性方面的重要作用。

    智能系统另外一个非常重要的表现方式就是自然人机交互。人机交互将会变得越来越自然,越来越简单。越自然简单的交互方式越依赖强大的机器智能水平。自然人机交互包括自然语言问答、对话、体感交互、表情交互等等。特别是自然语言交互的实现需要机器能够理解人类的自然语言。会话式(Conversational UI)、问答式(QA)交互将逐步代替传统的关键字搜索式交互。对话式交互还有一个非常重要的趋势就是一切皆可问答。我们的BOTs(对话机器人)将代替我们阅读文章、新闻,浏览图谱、视频,甚至代替我们看电影、电视剧,然后回答我们所关心的任何问题。自然人机交互的实现显然需要机器的较高认知智能水平,以及机器具备强大的背景知识。

    认知智能还体现在机器的深层关系发现与推理能力方面。人们越来越不满足于“叶莉是姚明妻子”这样的简单关联的发现,而是希望发现和挖掘一些深层、潜藏关系。这里有一些来自互联网的例子。王宝强离婚的时候,就有人挖过为什么王宝强找张起淮当律师。后来有人把人物关联图谱建立起来,发现王宝强与冯小刚关系很好,而冯小刚有徐静蕾和赵薇两个经常合作的演员,而张起淮是这两个演员的法律顾问。这样的关系链路一定程度上揭示了王宝强与他的律师之间的深层次关联,也解释了王宝强为何选择这位律师。更多类似例子发生在金融领域。在金融领域,我们可能十分关注投资关系,比如为何某个投资人投资某家公司;我们十分关注金融安全,比如信贷风险评估需要分析一个贷款人的相关关联人物和关联公司的信用评级。

    我们可以看到,刚才所说的这些需求都在各领域酝酿、发生,这些需求要求机器具备认知能力,要求机器具备理解、解释、规划、推理、演绎、归纳等一系列能力。其中,尤其以理解和解释较为突出。让机器具备认知能力不是今天才提出的问题,早在图灵时代,阿兰-图灵在设计图灵机的时候就在想象机器能不能像人一样思考。而机器认知智能的实现在本质上就是让机器能够像人一样思考。

    这里有一个非常重要的观点要分享给大家,我认为实现认知智能是当前以及今后一段时间里AI发展的重要使命之一。更具体一点,理解和解释将是后深度学习时代人工智能最重要的使命之一。之所以说后深度学习时代,是因为深度学习的发展对于大数据红利的使用基本上已经到了尽头,深度学习日益面临性能瓶颈,需要寻求新的思路和方向进行突破。而一个非常重要的突破方向在于知识,在于对于符号知识的利用,在于符号知识与数值模型的融合。而这些努力的最终结果就是使机器具备理解和解释的能力。
    如何实现机器的认知能力?或者更具体一点,如何让机器具备理解和解释的能力?我认为知识图谱,或者说以知识图谱为代表的这一波知识工程的一系列技术,在认知智能的实现中起到非常关键的作用。一言以蔽之,知识图谱是实现机器智能的使能器(Enabler)。也就是说没有知识图谱,或许就没有机器认知智能的实现。

    知识图谱是什么?我认为知识图谱本质上是一种大规模语义网络。理解知识图谱的概念,有两个关键词。首先是语义网络。语义网络表达了各种各样的实体、概念及其之间的各类语义关联。比如“C罗”是一个实体,“金球奖”也是一个实体,他们俩之间有一个语义关系就是“获得奖项”。“运动员”、“足球运动员”都是概念,后者是前者的子类(对应于图中的subclassof 关系)。理解知识图谱的第二个关键词是“大规模”。语义网络并非新鲜事物,早在上个世纪七八十年代知识工程盛行之时,就已存在。相比较于那个时代的语义网络,知识图谱规模更大。关于这一点后面还会深入介绍。

    从2012年Google提出知识图谱直到今天,知识图谱技术发展迅速,知识图谱的内涵远远超越了其作为语义网络的狭义内涵。当下,在更多实际场合下,知识图谱是作为一种技术体系,指代大数据时代知识工程的一系列代表性技术进展的总和。去年我国学科目录做了调整,首次出现了知识图谱的学科方向,教育部对于知识图谱这一学科的定位是“大规模知识工程”,这一定位是十分准确且内涵丰富的。这里需要指出的是知识图谱技术的发展是个持续渐进的过程。

    从上个世纪七八十年代的知识工程兴盛开始,学术界和工业界推出了一系列知识库,直到2012年Google推出了面向互联网搜索的大规模的知识库,被称之为知识图谱。理解今天的知识图谱内涵,是不能割裂其历史脐带的。

    知识图谱的历史发展必然带来一个非常有意思的问题,那就是上世纪七八十年代的知识表示与我们今天的知识图谱到底有什么本质差别?知识工程在图灵奖获得者费根鲍姆以及AI先驱马文明斯基的带领下,曾经兴盛一时,解决了一系列实际应用问题,甚至在数学定理证明等看上去很难的问题上取得了显著进展。时至今日,我们再次讨论作为一种语义网络的知识图谱,会不会只是冷炒饭的再次煎炒而已?知识图谱在当下的火热到底是知识工程的回光返照还是再次中兴?这一系列问题需要得到合理回答。

    传统语义网络与知识图谱的差别首先表现在其规模上。知识图谱是一种大规模语义网络,与上世纪七八十年代的各类语义网络相比较,最显著的差异就是规模差异。推而广之,以知识图谱为代表的大数据时代的各种知识表示与传统的知识表示的根本差别首先体现在规模上。传统知识工程一系列知识表示都是一种典型的“小知识”(small knowledge)。而到了大数据时代,受益于海量数据、强大计算能力以及群智计算,我们如今能够自动化构建、或者众包构建大规模、高质量知识库,形成所谓的“大知识”(big knowledge,合肥工业大学的吴兴东教授在很多场合下也提到类似观点)。所以知识图谱与传统知识表示在浅层次上的区别,就是大知识与小知识的差别,是在规模上的显而易见的差别。

    更深刻的进行分析就会发现,这样的一个知识规模上的量变带来了知识效用的质变。知识工程到了上世纪八十年代之后就销声匿迹了。根本原因在于传统知识库构建主要依靠人工构建、代价高昂、规模有限。举个例子,我国的词林辞海是上万名专家花了10多年编撰而成的,但是它只有十几万词条。而现在任何一个互联网上的知识图谱,比如DBpedia,动辄包含上千万实体。

    人工构建的知识库虽然质量精良,但是规模有限。有限的规模使得传统知识表示难以适应互联网时代的大规模开放应用的需求。互联网应用的特点在于:

    一、规模巨大,我们永远不知道用户下一个搜索关键词是什么;
    二、精度要求相对不高,搜索引擎从来不需要保证每个搜索的理解和检索都是正确的;
    三、简单知识推理,大部分搜索理解与回答只需要实现简单的推理,比如搜索刘德华推荐歌曲,是因为知道刘德华是歌星,至于“姚明老婆的婆婆的儿子有多高”这类的复杂推理在实际应用中所占比率是不高的。

    互联网上的这种大规模开放应用所需要的知识很容易突破传统专家系统由专家预设好的知识库的知识边界。我想这一定程度上回答了,为何谷歌在2012年这个时间节点推出知识图谱,利用一个全新名称以表达与传统知识表示毅然决裂的态度。
            
    有人或许会问,那么传统知识表示对于领域应用应该依然有效,为何专家系统后来在领域应用中也不多见了?

    这个问题我也曾思考了很长时间,直到后来在很多领域知识图谱的应用实践中意识到一些知识应用的有趣现象,我姑且将这个现象叫做“领域知识的伪封闭”现象。领域知识看似应该是封闭的,也就是不会蔓延至专家预先设定的知识边界范围之外。

    但是事实恰好相反,很多领域知识的应用十分易于突破原先设定的边界。比如,我们现在做金融知识图谱,原先我们觉得只有股票、期货、上市公司与金融密切相关,但是实际应用中,几乎万事万物在某种意义下都与金融相关,比如某个龙卷风,可能影响农作物产量,进而影响农业机械的出货量,进而影响了农机发动机,最终影响了这个发动机的上市公司股价。类似这样的关联分析,不正是我们期望智能金融实现的么?而这样的深度关联分析,显然十分容易超出任何专家系统的预先设定的知识边界。因此,某种意义上,知识是普遍关联的,当然关联也是有条件的;领域知识的领域性通常是个伪命题,很多领域知识库的构建要直面通用知识库的构建所面临的同样挑战。

    换句话说,领域知识库的深度应用势必涉及通用知识库。这也在一定程度上解释了,我曾经强调的一个观点,那就是通用知识库的研究具有战略意义,不容有失;一万个领域知识研究通透了也未必有一个通用知识库研究透彻价值来的高。通用知识库的研究是在抢占知识库研究的战略制高点,对于领域知识库能够形成战略俯冲。
            
    如果你仍然不满足于我当前的回答,进一步追问决定了领域知识库与通用知识库这种粘连特性的根本原因是什么。那么我想答案在于人类的知识体系。我们的知识是有体系架构的,这个架构的最底层,也就是作为地基支撑整个知识体系的知识就是通用知识。而在通用知识中的最底层应该是常识,也就是我们每个人都知道的知识,特别是我们人类关于时间、空间以及因果的基本常识。整个知识体系是建基在这些通用常识之上,再通过隐喻作为主要手段,逐步形成我们的高层、抽象或者领域性知识。
            
    因此,我想通过一个简单的公式表明传统知识工程与以知识图谱为代表的新一代知识工程的联系与区别:Small knowledge + Bigdata=Big knowledge。通过这个公式表达两层意思。一、以知识图谱为代表的大数据时代知识工程有着悠久的历史渊源;知识图谱脱胎于传统知识表示,但是在规模上显著优于传统语义网络;而这种量变也带来知识效用上的质变。这层含义刚才已经阐述,不再赘述。我通过这个公式想强调的是另一层含义:传统知识表示形式林林总总,通过大数据的赋能,这些知识表示将在各个应用场景下发挥巨大能量。知识图谱只不过是传统的语义网络在规模上显著提升,就已经能够解决大量实际问题。

    试想一下,我们还有大量其他的知识表示,比如本体、框架、谓词逻辑、马尔科夫逻辑网、决策树等等各种知识表示仍然被锁在规模的牢笼里,一旦规模瓶颈被突破,我相信整个知识工程的产业能量将得到巨大释放。正是在这个意义上,我认为知识图谱只是知识工程复兴的序曲,知识图谱将引领知识工程复兴。我有一种强烈的感觉,好比我们曾经经历了小数据到大数据的轰轰烈烈的时代转变,我们也必将经历从小知识走向大知识的时代转变。

    为什么知识图谱对于机器实现人工智能如此重要呢?我们先从形而上的角度来分析这个问题。具体而言,我们分析知识图谱实现机器认知智能的两个核心能力:“理解”和“解释”。我尝试给机器“理解与解释”提出一种解释。我认为机器理解数据的本质是建立起从数据到知识库中的知识要素(包括实体、概念和关系)映射的一个过程。

    比如如果我说到“2013年的金球奖得主C罗”这句话,我们之所以说自己理解了这句话,是因为我们把“C罗”这个词汇关联到我们脑子中的实体“C罗”,把“金球奖”这个词汇映射到我们脑中的实体“金球奖”,然后把“得主”一词映射到边“获得奖项”这个关系。

    我们可以仔细体会一下我们的文本理解过程,其本质是建立从数据,包括文本、图片、语音、视频等数据到知识库中的实体、概念、属性映射的过程。再来看我们人类是如何“解释”的。比如我问“C罗为什么那么牛?”,我们可以通过知识库中的“C罗获得奖项金球奖”以及“金球奖地位影响力最大的足球奖项之一”这两条关系来解释这一问题。这一过程的本质就是将知识库中的知识与问题或者数据加以关联的过程。有了知识图谱,机器完全可以重现我们的这种理解与解释过程。有过一定计算机研究基础的,是不难完成上述过程的数学建模的。

    知识图谱对机器认知智能的必要性还可以从若干具体问题来进行阐述。

    首先,我们来看机器认知的核心能力之一:自然语言理解。我的观点是机器理解自然语言需要类似知识图谱这样的背景知识。自然语言是异常复杂的:自然语言有歧义性、多样性,语义理解有模糊性且依赖上下文。机器理解自然语言困难的根本原因在于,人类语言理解是建立在人类的认知能力基础之上的,人类的认知体验所形成的背景知识是支撑人类语言理解的根本支柱。

    我们人类彼此之间的语言理解就好比是根据冰山上浮出水面的一角来揣测冰山下的部分。我们之所以能够很自然地理解彼此的语言,是因为彼此共享类似的生活体验、类似的教育背景,从而有着类似的背景知识。冰山下庞大的背景知识使得我们可以彼此理解水面上有限的几个字符。我们可以做个简单的思想实验,假如现在有个外星人坐在这里听我讲报告,他能听懂么?我想还是很困难的,因为他没有在地球上生活的经历,没有与我相类似的教育背景,没有与我类似的背景知识库。

    再举个很多人都有体会的例子,我们去参加国际会议时,经常遇到一个尴尬的局面,就是西方学者说的笑话,我们东方人很难产生共鸣。因为我们和他们的背景知识库不同,我们早餐吃烧饼、油条,西方吃咖啡、面包,不同的背景知识决定了我们对幽默有着不同的理解。所以语言理解需要背景知识,没有强大的背景知识支撑,是不可能理解语言的。要让机器理解我们人类的语言,机器必需共享与我们类似的背景知识。

    实现机器自然语言理解所需要的背景知识是有着苛刻的条件的:规模足够大、语义关系足够丰富、结构足够友好、质量足够精良。以这四个条件去看知识表示就会发现,只有知识图谱是满足所有这些条件的:知识图谱规模巨大,动辄包含数十亿实体;关系多样,比如在线百科图谱DBpedia包含数千种常见语义关系;结构友好,通常表达为RDF三元组,这是一种对于机器而言能够有效处理的结构;质量也很精良,因为知识图谱可以充分利用大数据的多源特性进行交叉验证,也可利用众包保证知识库质量。所以知识图谱成为了让机器理解自然语言所需的背景知识的不二选择。

    既然机器理解自然语言需要背景知识,我对于当前的自然语言处理有个重要看法:我认为自然语言处理走向自然语言理解的必经之路是知识,我将我的这个观点表达为NLP+KB=NLU的公式。很多NLP从业人员有个体会,明明论文里面报道的在某个benchmark数据95%准确率的模型一旦用到实际数据上,至少有10个百分点的下降。而最后那几个点的准确率的提升需要机器理解自然语言。这一点在司法、金融、医疗等知识密集型的应用领域已经体现的非常明显了。比如在司法领域,如果不把司法背后的事理逻辑、知识体系赋予机器,单纯依赖字符数据的处理,是难以实现司法数据的语义理解的,是难以满足司法文本的智能化处理需求的。

    因此,NLP将会越来越多地走向知识引导的道路。NLP与KB将走向一条交迭演进的道路。在知识的引导下,NLP模型的能力越来越强,越来越强大的NLP模型,特别是从文本中进行知识抽取的相关模型,将会帮助我们实现更为精准地、自动化抽取,从而形成一个质量更好、规模更大的知识库。更好的知识库又可以进一步增强NLP模型。这种循环迭代持续下去,NLP最后将会非常接近NLU,甚至最终克服语义鸿沟,实现机器的自然语言理解。

    最近几年,这条技术演进路线日渐清晰,越来越多的顶尖学者有着与我类似的看法,我的研究团队沿着这条路径做了很多尝试,初步看来效果显著。当然这些都是一家之言。也有不少人认为依靠纯数据驱动的自然语言处理模型也可实现机器的自然语言理解,特别是当下深度学习在自然语言处理方面还十分流行,我所倡导的知识引导下的NLP发展路径多少有些显得不合时宜。

    这里,通过一个实际案例论证知识对于NLP的重要作用。在问答研究中,自然语言问题的理解或者语义表示是一个难题。

    同样语义的问题表达方式往往是多样的,比如不论是how many people are there in Shanghai? 还是 what isthe population of Shanghai,都是在问上海人口。又或者形式上看上去很接近的问题,实质语义相差很大,比如“狗咬人了吗”与“人咬狗了吗”语义完全不同。

    当问题答案来自于知识库时,这类问题就属于KBQA(面向知识库的自然语言问答)的研究内容。KBQA的核心步骤是建立从自然语言问题到知识库中的三元组谓词的映射关系。比如上面的两个与上海人口相关的问题,都可以映射到知识库中的Population这个谓词。一种简单的办法是让机器记住问题到谓词的映射规则,比如机器记住“How many people are there in Shanghai?”映射到上海这个实体的Population谓词上。但这种方法没有把握问题语义本质,如果用同样的句式问及北京、南京,甚至任何一个城市人口呢?难道机器需要为每个实例记住这些映射么?显然我们人类不是如此理解问题语义的,我们是在“How many people are there in $City?”这个问题概念模板层次把握问题语义的实质的。利用概念模板不仅避免了暴力式的记忆,同时也能让机器具备类人的推理能力。

    比如,如果问到“How many people are there in XXX?”,机器只要知道XXX是个city,那么这个问题一定是在问XXX的人口数量。那么我们怎么生成这种问题概念模板呢,我们用概念图谱。概念图谱里面含有大量的类似shanghai isa city,beijing isa city 这类知识。充分利用这些知识可以得到自然语言问题的有效表示,从而实现机器对于自然语言问题的语义理解。

    知识图谱对于认知智能的另一个重要意义在于:知识图谱让可解释人工智能成为可能。“解释”这件事情一定是跟符号化知识图谱密切相关的。因为解释的对象是人,人只能理解符号,没办法理解数值,所以一定要利用符号知识开展可解释人工智能的研究。可解释性是不能回避符号知识的。

    我们先来看几个解释的具体例子。比如,我若问鲨鱼为什么可怕?你可能解释说:因为鲨鱼是食肉动物,这实质上是用概念在解释。若问鸟为什么能飞翔?你可能会解释因为它有翅膀。这是用属性在解释。若问鹿晗关晓彤前些日子为什么会刷屏?你可能会解释说因为关晓彤是鹿晗的女朋友。这是用关系在解释。我们人类倾向于利用概念、属性、关系这些认知的基本元素去解释现象,解释事实。而对于机器而言,概念、属性和关系都表达在知识图谱里面。因此,解释离不开知识图谱。

    沿着这个思路,我们做了一些初步尝试,我们首先试着利用知识图谱做可解释推荐。我们目前的互联网推荐,只能给我们推荐结果,却无法解释为什么。可解释推荐将是未来推荐研究的重要领域,将是具有巨大商业价值的研究课题。我们初步实现了可解释的实体推荐。若用户搜索了“百度”和“阿里”,机器推荐“腾讯”,并且解释为什么推荐“腾讯”,因为他们都是互联网巨头、都是大型IT公司。这里实质上是在利用概念展开解释,这些概念可以在很多概念图谱,比如英文概念图谱Probase,和中文概念图谱CN-Probase里找到。

    另一个例子是让机器解释概念。比如向机器提及“单身汉”这个概念,机器能否自动产生“男性”、“未婚”这样的属性用于解释这个概念。我们针对富含实体、概念和属性信息的大型百科图谱展开挖掘,自动挖掘出常见概念的定义性属性。这些定义性属性可以帮助我们完善概念图谱,也就是为概念图谱上的每个概念补充定义性属性信息;进一步可以利用这些信息让机器利用属性对于实体进行准确归类。这一归类过程本质上是在模拟人类的范畴化过程。

    知识图谱的另一个重要作用体现在知识引导将成为解决问题的主要方式。前面已经多次提及用户对使用统计模型来解决问题的效果越来越不满意了,统计模型的效果已经接近“天花板”,要想突破这个“天花板”,需要知识引导。

    举个例子,实体指代这样的文本处理难题,没有知识单纯依赖数据是难以取得理想效果的。比如“张三把李四打了,他进医院了”和“张三把李四打了,他进监狱了”,人类很容易确定这两个不同的“他”的分别指代。因为人类有知识,有关于打人这个场景的基本知识,知道打人的往往要进监狱,而被打的往往会进医院。但是当前机器缺乏这些知识,所以无法准确识别代词的准确指代。很多任务是纯粹的基于数据驱动的模型所解决不了的,知识在很多任务里不可或缺。比较务实的做法是将这两类方法深度融合。

    实际上在很多NLP应用问题中,我们在尝试用知识引导突破性能瓶颈。比如在中文实体识别与链接中,针对中文短文本,在开放语境下,在没有充分上下文,缺乏主题信息的前提下,这一问题仍然十分困难,现在工业界最高准确率大概60%多的水平。当前机器仍然难以理解中文文本中的实体。最近,我们利用中文概念图谱CN-Probase,给予中文实体识别与链接任务以丰富的背景知识,取得了十分显著的效果。我们知道打球的李娜和唱歌的李娜不是同一个人,现在即便这两人在文本中同时被提及,机器也能准确识别并加以区分。

    知识对于认知智能又一个很重要的意义就是将显著增强机器学习的能力。

    当前的机器学习是一种典型的“机械式”学习方式,与人类的学习方式相比显得比较笨拙。我们的孩童只需要父母告知一两次:这是猫,那是狗,就能有效识别或者区分猫狗。而机器却需要数以万计的样本才能习得猫狗的特征。我们中国学习英语,虽然也要若干年才能小有所成,但相对于机器对于语言的学习而言要高效的多。

    机器学习模型落地应用中的一个常见问题是与专家知识或判断不符合,这使我们很快陷入进退两难的境地:是相信学习模型还是果断弃之?机器学习与人类学习的根本差异可以归结为人是有知识的且能够有效利用知识的物种。

    我相信,未来机器学习能力的显著增强也要走上知识的充分利用的道路。符号知识对于机器学习模型的重要作用会受到越来越多的关注。这一趋势还可以从机器智能解决问题的两个基本模式方面加以论述。机器智能的实现路径之一是习得数据中的统计模式,以解决一系列实际任务。另一种是专家系统,专家将知识赋予机器构建专家系统,让机器利用专家知识解决实际问题。

    如今,这两种方法有合流的趋势,无论是专家知识还是通过学习模型习得的知识,都将显式地表达并且沉淀到知识库中。再利用知识增强的机器学习模型解决实际问题。这种知识增强下的学习模型,可以显著降低机器学习模型对于大样本的依赖,提高学习的经济性;提高机器学习模型对先验知识的利用率;提升机器学习模型的决策结果与先验知识的一致性。我个人倾向于认为:机器学习也面临一次全新机遇。我将其总结为ML+KB=ML2,也就是说机器学习在知识增强下或许就是下一代机器学习。

    沿着上面的思路我们也做了一些尝试。在自然语言生成任务中,我们的机器学习模型,特别是深度生成模型会经常生成很多不符合语法、或者不符合语义的句子。我们人类显然可以总结出很多语法语义规则用于描述什么是好的自然语言语句。但是这些知识还很难被机器有效利用。这就需要把语法、语义知识用规则、符号的方式表达出来,并有效融合到深度生成模型里面。最近,我们基于对抗生成网络初步实现了这一目标。并将融合了先验知识的语言生成模型用于从知识库三元组自动生成自然语言问题,并将这一技术用于文本验证码。具体技术细节可以参考我曾做过的一个技术报告《未来人机区分》。

    知识将成为比数据更为重要的资产。前几年大数据时代到来的时候,大家都说“得数据者得天下”。去年,微软研究院的沈向阳博士曾经说过“懂语言者得天下”。而我曾经论述过,机器要懂语言,背景知识不可或缺。因此,在这个意义下,将是“得知识者得天下”。如果说数据是石油,那么知识就好比是石油的萃取物。如果我们只满足卖数据盈利,那就好比是直接输出石油在盈利。但是石油的真正价值蕴含于其深加工的萃取物中。石油萃取的过程与知识加工的过程也极为相像。都有着复杂流程,都是大规模系统工程。我今天的报告就是在当前的时代背景下重新解读图灵奖获得者,知识工程的鼻祖,费根鲍姆曾经说过的一句话“knowledge is the power in AI”。这句话已经出现几十年了,在当今语境下需要重新解读。

    最后用三个总结结束今天的报告。总结1概括了这个报告的主要观点。总结2试图再次强调我的三个观点。总结3想用一句话再次强调知识的重要性。知识的沉淀与传承铸就了人类文明的辉煌,也将成为机器智能持续提升的必经之路。只不过到了机器身上,知识的沉淀变成了知识的表示,知识的传承变成了知识的应用。所以,知识的沉淀和传承不仅铸就了人类文明的辉煌,或许也将造就机器智能的全新高度。

    科学网、科技网、交通新闻网
    6
    今日Nature: 如同SARS, 中国致命猪瘟病毒又源自蝙蝠!
    导 读
    2002年,冠状病毒(SARS-CoV)引起的非典型肺炎病例在中国南方出现,导致8000多人感染、774人死亡(相关报道见:http://www.who.int/csr/sars/en/)。SARS事件证明了冠状病毒能够在人体内引起致命疾病。之后相关研究将蝙蝠鉴定为SARS冠状病毒的储库,显示这种病毒很可能起源于蝙蝠,进一步表明蝙蝠是高致死性人畜共患病毒的重要宿主,譬如亨德拉、尼帕、埃博拉病毒和马尔堡病毒。

    2016年-2017年间,在距离SARS病例出现地点约100公里的清远市养猪场,爆发了一系列致命猪病疫情。病猪出现了严重的急性腹泻、急性呕吐,导致新生仔猪体重迅速降低,受感染的仔猪在发病后2-6天死亡,受感染的母猪只有轻微的腹泻,大多数母猪在两天内恢复。其中,五天或更小的仔猪的死亡率高达90%,八天以上的仔猪死亡率降至5%。

    今天,《自然》在线发表了我国学者的最新相关研究。石正丽、童贻刚、马静云、王林发及研究团队发现了导致这种猪急性腹泻综合症(SADS)疫情的源头——一种新型的HKU2相关冠状病毒,它的基因组与一种蝙蝠携带的冠状病毒的基因组相似。这种蝙蝠冠状病毒是研究者于2016年在某个养猪场附近的蝙蝠洞穴里分离出来的。

    2016年,猪病疫情爆发后,工作人员在死亡仔猪的肠内发现了猪流行性腹泻病毒(PEDV,一种冠状病毒)。2017年1月12日以后,疫情仍在加剧,然而却无法在死亡仔猪中检测到PEDV,同时也未检测到其他病毒,表明引起疫情的是一种新型致病病毒,研究者将其称作SADS-CoV。随后,在该农场20-150公里范围内的另外三个养猪场内也出现了类似疫情。截至2017年5月2日之前,这种疾病在这四个农场共造成24693头仔猪的死亡。之后疫情得到隔离控制。

    为了鉴定潜在的病原体,研究者收集了患病仔猪的小肠样品,通过使用新一代测序(NGS)技术进行宏基因组学分析。结果显示,在四个农场的样本中均检测到了序列相同的SADS-CoV病毒。

    通过针对核衣壳基因的qPCR检测,研究者在患病仔猪和母猪中检测到SADS-CoV,在健康猪及未出现疫情农场的样本中没有检测到该病毒。结果显示,SADS-CoV病毒在仔猪中的复制率高于母猪。与其他猪肠道冠状病毒一样,该病毒具有侵袭小肠组织的特异倾向。

    通过血清学检测,研究者发现,恢复期的母猪感染后三周内SADS-CoV呈阳性。为了查明是否存在人畜共患的可能性,研究者使用相同的萤光素酶免疫沉淀系统方法,分析了35名与病猪紧密接触的农场工人的血清样品,并没有检测到该病毒。

    为了明确病毒的传播路径,研究者筛选了2013年至2016年期间在广东省七个不同地点收集的591个蝙蝠肛拭子,发现有9.8%的样本含有类SADS-CoV病毒,这些样本来自同为SARS冠状病毒天然宿主的菊头蝠。通过比对蝙蝠携带的病毒基因组与SADS-CoV基因组,研究者发现二者具有96%至98%的相似度。

    为了明确病毒的进化关系,基于病毒基因组的系统发生分析结果显示,蝙蝠携带的病毒具有高度的遗传多样性,与其宿主之间有强大的协同进化关系。
    蝙蝠来源病毒和SADS-CoV病毒的基因组及系统发生分析
    然而,分子时钟分析未能建立基因组序列分歧与采样日期之间的正向关联。因此,研究者推测该病毒可能多次从蝙蝠传给猪,也可能一次传给猪之后经过基因重组扰乱了分子时钟。

    为了进一步明确疫情确实是由该病毒导致,研究者进行了动物感染实验。其中,一项实验是将感染了SADS-CoV的肠组织匀浆应用于实验仔猪,另一项实验是用培养的SADS-CoV分离株感染健康仔猪。结果显示,受感染的所有仔猪均出现水样腹泻、体重迅速减轻和肠道损伤(实验终止后安乐死后测定)。组织病理学检测显示,受感染仔猪中的小肠绒毛显著萎缩,小肠上皮细胞中观察到了病毒蛋白。

    随着类似传染疾病的不断爆发,该研究表明,理解蝙蝠和其他野生动植物携带的病毒多样性相当重要。相关部门应积极监控蝙蝠及其他野生动物中的病毒性感染,尤其是在新兴疾病出现的热点地区(譬如中国南方),对兽医卫生、公共卫生和全球经济具有重要意义。

    以下是石正丽、童贻刚、马静云、王林发四位作者访谈内容。

    问:目前很多疫病初期症状很相似,我们如何能准确判定该疫情有潜在高危性呢?

    答:目前来看,新发传染病的检测需往前移,建立很好的预防检测机制,并且这个工作需要全球范围科学家一起合作去了解自然界动物携带的病毒,评估传染到人类的可能性,早期建立预警和预防。这次能这么快也得益与前十年的积累,目前也有很多病毒学的研究计划,旨于尽早建立模型,进行长期的跟踪监测。

    问:本次发现的冠状病毒的传播途径是什么呢?

    答:由于病毒在肠道里面增殖,所以主要是粪便污染传播。疾病暴发后在猪场周围的确观察到有蝙蝠飞翔,这些猪场是建在山丘傍边,推测附近有蝙蝠聚集地。

    问:为什么该病毒在空肠部分更集中繁殖呢?

    答:因为这个部位的病毒受体表达量是最多的。

    问:我们知道这一次疫情的发现和控制速度非常之快,那么请问从历史上讲一下这一次的速度相对快了多少?

    答:我们可以和SARS做比。这一次发现很大的意义在于其病发动力学和SARS很接近,也是从蝙蝠来的。SARS从2003年10月发现病例到找到病原经历了5、6个月。直到多方合作发现病毒来源于蝙蝠已经到了2005年,跨度达到18-24个月。这一次从看到病例后,2月内我们就搞清楚了所有问题,2003年到2017年,这是将近10倍的增幅。这得益于四个方面1)团队合作和团队之间的了解,才能很好的技术互补;2)备战意识,战胜传染病就像战争反恐,在还未扩大时及时防控;3)人才的培养,年青一代地贡献也非常重要;4)先进技术的利用,建立新的研究方法,及时控制疫情。

    问:SARS的源头是蝙蝠,这次的源头也是蝙蝠,有什么内在原因吗?如果食用了带该病毒的猪有什么后果?

    答:这与蝙蝠是唯一一种飞行的哺乳动物有关,为了适应飞行,他的很多免疫防御系统为了适应飞行变异的和普通陆地上的哺乳动物不一样了,他的免疫系统可以与很多病毒共生。这是一个很大的命题,还有很多研究正在进行中。目前这个病毒还不能感染人,理论上对人无害。其次高温烹调可以破坏病毒,所以人食用了不会有什么风险。目前血清学证据也还没发现人能感染该病毒,但是细胞学上看还是能感染一些人的细胞,所以还是有一定风险感染到人的。

    问:病毒的变异非常快,对于疫苗和药物的研发等速度的不匹配有什么解决方式吗?

    答:这个有两方面,1)从病毒方向看,我们需要找到广谱的抗病毒机制,2)我们需要研究机体对病毒的反应,其实很少有病毒杀了我们,都是自己杀自己,要研究机体的免疫反应,研究的药物可以针对机体进行,达到感染不发病的目的。就像蝙蝠的免疫一样,携带而没有发病。
    7
    误报率太高! 人工智能在安防行业应用依旧挑战重重
    人工智能技术在安防领域的应用已经发展了很多年,但由于硬件本身问题以及算法、算力等制约,很长一段时间内都没有取得较大突破。随着近年来人工智能技术的发展,尤其深度学习技术的突飞猛进,使得AI在安防行业应用赢来了重大转机与突破。从2017年深圳安博会的火爆现象,就可以看出“人工智能+安防”广阔的市场发展空间。
    安防行业,尤其是视频监控行业因其自身特点,理所当然的成为了人工智能的天然试验场。遍布全国各地,数以亿计的视频监控摄像机7*24小时不间断采集视频图像,产生了海量的大数据。尤其是高清网络摄像机的普及应用,数据量更是呈指数级飞速增长。如果依靠传统的人工进行管理、查询,显然已经无法满足当前社会治安管理的需求。因此,安防行业拥抱人工智能技术已是必经之路。
    全球人工智能火热,带动了一大批人工智能初创企业的出现,各种先进的人工智能技术方案不断涌现。而拥有海量大数据与垂直刚需应用的安防行业自然也成了这些AI初创企业技术方案的最佳落脚点。因此,海康、大华、宇视、科达等传统安防企业纷纷拥抱人工智能;商汤、旷视、依图、云从等AI新贵全面进军安防应用,充分体现了当前安防行业发展的趋势。
    据报道,凭借着网络高清摄像机的应用以及人工智能技术加持,社会治安破案率得到了明显提升。甚至有的部分地区数据显示,由于高清网络摄像头和人脸识别技术的应用,不仅破案率极大提升,甚至案发率也大幅下降。尽管当前人工智能技术已经极大改善了视频监控的应用,但从实际应用情况来看依然面临着许多挑战。
    笔者近期参加了雷锋网主办的2018中国安防AI峰会,海康、大华、宇视等中国安防前三强都先后登台,展示了自家AI+安防解决方案。虽然各自的产品与解决方案有所差异,但是大家都共同传达了一个观点。那就是当前安防行业人工智能技术应用依旧挑战重重。
    例如,误报率太高。在峰会上中科奥森董事长李子青教授举例说明,以某一个辖区1000路视频抓拍人像,并且有一个黑名单库,1000路在深圳算是一个小的系统。1千个这样的系统,假设每个摄像头每10秒或者5秒抓拍一张人脸,该辖区每秒钟抓拍100张图象,该辖区每天要产生864万张抓拍人脸,与20万人的数据库比对次数高大1.728万亿次。

    李子青教授表示,对动态人脸识别的性能要求,我们希望通过率比较高,比如说90%的通过率,在动态人脸监控上面算是比较高的,它每天的误报个数要少于200个。现在的问题是误报率太高,每次都是“狼来了”,所以公安对这个东西一方面非常想用,另一方面又老是误报,所以他就把这个东西禁用了,甚至最后放弃,在过去几年有很多实施的动态人脸监控最后都放弃了。
    众所周知,安防视频监控应用场景非常复杂多变。监控摄像头除了监控行人之外,还要监控汽车、物体、事件等等。每一种监控对象都有责不同特征,如监控行人需要了解到性别、年龄、身高、穿着、是否戴眼镜等等信息,对于汽车除了要识别车牌,还需要更多细节特征,如颜色、品牌等等,并结构化处理并存储信息,后续才能高效利用或作出相应的预判。
    但是在实际应用中,我们往往会遇到很多来自不同场景的挑战。例如人口密集的车站。

    李子青教授表示,静态人脸识别以及很成熟了,但动态人脸识别目前仍然还面临着巨大的挑战。除了前端高清摄像机必须要能够采集到高质量的人脸信息之外,还需要强大的算法和算力支持。通过神经网络、深度学习、大数据自主训练以及高性能并行计算能力等等综合提升才能解决当前应用难题。
    深度学习是需要进行大量的大数据训练,目前有的AI企业采用人工对数据进行标注,费时费力。李子青教授表:“我认为深度学习还有一定的发展空间,不管是提升算法、改进网络架构,还是通过增大数据标注的方式,提升的空间并不大,它已经接近天花板,具体是多少,我不能给一个定量,我们必须在这方面突破,必须像开复老师说的那样,要形成应用场景的数据闭环,能够利用生产环节的大数据进行自主标注、自主学习,不管你会不会标注,至少是自主学习”。
    宇视总裁张鹏国近期也表示,人脸识别目前在商业落地上有很大的挑战。“想象一个千万人口的城市,在99%的识别率下,还有10万人没有被识别。”

    此外,安防视频监控是一个系统工程,AI技术在视频监控的应用挑战,同样贯穿于前端、传输、存储、应用等等每个环节。随着神经网络、深度学习、边缘技术等技术的进步、算法的不断优化、计算机性能提升,当前面临的种种问题都会逐步得到有效解决。
    同时,由此我们也可以看到,随着安防与AI的深度融合,对安防企业的技术研发实力要求也越来越高,如果无法在这一波AI浪潮中站住脚跟,势必会被市场淘汰。难怪大家都在戏称,如今安防企业不做AI,都不好意思说自己是安防企业了。

    8
    不用地图如何导航?DeepMind提出新型双路径强化学习「智能体」架构
    一直以来,导航都是一项重要的认知任务,它使人类和动物在一个复杂的世界里,在没有地图的情况下,能够穿越遥远的距离。可以这样说,能够在非结构化环境中导航是智能生物的基本能力,因此这对于人工智能的研究和开发具有根本性的作用。最近,DeepMind提出了一种全新的、双路径智能体结构,该结构采用端到端的强化学习进行训练,可处理城市级规模的真实视觉导航任务。

    在你童年生活中,你是如何学会对你所在的社区进行导航的?你是如何导航去你的朋友家、去学校或者去杂货店的?可能没有地图,只要记住街道的视觉外观,就可以沿着路转弯。当你逐渐探索了你所在的社区之时,你变得更加自信了,掌握了自己的去向,并学习了新的、越来越复杂的路径。你可能短暂地迷失过方向,但又因为地标的出现,或者甚至可能是通过看太阳找到一个即时指南针,从而再次找到了你的路线。

    导航是一项重要的认知任务,它使人类和动物在一个复杂的世界里,在没有地图的情况下,能够穿越遥远的距离。这样的远程导航可以同时支持自我定位(“我在这里”)和目标表征(“我要去那里”)。

    在《学习在不使用地图的情况下在城市中进行导航》这篇论文中,我们呈现了一种交互的导航环境,它使用了来自谷歌街景 (Google Street View)的第一人称视角照片,并将该环境进行游戏化以训练人工智能。根据街景图片的标准,人脸和车辆牌照都被模糊了且无法辨认。我们建立了一个基于神经网络的人工智能体,它可以利用视觉信息(来自街景图像的像素)来学习如何在多个城市中进行导航。请注意,这项研究是关于广义的导航的,而不是驾驶;我们没有使用交通信息,也没有试图对车辆控制进行建模。

    当智能体到达目标目的地(例如,特定的一对纬度和经度坐标)时,它就会得到奖励。它就像一个快递员,有着无止境的交付任务,但它没有地图。随着时间的推移,人工智能体学会以这种方式跨越整个城市。我们还证明了,我们的智能体可以在多个城市中学习这项任务,然后鲁棒性地适应一个新的城市。
    学习在不需要构建地图的情况下进行导航

    我们背离了那种依赖于显式测绘和探索的传统方法(就像试图将自己定位并同时绘制地图的那种制图师)。与此相反,我们的方法是学习人类过去常常使用的那种方法进行导航——没有地图、GPS定位或者其他的辅助手段,只使用视觉观察。我们构建了一个神经网络智能体,它输入从环境中观察到的图像,并预测在该环境中它应该采取的下一步行动。我们使用深度强化学习来对它进行端到端的训练,类似于最近的一些关于学习如何在复杂的3D迷宫中进行导航的研究,以及在玩游戏中使用引入了无监督辅助任务的强化学习的研究。与那些在小规模模拟迷宫环境中进行的研究不同,我们利用了城市规模的真实世界数据,包括复杂的十字路口、人行道、隧道,以及横跨伦敦、巴黎和纽约的各种拓扑结构。此外,我们使用的方法还支持特定城市的学习和优化,以及泛化的、可迁移的导航行为。

    可以迁移到新城市的模块化神经网络架构

    我们的智能体中的神经网络在由三部分组成:1)一个能够处理图像并提取视觉特征的卷积网络;2)一个特定于地区的循环神经网络,它隐式任务是负责记忆环境以及学习“这里”(智能体的当前位置)和“那里”(目标的位置)的表征;3) 不因地区改变的循环网络,它生产出智能体行为的导航策略。特定于地区的模块被设计为可互换的,正如其名称所示,这个模块对于智能体所导航的每个城市来说都是独一无二的,但视觉模块和策略模块是可以不因地区改变的。

    就像在谷歌街景界面中一样,智能体可以在适当的位置进行旋转,或者在可能的情况下前进到下一个全景图。与谷歌地图和街景环境不同的是,该智能体没有看到小箭头、局部地图或全局地图,也没有看到著名的小黄人(Pegman):它需要学习区分开放的道路和人行道。在现实世界中,目标目的地可能在几公里之外,并需要智能体跨过数百幅全景图才能到达目的地。

    我们证明了,我们所提出的方法可以提供一种将知识迁移到新城市的机制。和人类一样,当我们的智能体访问一个新城市时,我们希望它必须学习一套新的地标,但不需要重新学习它的视觉表征或它的行为(例如,沿着街道向前走,或者在十字路口转弯)。因此,我们使用了多城市(MultiCity)架构,首先在许多城市进行了训练,然后我们冻结了策略网络和视觉的卷积网络,并且在一个新城市中只有一条特定于地区的路径。这种方法使智能体能够获得新的知识,而不会忘记它已经学过的知识,这与渐进式神经网络架构(progressive neural networks architecture.)类似。

    研究导航是研究和发展人工智能的基础,尝试在人工智能体中复制导航也能帮助科学家了解其生物学基础。

    论文简述
    可以这样说,能够在非结构化环境中导航是智能生物的基本能力,因此这对于人工智能的研究和开发具有根本性的作用。远程导航是一项复杂的认知任务,它依赖于开发一个空间的内部表征,以可识别的地标和具有鲁棒性的视觉处理为基础,可同时支持连续的自我定位(“我在这里”)和目标表示(“我将去那里”)。

    基于最近进行的将深度强化学习应用于迷宫导航问题的研究,我们提出了一种可应用于城市规模的端到端深度强化学习方法。认识到成功的导航依赖于通用策略与特定于地区的知识的集成,我们提出了一种双路径体系架构,可以将特定地区的特征封装起来,同时仍然能够迁移到多个城市。

    我们展示了一个交互式导航环境,它使用Google StreetView作为其照片内容和全球范围性的覆盖范围,并且证明我们的学习方法使得智能体能够学习在多个城市进行导航,并且能够穿过可能在数公里之外的目标目的地。

    一直以来,关于导航这一主题吸引了各种研究学科和技术领域科学家们的关注,从希望破解网格代码和位置细胞(place cells)的神经科学家角度来看,它一度成为研究的主题;同时对于希望构建可以到达特定目的地的移动机器人研究来说,它也是机器人研究的一个基本方面。

    大多数算法都涉及在探索阶段构建显式映射,然后通过该表征进行规划和行动。在这项研究中,我们试图通过提出一种新方法并展示其在大规模实际环境中的性能,从而挑战端到端深度强化学习的导航极限。正如人类可以不依赖地图、GPS定位或其他辅助工具而学习在城市中进行导航一样,我们的目标是证明神经网络智能体可以仅通过使用视觉观察便可横穿整个城市。

    为了实现这一目标,我们设计了一个交互式环境,使用Google StreetView中的图像和基本连接信息,并提出了一种可在环境中导航的双路径智能体体系结构。

    通过使用可以从任务奖励中进行学习的深度强化学习方法(例如,导航到目的地),在某些领域内,学习直接通过视觉输入进行导航已被证明是可能的。最近的研究已经证明,强化学习智能体可以学习对家庭场景(Zhu等人于2017年、Wu等人于2018年提出)、迷宫(Mirowski等人于2016年提出)和3D游戏(例如Lample和Chaplot于2017年提出)进行导航。

    尽管取得了成功,但众所周知,深度强化学习方法数据低效且对环境干扰异常敏感,并且在游戏和模拟环境中的成功要远远高于其在实际环境中的应用。因此,它们不可以用于基于真实图像的大规模视觉导航,从而它也是我们此次研究的主题。

    我们的贡献

    本文的主要贡献是提出了一种全新的、双路径智能体结构,该结构采用端到端的强化学习进行训练,可处理城市级规模的真实视觉导航任务。我们提出的智能体展示了目标依赖性学习,这意味着策略和价值函数必须学会适应一系列作为输入而给定的目标。

    此外,该方法具有一种循环神经结构,即支持特定语言环境的学习,也支持通用的、可迁移的导航行为。平衡这两项能力是通过将循环神经路径从智能体的通用导航策略中分离出来实现的。该路径解决了两点需求。首先,它接收并解释了环境给出的当前目标。其次,其次,它封装并记忆了单个城市地区的特征和结构。因此,我们不使用地图或外部存储器,而是提出了具有两条循环路径的体系架构,这可以有效解决单个城市中具有挑战性的导航任务,并仅通过训练新的特定语言环境路径即可迁移到新的城市或地区。

    我们在一个新的强化学习交互环境中演示了所提出的智能体架构,该环境将现实世界的图像作为智能体观测,具有全球规模性和多样性,以及聚于建立在Google StreetView之上的现实世界的基础内容。在该环境中,我们研发了一项遍历任务,要求智能体在伦敦、巴黎和纽约市内完成从一点到另一点的导航。我们任务的现实世界类比是,在一个给定的城市中,信使从一点A出发(该点是任意选定的),到指定的地点B,这一过程中没有给出该区域的地图,也没有给出从A到B的路线,更没有给出各点的具体方位。

    导航是一项重要的认知任务,它使人类和动物能够在没有地图的情况下穿越复杂的世界。我们提出了一种解决城市级现实环境中任务的深度强化学习导航方法,引入并分析了一项新的信使任务,同时,我们还提出了一个多城市神经网络智能体架构,演示了该如何将其迁移到新的新环境。

    9
    “海龙Ⅲ”潜水器完成4500米级海试
    新华社“大洋一号”4月5日电(记者陈灏)中国自主研发的“海龙Ⅲ”无人潜水器4日傍晚至5日凌晨在西太平洋进行了4500米级海试,最大潜深4266米,圆满完成海试目标。
    北京时间4月4日18时30分,“海龙Ⅲ”从正在执行2018年综合海试任务的“大洋一号”科考船入水,加挂浮球后开始下潜。21时24分,监控系统显示,“海龙Ⅲ”下潜到4266米深、离海底3米的近底位置,传回海底画面并完成标识物投放,随后进行了航行等试验。5日0时15分,“海龙Ⅲ”回到母船“大洋一号”甲板。
    海试现场验收专家组组长杨磊介绍,“海龙Ⅲ”在水下测试了运动性能、拍照摄像等功能,以及机械手、宏生物取样器等作业工具,测试参数达到了设计指标,满足验收条件,为后续的海上应用奠定了坚实基础。他说,“海龙Ⅲ”在深海探测领域具有广阔的应用前景,可成为海洋观测、深海探测与取样的良好作业平台。
    3月24日和25日,“海龙Ⅲ”分别完成了400米和2000米两个级别的海试。“海龙Ⅲ”原计划在3月底开展4500米级海试,但受台风“杰拉华”影响,原定作业海域海况较差,“大洋一号”边迂回穿插避风,边寻找合适的海试作业地点。“大洋一号”首席科学家初凤友说:“4266米的深度已经是能找到的最佳位置,周边海域水深均不满足作业条件。”
    “海龙Ⅲ”是在中国大洋协会组织下,由上海交通大学水下工程研究所开发的勘查作业型无人缆控潜水器,设计最大作业水深6000米,具备海底自主巡线能力和重型设备作业能力,可搭载多种调查设备和重型作业工具。                              
    凤凰科技网、网易科技等
    10
    (发表于《中华读书报》2018年4月4日,第七版。原文很长,这是编辑删减后的版本,发表时又有删节。)
    择师如择父——怀念金吾伦先生
    田  松
    图注1:2017年8月14日下午5:56, 我相机里最后一张金吾伦先生的照片。摄于金老师家中书房。左上方书架里是于光远先生遗照,上有金老师手书:光远老师千古。


    上个星期六(1月20日)上午,经过多日忙碌奔波,终于可以在长春老家安静几天,便想着整理一下去年发表的作品。我先把《死亡是一种能力》在博客上贴出来,正在做最后的编辑,看到刘钢师兄在群里发了一个消息,我们的导师金吾伦先生在两个小时前去世了。我马上联系我们的师妹吴奇。这些年她与金老师一家走动最多,照顾最多。我作为师兄,发自内心地感谢吴奇和她的先生方刚,在某种意义上,是他们在替我们尽弟子之责。电话接通时,吴奇已经赶到朝阳医院。师母说,一切从简。电话中,得知金老师是在家中离世,让我感到一丝安慰。



    回忆起来,我第一次拜见金老师应该是在1997年的冬天,整整二十年了。二十年说来不短,但与同龄人相比,与金老师的交往算是晚的。很多同行都是学生时代就耳闻金老师的大名,目睹金老师的风采。而我则是在工作十年之后才成为金老师的博士。
    在我的不长不短的人生中,或者是由于亚文化冲突,或者是由于不通世故,或者是由于心理故障,我常常遭受黑色幽默的打击。当时我连续两年考博北大科社中心,成绩过了,榜都落了。作为曾经的文学青年,我最初所热衷的专业其实是文学和艺术。在调研了连续几年的博士考题之后,我发现自然辩证法(科技哲学)这个专业,是我最容易考的。除了英语,几乎不用复习。我搬来了将近二十年的《自然辩证法研究》和《自然辩证法通讯》的合订本,精读加泛读,迅速熟悉了这个领域,也为我在自发状态下的思考确定了位置。对这个专业产生了路径依赖,决定再考一次。董光璧先生,我的学术引路人,给我介绍了金吾伦和陈久金两位先生。

    第一次拜访金老师,是在他的家里,印象里满屋子书,灯光灰暗,我们在书的缝隙里相对而坐。我的主要意图,是向老师讲述我个人不断拐弯的经历,讲述我思考的问题,我为什么要考博,以及前两年的考博经历。
    我那时受了一点儿自由主义的毒害,听闻美国大学里,导师与学生都是直呼其名,学生说到自己的导师,会说I work with someone,介词是with,不是under。两者是平等的合作关系,而不是上下指导的关系。作为一个自高自傲自卑自怯的人,我向往这样的关系。武侠小说里常写,师父选徒弟,徒弟也选师父。所以投考之前,一定要先见师父,看是否投缘。
    我曾经对人文学术有很多理想主义的想象,觉得京城的学术圣殿里面坐着的,都是自带光环的大学者,学问高深,道德高尚。回想第二次考博,如果事先能够与临时被指派的导师沟通,可能是另一个结果。
    面试中,某位老师问了一个很常规的问题,为什么要考科哲。我便讲了我对这个专业的长久向往。比如早在吉大物理系读书时,就自费订阅了《自然辩证法通讯》,表明我对作为哲学的物理学比物理学本身更感兴趣。似乎也讲到我在南大物理系思考科学与人类幸福的关系,并且得出了一个反科学的结论——两者并不存在正相关,甚至可能正好相反——这成为我厌学物理,以至于最终决定退学的重要原因。我把自己讲得兴奋起来,顺口讲了下面的故事。
    在退学之前,我有一个转学哲学的可能性。当时南大天文学系陆埮教授在哲学系与一位教授联合带研究生,研究对称性问题。而我对这个问题恰好有兴趣,有能力。陆老师在与我谈过之后,同意我转到他的门下,介绍我找这位教授再谈。不料这位教授说:“你们学物理的,物理学不好,就转到我们哲学系来,把我们哲学系当什么了!”这话让我诧异,其一,一位老师,面对一位前来求教求助的学生,没有给出一个正当的拒绝理由——他完全可以敷衍我,比如说,你的哲学基础不够,不能要你;又或者说,如果你有意学哲学,还需要作哪些哪些努力,读哪些哪些书……而这个理由实在太可笑了,让我觉得,这不是一个好老师;其二,一位哲学教授,如此爱面子,这人的哲学境界,也未免太差了点儿。哲学不该是爱智之学吗?既然如此,转不成也好。虽然错过了陆埮先生,有所遗憾。但此事对我并不是一个打击,而是一个笑话。
    我天真地认为,大多数人应该与我有同样的想法,尤其是学哲学的。我讲了这个十年前的笑话,以明我向哲之心。不料话未落地,几位考官的表情就变了。
    最后,各位考官不留后路地给我面试不及格!笑话变成了黑色幽默。

    这段历史要不要跟金老师讲,我有些犹豫。很多朋友劝我,还是不要说了吧,也不算光彩。不过,最终,我还是执拗地决定,不回避,不遮掩,如果金老师也有同样的反应,就不考了。
    北大面试的时候说到此事,是话赶话,并非有意为之。但是见金老师,则是刻意要把丑话说在前面。金老师的反应很让我意外而欣慰,他有些激动,还有些气愤,说:“他怎么能这样说呢!物理学不好,不等于哲学学不好嘛!再说你又不是学不好,你是不想学了嘛。”
    所谓知遇之恩,不过如此吧!
    当时金吾伦老师是与刘吉老师合作带博士,所以我还需要面见刘老师。刘老师当时是社科院副院长,大领导,我硬着头皮,走钢丝一般,再次讲了这段往事。我与刘老师见面不多,每次见面,都颇觉受益。有几次,我在心情非常不好的情况下见他,他一番话下来,总能给我力量。刘老师心胸宽,看得远,对我厚爱有加,期待颇多。刘老师口才好,金句迭出,让我回味良久。记得那一次刘老师说:“我们要对自己有判断!”
    同样,陈久金先生也是很慈祥地倾听了我的故事,一笑了之。

    能够成为他们的学生,是我的幸运。在中国的语境下,导师和博士很像古时的师徒关系。一日为师,终生为父。所以择师不可不慎。我常常会遇到一些朋友,不愿意说出自己的师承。而我则永远可以坦然地自豪地宣布,我是董光璧、刘吉、金吾伦、陈久金几位先生的学生。
    他们是我的榜样。我自己有了学生之后,也常常会从反面想。所谓教学相长,作用力等于反作力,好学生就像鞭子一样,赶着老师向前走。每当有学生提出让我意外的问题,一下子把我难住的问题,都会让我心生欢喜。我希望如他们一样,成为一个好的老师,让我的学生为我自豪。



    1998年夏天,我同时收到了中国科学院和中国社会科学院的录取通知,两边的导师都为了录取我付出了额外的努力。尤其是刘吉老师,听闻他为我多方奔走,让我心生惭愧,不知何以为报。我面临着特别艰难的选择,放弃任何一方,我都会心有不甘,心有不安。最后,我发现了一个制度上的可能性,同时在两边就读。我首先咨询董先生的意见,他表示赞成。我又打电话给金老师,提出这个我自己也觉得过分的要求。没有想到,金老师非常兴奋,他说:“太好了,我支持你!”陈老师的态度有所保留,向我指出攻博的艰难,让我有心理准备,最后也表示同意。
    就这样,我1998年的9月初,在一个星期之内,先后在中科院和社科院报到,成了两院博士(生)。

    读博的第一年,最多时要在北京城里五个地点上课:花家地社科院研究生院、建国门哲学所、玉泉路中科院研究生院、朝内小街科学史所,外加在北大选修了二外。金老师没有给我安排具体任务,他有时开会,会叫我去听。每次我去,他都会非常自豪地向其他学者介绍:“这是我的学生,他是双博士!他在中科院也读了一个博士。”他讲得特别起劲儿,弄得我非常不好意思,也有点儿担心。事后我悄悄地跟他说,这事儿不能公开,万一有人起了什么念头,弄不好要退掉一个。他连连称是,不过还是忍不住,常常会跟人说:“这是我的学生,他是双博士!”
    事后知道,没过多久,两面的领导都知道了这件事儿,不过没人介意,我也得以在2001年和2002年先后获得了社科院和中科院的博士学位。

    金老师对我可谓宠爱有加。我那时觉得,我的老师们都是大学者,工作繁忙,轻易不敢打扰他们,所以常常是金老师给我打电话。
    有一次,1999年,他给我打电话,特别高兴,说:“田松啊,你看到《新华文摘》了没有啊,有你的文章啊!不错啊!”我马上去找当期的《新华文摘》,发现我的一篇关于爱因斯坦的文章被全文转载了。他给我电话,是专门告诉我这个消息。
    还有一次,2001年,金老师给我电话,说:“田松啊,你看到报纸了吗?新华社消息,提到你了。”当时杨虚杰组织了一次关于科学精神的研讨会,邀请了很多自然辩证法领域的前辈,记得于光远先生坐着轮椅到会,金老师和董老师也都去了。新华社记者在发会议消息时,引用了我的观点,并且似乎只提到了我的名字。金老师特别为我高兴,他完全不介意他自己也在场,并且他的发言没有被引用。
    当时,我并不觉得这是什么了不起的事儿。后来才慢慢意识到,并不是每位老师都有这样的胸怀。我想,如果我与我的学生同时参会,而学生的发言比我更有影响,我能否像金老师这样发自内心地为学生高兴呢?

    在金老师门下,我享有非常充分的自由。金老师是国内最早关注互联网、信息高速公路的学者之一,也在这个领域承担了一些课题。他送给我的第一本书就是《塑造未来——信息高速公路通向新社会》,我认真写了书评,发表在《中华读书报》上。其实,这是我为金老师写的唯一一篇书评。作为曾经的专栏书评人,很觉对不起老师。不过,金老师既没有要求我跟着他做课题,也没有约束我的学位论文选题。在我提出作惠勒研究之后,他马上就应允了。我曾以为,博士都是这样的。现在我自己也成了博导,对学界算是略知一二,才知道我们这样的师生关系是多么特殊而可贵。



    我是在入学之后才逐渐了解金老师的。首先知道的,是他曾在文革期间住过十年秦城。这两天,看到了李惠国老师的回忆,了解稍多细节。1967年4月-9月,金老师被北京市革委会秘书长周景芳从哲学所拉出去当了几个月秘书。1968年4月,新婚不久的金老师被破格投进秦城,一关十年。在第五年头上,狱方送来离婚协议书,金老师签字同意。据说,金老师住的是单间,常年不能关灯,睡觉必须面对监室门,让外面能够看到脸,否则就会被叫醒。金老师心胸开阔,性格好,如果换一个人,怕不能活着出来。
    秦城十年,对金老师的身体一定有很大的伤害。至少在五六年前,金老师就已经有了记忆力模糊的症状。听闻他有一次去清华讲课,在校园里转了很久,找不到教室,只好打车回家。从那以后,再也没有单独出行。2006年我第一次去美国访学,2007年回国,这事儿给他的印象应该很深。我给他打电话,他的第一句往往是:“田松,你在美国呐!”或者是:“田松,你从美国回来了!”这两句话说了很多年,后来我就直接说:“金老师,我已经回来好几年了!”但是每次电话,金老师的第一句话,常常还是后面这句。

    金老师和师母都喜欢我拍的照片。前些年金老师换房子,乔迁新居,我把我拍的风景照放大装框,制作了十几幅,送给他作装饰。再一次我去他家时,看到这些照片挂满了他家的客厅和过道,仿佛给我办影展。
    2016年11月6日,刘钢师兄出面张罗,吴奇师妹出资,为金老师张罗了一次八十寿宴;2017年1月8日,北理工喻佑斌老师为金老师张罗了一次学术纪念会。两次活动,我都给他和师母拍了不少照片。此后师母跟我要了几次照片,我总是说,过几天,过几天。数码时代,整理照片是个大工程,我常常要拖延很久,才能下定决心,拿出一个大块时间,归档几张卡的照片。
    2017年8月14日,我专程去看望他。在前一天,我专门用半天时间,把前两次活动的照片做了两个文件夹,拷贝到一个U盘里。
    那是我最后一次见金老师。
    那一次,金老师的精神很好,记忆力也好,我们聊得非常愉快。说到我的《警惕科学》,他照例跟我开玩笑:“我还在认真学习!”当时这本书的“完整版”已经到了印厂,不过还没有拿到样书。临行前,我把U盘里的照片拷贝在金老师的电脑里,又给他和师母专门拍了一些照片,在他的书房里,在我的摄影作品前面。这些照片,他再也没有看到。我原本是想今年春节期间给他送去的。

    后来的情况是听吴奇师妹说的。吴奇说,去年10月的时候,金老师的记忆力忽然恶化。她说:“金老师连我是谁都不记得了,还记得你,拿照片问他,他就指着你的照片说,这是田松,他一直记得你。”
    2017年12月,金老师又做了一次心脏支架手术,从颈动脉切一个口,伸进去,全麻。师妹说,手术前虽然记忆力不好,但是吃饭走路都正常。手术之后,他的身体一下子就不行了。师妹说着,在脖子上比了一下,让我瞬间感觉到疼痛。



    入门不久,就知道了金老师的外号:老顽童和金妖。老顽童这外号应该是借用了金庸人物,不过我并未核实。作为弟子,我当然不敢如此称呼老师。但是眼见很多同龄学者,甚至比我年纪更小的同行,与金老师不分大小地开玩笑,知道老顽童的名号并非虚妄。
    我对科学主义的批判,对科学的很多看法,在他那一代学者看来,未免过于激烈、激进,也被很多人认为是大逆不道。不过金老师对我,从来都保持着开放的心态。他有时会说:“田松啊,你这个观念我不同意。”但是他愿意倾听我进一步的陈述,以及对他的反驳,再与我讨论。他高兴我有新的想法,尽管可能会不同意。但从来没有居高临下,以老师的权威迫使我接受什么,更没有指令我写什么,不写什么。
    作为弟子,我并未直接继承金老师的学术衣钵。但是他的工作,对我有非常多、非常深的影响。

    金吾伦老师原是学化学出身。早期自然辩证法领域的学者大多有理工科背景,一直到我一代。金老师这一代学者有一些共性。学术刚起步,就遇到文革,耽误了十年;文革后,中国学术全面与西方世界接轨,开始学术转型。自然辩证法这个专业来自恩格斯的同名著作,很多人的主要工作就是阐释经典,把《自然辩证法》的基本原理,应用到各门自然科学学科中去。文革后,自然辩证法在西方世界一时找不到接轨的对象。1980年代初期,范岱年先生把他领导的《自然辩证法通讯》界定为“关于自然科学的哲学、历史和社会学的综合性理论性杂志”,此后,自然辩证法专业逐渐转型为科学技术哲学专业。金老师那一代学者的一大贡献是,对西方科学技术哲学及相关著作进行了大量的翻译和介绍,为后辈学人提供了基本文献,也影响了中国科学哲学早期的学术走向。我最早接触的金老师的书,是他在1980年代与人合作翻译的卡尔·萨根《布鲁卡的脑》。我买这本书的时候,还不认识他。
    金老师的重要译著是他与胡新和老师合作翻译的《科学革命的结构》,1980年代后期出版,是这部经典的第二个中译本。金老师在美国访问时,还曾受邀到托马斯·库恩的家中,与他见面。这是科学哲学专业的必读书,每位本专业的新生都被要求精读此书。这个译本不断再版至今,影响了一代又一代学者。
    胡新和老师已经先于金老师在2013年5月英年离世。这个译本再也无法由他们本人修订了。

    在我入门之前,金老师曾经与某位大佬进行了一场论战:关于物质是否无限可分。我基于自身的物理学和物理学哲学背景,赞成金老师的观点:物质并非无限可分。海森堡说,物理学是建立在可观测量的基础之上的。物质细分到量子层面,就已经不是直接的可观测量了。分到夸克以下,各种命名无非是口头禅,可能会有思辨的或者意识形态的意义,没有物理意义。
    董光璧先生对我说过多次,金老师是真正的哲学家。这是因为,他的工作不仅仅有对经典的阐释和译介,还有他自己的独立思考,有他个人的理论创见。金老师作为哲学家的创见,主要体现在《生成哲学》之中。这个小书很薄,但是有真知灼见。这本书对我的影响,是春雨润物、潜移默化的。
    所谓生成,是与构成相对应的。构成论是说,世界是由已经存在的事物构成的。物质不灭,能量守恒,一切变化,都是已经存在的基本原素的重新组合。所以这个世界,不会产生新的东西。这种构成论,既是本体论也是认识论,是西方思想的基本观念,也是我们当下的缺省配置。但是构成论并非是唯一的可能性。中国古代就有“一生二,二生三,三生万物”之说。金老师主张生成论,认为世界并非是由原本一成不变的事物构成的,而是会生成全新的东西的。金老师把生成的机制表述为“生成子”,并模仿麦克斯韦妖的说法,称之为“生成妖”,被其他人称为“金妖”。
    我在读博士期间,曾经照葫芦画瓢地从构成与生成的视角,对历史和科学进行过比较,并发表过文章,但并未深入研究。2008年,在对营养学的批判中,一个新的靶子逐渐明晰起来,后来我把它表述为包括机械论、还原论、决定论三个层面的机械自然观。事后回想,我才意识到,其中有生成哲学潜移默化的影响。机械自然观无疑是构成论的自然观。机械自然观是比科学主义藏得更深的缺省配置。对机械自然观的批判,是我现在批判工业文明的哲学基础之一。



    金老师的遗体告别时间被确定在星期一(1月22日)上午九点半。我马上改签机票,于星期天夜里返回北京。
    星期六去世,星期一告别,只有两天时间。数字时代的死亡文化就是这么仓促。
    金老师的弟子们决定集体送一个花圈。刘钢师兄给我一项任务,写一幅挽联。写挽联需要古文功底,并非我所擅长。但是师兄坚持,我推辞不成,还是拟了一个。

    面对现实世界,思考真的问题,生成一家之言,以金妖传世
    保持开放心态,宽容异己之言,哺育奇葩桃李,惟顽童永生

    我想表达两个意思。上联说金老师的学术,他关注现实世界,思考现实世界中的问题,而不只是文本中的问题。即使是文本中的问题,也是与现实相关联的。下联说金老师的治学及教学态度。
    金老师的学生不算多,硕士博士加起来,不过十余人,师门联络并不紧密。去年金老八十寿宴,是弟子们聚得最多的一次。大家分布在不同领域,有相当多我都不认识。在这幅挽联中,“奇葩”一词我用的是它的本意。然而在当下的网络语境下,这个词多有贬义,用于嘲讽。我愿意自认奇葩,其他同门未必。星期天上午,我把这个挽联发到群里,请大家帮助找一个能替代“奇葩”,又能表现弟子们的多元性和奇特性的词。有人建议万芳(恰好是金老师一位硕士的名字),也有说多元、多彩、四方、四海。让我意外的是,刘钢师兄觉得“奇葩”很好。最后,就决定保持不变。

    星期日夜里,我从长春飞回北京。落地时,已经是后半夜一点多。空气很冷,零下十几度。睡了几个小时,早早起来,前往朝阳医院,与金老师作最后的告别。
    朝阳医院的告别室位于医院东北角的一排平房之中。我到的时候,吴奇师妹和刘钢师兄早早到了。那天前来告别的弟子还有谢爱华一家,从天津赶来的郭元林。身在济南的刘杰师兄临时有要事不能前来,嘱我代为致意。
    网络时代,消息迅速传开。微信群里,大家纷纷表达悼念之情,很多挽联在群间传播,以个人的名义,以机构的名义。原来的通知说,大家把各自的挽联统一转给喻佑斌,由他转给哲学所,再由哲学所统一书写。但是实际上,所有挽联都没有书写。所有花圈都是同样的格式,一面条幅写着金吾伦先生千古,另一面条幅写着名字,不同的名字挤在一个条幅上,每个花圈上都挂着三四条写着名字条幅。即使这样,哲学所前一天也忙到深夜。时间紧,人手紧,一切都很匆忙。匆忙到整个告别仪式,没有家属致辞,没有原单位负责人致辞,没有学界代表致辞,自然也没有弟子致辞。
    告别仪式由朝阳医院的工作人员主持,机械、程式、高效。工业文明的死亡文化,工业化、商业化、职业化,如利刃,直接切断阴阳两界的关联,来不及反应。弟子们原想作为一个集体,共同告别老师。但是等到来宾进屋之后,已经没有足够的空间让我们站在一起。来宾被安排四人一组,鞠躬,告别,慰问家属,离开告别室。我们的愿望无法实现。只有刘钢师兄带着我和吴奇、方刚,四人坚持排在一组,鞠躬,告别。经过金老师的时候,刘钢师兄停下来,用手在金老师的额头贴了一下,仿佛要试试温度。之后,我们站在家属行列的末尾,守到最后。
    一代哲人,匆匆离去。

    进入2018年,哲学所自然辩证法研究室已经走了一位梁存秀先生。金吾伦先生是第二位。就在这两天,西方哲学汪子嵩先生也去了。

    告别金老师这一天,北京的早晨非常寒冷。


    11
    史上最大规模机器人“面相”调查:157张脸背后的人类感受
    原标题:史上最大规模机器人“面相”调查:157张脸背后的人类感受
    这是一次迄今为止最大规模的机器人“面相”调查。
    机器人该长什么样子?不同的机器人脸部长相,会给人类怎样不同的感受呢?
    在刚结束的ACM/IEEE国际人机交互大会上,来自华盛顿大学的Alisa Kalegina等人发表了一篇名为Characterizing the Design Space of Rendered Robot Faces的论文。
    研究人员收集了157张不同的机器人脸,通过76个维度进行了统计分析,想调查清楚人类对不同长相的机器人体验有何不同。

    研究三维度
    此项调查主要在三个方面进行。
    一是面部特有元素的有无对人类的感受,如嘴巴、鼻子、眉毛、脸颊/腮红等,二是面部皮肤及这些特征的颜色带来的不同感受,三是每个特征的大小、形状和摆放位置的影响。
    将这157张机器人脸汇集在一起,能够大致总结一些特点:
    超过三分之一的脸是黑色的。
    大多数机器人面部有眼睛和嘴巴,但是没有脖子、脸颊和眉毛。
    圆眼睛是最受欢迎的眼睛形状,只有10%的机器人的眼睛是拟人化的。
    线条简单的眼睛也很受设计师欢迎。
       
    这些发现只是冰山一角,最因吹斯听的是下面两项调查。
    调查一:抽象or现实
    机器人的面部应该拟人一些还是抽象一些?这是个问题。
    研究人员在157张机器人脸中抽取了12张有代表性的,想弄明白人类对机器人面部拟人化程度的感觉。
    12张机器人脸| 越往左代表面部线条越简单抽象,越往右代表越拟人具体
    总共有50人参与了这组调查,参与者需要在六组5点的语义差异量表中对机器人的“颜值”打分,并需要评估自己对每个机器人的好感度。
    还没完。此外,参与者需要对每一张机器人脸做出评判,找出它们可能最适合哪种功能或使用场景,还要给每个机器人一个完整的描述。
    将参与者们的描述汇总,可以发现一些很有意思的总结——
    友好度:Yumi、FURo-D、Buddy和Datou是最友好的机器人。后三个机器人虽然脸部细节多,但看起来不太现实,会让人产生“恐怖谷效应”。Jibo和Gongzi看起来最不友好!
    智力水平:FURo-D和Gongzi是公认最聪明的,而Sawyer、Buddy和Datou被认为是最不聪明的,但他们的评分在“3(中立)”的分数上徘徊,所以也不能说它们蠢~
    信赖度:Datou和FURo-D被认为是最值得信赖的,而Gongzi被认为是最不敢信任的。最被调查的50人中,有17人认为Gongzi是“愤怒的机器人”,参与者评价它“看上去很险恶”、“很吓人”、“像是执法部门使用的”。
    整体偏好:最受欢迎的机器人是Yumi和FURo-D,而Jibo是最不受欢迎的,与Gongzi、EMC和Valerie并列。
    调查二:五官变化
    通过第二组调查,研究人员试图研究五官的放置位置、细微变化带给人类的感受变化。
    在下图中有17张相似的机器人脸,在F1这张基准图的基础上,研究人员对面部进行微调。
    17张相似但具有微小差异的机器人脸
    每张脸相较于基准脸都有细微的变化,可能是面部的颜色,眼睛的大小、形状、颜色和位置,以及是否具有其他的面部特征,例如耳朵、鼻子、刘海儿和腮红等。
    和调查一一样,还是50名参与者对机器人进行评估,同样是上述四个维度,但这次却有了很多新的发现——
    友好度:没有哪张脸比基准脸更友好,没有嘴巴、缺少瞳孔和拥有眼睑的面孔明显让人觉得不友好。对了,参与者普遍认为没有嘴巴的面孔让人“毛骨悚然”,比如有个人评论“感觉他在监视我的一举一动”。
    智力水平:如果单从相貌上看,眉毛的设计对智力水平的影响可能最大。有眉毛会给人天真的感觉,从而被认为没那么聪明。基准脸给人的感觉最成熟。
    信赖度:事情的发展轨迹总是那么得……相似。在可信度调查显示,没有谁比基准脸更值得信任。最不值得信任的面孔与被评为最不友好的三张脸是一样的:有眼睑、没有嘴巴和没有瞳孔的脸。
    整体偏好:基准脸最受欢迎。
    话说回来,这项调查可以初步指导不同特征的机器人在不同的场景中的使用。如果你想设计一个安防机器人,那么就可以考虑给它设计和眼睑,但不要设计嘴巴就好了~
    目前,这个调查还在进行中。研究人员表示,目前发现青少年和成人之间对面孔的感受差异很大。下一步,他们计划将开展青少年对面孔的感受的研究。
    12
    NASA公布火星怪诞照:陨石坑形似细菌
    当地时间周二,美国国家航空航天局(NASA)公布了一张火星勘测轨道飞行器(MRO)最新发回的照片。据了解,MRO上的HiRISE摄像头拍下了这组高清的火星表面照片。CTS Context摄像头虽然拍下的是分辨率更低的图片但却能提供更大的观察角度。
    在高清照片中出现的怪诞“细菌”实际上是火星上的一个陨石坑,NASA表示之所以会出现这种奇怪的形状很有可能代表了这里曾经有过一段冰川流动的岁月。


    交通期刊最新论文
    13
    (1)Transportation Research Part A: Policy and Practice,
    Volume 111, (May 2018). 第10篇.
    Are public private partnerships that rigid? And why? Evidence from price provisions in French toll road concession contracts, Pages 174-186
    (2)Transportation Research part B: Methodological,
    Volume 110, (April 2018). 第5篇
    Strategic investment in enhancing port–hinterland container transportation network resilience: A network game theory approach. Pages 83-112.
    (3)Transportation Research Part D: Transport and Environment,
    Volume 62, (July 2018). 第9篇.
    The effect of residential housing policy on car ownership and trip chaining behaviour in Hangzhou, China, Pages 125-138.
    (4)Transportation Research Part E: Logistics and Transportation Review,  
    Volume 113, (May 2018). 第8篇.
    Integrated relief pre-positioning and procurement planning in humanitarian supply chains, Pages 123-146.
    (5)Accident Analysis & Prevention, Volume 115, Volume 114 (May 2018). 第9篇. Latent class analysis of accident risks in usage-based insurance: Evidence from Beijing, Pages 79-88.
    (6)Journal of Traffic and Transportation Engineering 2018年01期. 第13篇. 基于统计与假设检验的高速公路交通事故数据分布特性:139-149.


    武理工国家水运安全中心
    长按 识别 关注
    点击上方“公众号” 可以订阅哦! 谢谢




    欢迎光临 合肥师范学院论坛 (http://hs.meimiaoyou.net/) Powered by Discuz! X3.1