国内首届中文人机对话技术评测赛果出炉,两项任务冠军团队都分享了哪些技术

国内首届中文人机对话技术评测赛果出炉,两项任务冠军团队都分享了哪些技术细节?|SMP 2017 AI科技评论按 :近年来,人机对话技术受到了学术界和产业界的广泛关注。学术上,人机

高考机器人数学成绩差是因为语文不行

2017 年高考结束了,但围绕高考展开的人工智能故事却还在持续发酵中。据相关媒体报道,6月7日,高考第一天第二场数学考试结束,场外,两名机器人“考生”的“应考”才刚刚开始。身处北京的学霸君智能教育机器人Adiam和来自成都准星云学的高考机器人AI-MATHS将分别完成不同体量的数学试题,他们的竞争对手,一边是往届优秀的高考状元,另一边是期望的110分。
最终,学霸君的Aidam用时10分钟完成答题,获得134分,三组高考状元分别得分119分、140分和146分,平均分135分,从分数来看,学霸还是在高考中扳回一局;另一款准星高考机器人AI-MATHS北京卷用时22分钟完成北京文综数学考试,得分105;全国二卷数学考试用时10分钟,得分100分,离预期的110分也还存在着差距。现场阅卷老师表示,“相当于中等水平。”

说明: C:\Users\dell\AppData\Local\Temp\WeChat Files\93aae50def0ed76451cb1a3a9d1ebf50.jpg

事实上,这并非机器人首次参加考试。2015年,来自日本国立情报学研究所(NII)研发的人工智能(AI)技术能在日本高考中考取511分的成绩,可被80%的日本大学录取。考试的内容包括数学、物理、英语以及其他科目。
去年,微软小冰也曾经尝试了中国高考的作文写作。这次挑战中,小冰写了《进步和退步》、《神奇的书签》两篇作文。结果,小冰的语言不仅没有我们想象的优美,运用修辞和复杂的句法,相反,还逻辑混乱,离题千里。显然,这样的文章在考场上很难拿到好成绩。
1996年到2017年的20年间,多次人机大战从侧面印证了人工智能的进化历程:从计算能力超越人类到学会自然语言理解,再到深度学习并且掌握不完美信息的博弈能力,直至理解人类思考过程,以及处理信息的能力。最近AlphaGo与柯洁三番棋对弈完胜更是证明了人工智能的飞速发展正在超越人类想象。按说,机器人擅长数学逻辑运算的能力在几十年前就已经在四色定理证明、自动证明等数学领域得到了验证,对于很多考生看来更难学的数学对机器来说应该更得心应手一些,但最终成绩却不尽如人意,其中原因在哪里呢?
简单的说就是,机器人读不懂题。直接用数学语言表述的应用题它可以轻松解答,但它不能理解考题里场景式的描述语言。
语言是人类区别其他动物的本质特性。在所有生物中,只有人类才具有语言能力。人类的多种智能都与语言有着密切的关系。人类的逻辑思维以语言为形式,人类的绝大部分知识也是以语言文字的形式记 载和流传下来的。因而 ,它也是人工智能的一个重要,甚至核心部分。
自然语言理解和自然语言生成是十分困难的,造成困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种各样的 歧义性或多义性(am biguity)。一个中文文本从形式上看是由汉字(包括标点符号等)组成的一个字符串。由字可组成词,由词可组成词组,由词组可组成句子,进而由一些句子组成段、节、章、篇。无论在上述的各种层次:字(符)、词、词组、句子、段,……还是在下一层次向上一层次转变中都存在着歧义和多义现象,即形式上一样的一段字符串,在不同的场景或不同的语境下,可以理解成不同的词串、词组串等,并有不同的意义。
举个例子:
如 果题目是10÷5=?人工智能系统可以轻松作答。
如果题目使用自然语言描写将其表述为“小明有10个苹果,平均 分给5个人吃,请问每 个人分到几个苹果?”
同样的问题,不同的表述,面对这样的情况,人工智能系统就“傻”了,它不理解“小明”是什么、“平均分”是什么、“吃”又是什么意思。
或者使用另外的自然语言描写将其表述为“小明有10个苹果,分给5个人吃,每个人分到的一样多,请问每个人分到几个苹果?” 则人工智能系统就更“傻”了。
人类的语言千变万化,而且还在不断创新,几乎是学不完的。遇到没学过的生词,人类会联系上下文去推测词义,猜对是比较容易的事;而机器人却会卡壳。无论实现自然语言理解,还是自然语言生成,都远不如人们原来想象的那么简单,而是十分困难的。从现有的理论和技术现状看,通用的、高质量的自然语言处理系统,仍然是较长期的努力目标。
深思考人工智能机器人科技(北京)有限公司是一家专注于中文自然语言处理核心算法的人工智能领域高科技公司。虽然我们不开发高考机器人,但我们开发的“智能审稿纠错机器人”已经可以上岗了!

说明: C:\Users\dell\AppData\Local\Temp\WeChat Files\867e4a0fd73281df5d20872dcd6d4a8c.jpg

“智能审稿纠错机器人”是基于深度学习NLP/NLU技术,使用双向深度RNN/LSTM,学习大量语料研发而成的。
智能审稿纠错机器人”可以自动找出文章中的错别字、缀词、标点符号、病句、不通顺语句、日期、数字计算、上下文相同姓名称谓不一致、身份证号码等基本字面错误并提供修改建议。它能理解上下文语义后指出用词不当的地方,比如指出“领导人***发飙了重要讲话”中的“发飙”错误。
“智能审稿纠错机器人”还可以针对法律业务,找出法律引文、党章或管理条例错误、法律内容错误、法律条款引用不正确,可以纠错政治性错误,比如国家领导人姓名、职务、排序等等。
 “智能审稿纠错机器人”可以自主学习知识,并能对知识性内容进行对比纠错,比如“1922年辛亥革命爆发”、“1969年中共十九大正式会议上,毛泽东主持了开幕式”此类的常识性错误。
它的记忆库里存有4900万各类词汇,22万条专业词汇,挂接30个专业术语库,并在不断自主学习中。目前可以对法院、检察院、律师文书、报告、作文、电视台字幕、新闻进行自动纠错。
尤其在新闻领域,“智能审稿纠错机器人”已经可以帮助新闻工作者实时监控发稿中的错误并提醒发稿人其中的错误。
经过海量语料的学习,相信“智能审稿纠错机器人”能够深入理解字里行间的语义,未来有一天可以对高考语文进行阅卷。





深思考人工智能,成立于2015年8月,是一家专注于人工智能核心算法及专用芯片的科技公司。目前主要产品为ideepwise AI Robot Service底层服务系统、基于该底层服务系统的IDeepwise人工智能“医疗大脑”和二代人工智能机器人系统及FPGA AI加速芯片。
                

面向终端用户提供基于深思考人工智能“大脑”的多元化智能产品,使用户生活服务更便利。

机器人载体除了通常被接受的人形机器人,其实也包括厨房、家居、卫浴等设备,通过深思考人工智能应用,使得家居类产品更加智能化,不仅仅是单体智能,还可以是多设备互联,对主人的需求能够有针对性的提前做出响应。

面向行业用户提供深思考人工智能“大脑”芯片产品及技术支持服务,使实体机器人或机械设备等半智能或非智能产品具备人工智能,提高品牌价值和消费者满意度,实现工业机器人即插即用智能化。

深思考人工智能,有温情的人工智能