【企服观察】第二届 AI Challenger 开赛,用AI解决真实世界问题

vbox8011_WSF_6999_161200_small.JPG

企服行业头条(微信:wwwqifu)8月29日报道


今天,由创新工场、搜狗、美团点评、美图公司联合主办的“2018 AI Challenger 全球AI挑战赛”正式开赛。

作为专注ToB领域的垂直媒体,人工智能行业也是企服行业头条(微信:wwwqifu)所重点关注的。去年,企服行业头条出席了第一届全球AI挑战赛的开幕仪式,今年是第二次。

本次挑战赛,四家主办方投入千万元规模以上的资金,引入更多企业、大学、政府机构合作,新增十余个全新高质量数据集,以及相关的兼具科研、产业应用、社会意义的竞赛,持续打造开放的世界级科研数据集与竞赛平台。今年AI Challenger的选手们将 “用AI挑战真实世界的问题”。

本届AI Challenger 还设置了丰厚的奖金池,整体奖金规模达到300余万人民币。据介绍,AI Challenger是目前国内规模最大的科研数据集平台、以及最大的非商业化竞赛平台,也是最强调前沿科研与产业实践相结合的数据集和竞赛平台,更是依托于数据集和竞赛的全球AI人才社区。

用AI挑战真实世界的问题

“AI Challenger 全球AI挑战赛”是面向全球人工智能人才的开放数据集和编程竞赛平台,致力于满足AI人才成长对高质量丰富数据集的需求,推动AI在科研与商业领域结合来解决真实世界的问题。AI Challenger以服务、培养AI人才为使命,打造良性可持续的AI科研与应用新生态。

数据是AI的燃料,开放数据集,才会更好地推动AI产业的进步。AI Challenger全球AI挑战赛举办的初衷,主要源于联合主办方协同一致,希望在AI时代来临之际,用开放的心态为AI产业赋能,挖掘、培养AI人才,助力AI产业的发展,并且让AI人才有机会能拿到真实的数据,解决真实世界里的问题。

AI Challenger从第一天起就致力于践行这样的初衷。AI Challenger 2018 使用的数据集均为行业首创或最大,不仅在数量、丰富程度上比首届大赛有大幅提升,而且竞赛与现实问题接轨。组委会还会积极推进参赛者的成果跟产业接轨,真正做到用AI解决真实世界的问题。

本届AI Challenger全球挑战赛由创新工场、搜狗、美团点评、美图公司联合主办,在第一届的基础上,引入了更多企业、大学、政府机构,带来十余个全新的不同领域数据集,十余个兼具科研、产业应用、社会意义的竞赛。联合主办方在提供竞赛数据集的同时,也对所提供的数据集竞赛提出待选手们破解的“擂题”。

10余个高质量数据集与竞赛,再创新高

在2017年的首届大赛中,AI Challenger发布了从百万到千万量级的4个数据集、6个兼具学术前沿性和产业应用价值的竞赛。在今年的AI Challenger大赛里,主办方进一步扩大数据集规模,新增10余个高质量数据集,发起兼具科研、产业应用、社会意义的竞赛。

其中,5个主赛道的数据集包括:业界最大规模观点型问题阅读理解数据集、业界最大规模细粒度用户评论情感分析数据集、业界最大规模英中文本机器翻译、业内首个多标签短视频分类数据集、以及世界庞大、最复杂的自动驾驶数据集。

这5个主赛道的竞赛分别是:

观点型问题阅读理解竞赛:机器阅读理解是让机器读懂人类语言、和人类更好交流互动的重要领域。此技术可广泛应用于智能搜索、智能客服、智能音箱、语音控制等场景,用AI实现基于文字、语音的人机智能互动。数据集包含30万问题以及相关文章与答案的语料集合,为业界最大。

细粒度用户评论情感分析竞赛:自然语言情感分析是机器理解人类表达和意图的重要领域。此技术可广泛应用于零售、电商、餐饮、服务等用户评价场景,用AI对用户反馈进行智能分析,监测用户喜好、满意度等。数据集包含15万条餐饮用户评论、6大类20个细粒度要素标签,为业界最大。

英中文本机器翻译赛道竞赛:机器翻译正越来越成为人们跨越语言障碍的重要工具,应用于各种领域。数据集在2017年数据集的基础上,总量达到1300万句对,为业界最大;且其中具有上下文情景的中英双语数据达到300万句对,为机器翻译的研究提供了更多探索空间。

短视频实时分类赛道:近几年发展极快的短视频行业具有明显的娱乐性和流行性,深受人们喜爱;基于短视频机器分类的技术还可以广泛用于视频内容分析、编辑与生产,监控、安防等领域。数据集包含20万条短视频、涵盖63类流行元素,为业内首个多标签短视频分类数据集。

无人驾驶视觉感知赛道:自动驾驶技术即将改变我们的出行和生活方式。本次大赛的自动驾驶竞赛采用了UC Berkeley DeepDrive(BDD)2018年最新发布的BDD 100K数据集,这是全世界最庞大、最复杂的自动驾驶数据集,包含原始图片1.2亿张、标注图片10万张,涵盖多样天气和昼夜光照条件。

除5个主赛道之外,AI Challenger 2018还开放5个实验赛道竞赛和相应的数据集,包括基于北京气象局3年气象数据的天气预报竞赛,世界上首个农作物病害检测竞赛和数据集,国内首个眼底病变医学图像检测竞赛和数据集,以3D虚拟图像训练机器“认识”真实世界物品的竞赛和数据集,让机器借助辅助知识学习从未见过的新概念的首个国际性零样本学习竞赛和数据集。希望通过AI Challenger,能赛出最好的AI天气预报员、AI植物医生、AI眼科医生、AI物品识别专家和AI“自学天才”。

打造开放的世界级数据集与竞赛平台

在2017年的首届大赛中,AI Challenger以超过200万人民币的奖金,吸引了来自全球65个国家的8892支团队参赛,成为目前国内规模最大的科研数据集平台、以及最大的非商业化竞赛平台。其中很多参赛选手来自国内外 AI 实力强劲的高校、公司和机构,不乏过去各类比赛的获奖者,比如 ImageNet 两项任务冠军、天池阿里移动推荐算法大赛冠军以及 Kaggle 大赛的众多优胜者。

按照最初设定的目标,“AI Challenger全球AI挑战赛”首先要建设紧贴前沿科研任务需要的数据集,再者是要建立超大规模的高质量数据,第三个目标是要打造开放的世界级平台。

今年的AI Challenger全球挑战赛扩大奖金池,设立超过300万人民币的奖金,数据集和竞赛8月29日正式开放,并于12月18、19日进行竞赛的总决赛答辩和颁奖。

AI Challenger 2018的竞赛主要分为三个阶段。第一阶段比赛从2018年8月29日至11月4日,参赛队基于训练集、验证集、测试集A,进行算法设计、模型训练及评估,并提交预测结果,系统会按照评测指标实时反馈分数,并更新榜单排名。个别竞赛采取参赛队提交代码、docker的形式进行比赛。期间进行双周赛排名和评奖。

第二阶段比赛从2018年11月6至8日,开放测试集B;各竞赛提交结果的时限不同。结果提交后即进入评分、排名、代码验证环节,个别比赛还将考察参赛队的算法运行效率。参赛选手在测试集B上的预测结果表现,将作为进入决赛的排名依据。

第三阶段于12月18、19日进行竞赛的总决赛答辩。

实验赛道数据集和竞赛将持续建设,并不定期开放新内容。

引入更多企业、大学、政府机构合作 

除了联合主办方创新工场、搜狗、美团点评、美图公司,AI Challenger 2018还引入更多企业、大学、政府机构合作。包括协办/支持方:中国气象局北京城市气象研究所、加州伯克利大学DeepDrive深度学习自动驾驶产业联盟(BDD)、南京理工大学/江苏省人民医院、北京大学、上海新客科技、北京前沿国际人工智能研究院;技术支持伙伴TensorFlow;教育平台支持伙伴优达学城Udacity、小象学院;AI GPU云支持伙伴UCloud;以及指导单位中关村科技园区管理委员会、北京市经济和信息化委员会。

AI Challenger 2018全球AI挑战赛的评委团也是大咖云集,汇聚了来自学界、产业界的AI技术大牛。

自然语言处理领域的评委团成员包括:南京大学副教授黄书剑,清华大学副教授、国家优青刘洋,厦门大学教授、中文信息学会理事史晓东,中国人民大学教授、千人计划专家文继荣,哈尔滨工业大学教授、中文信息学会常务理事赵铁军,清华大学教授、北京计算机学会副理事长朱小燕。

计算机视觉领域的评委团成员包括:华中科技大学教授、国家优青、万人计划专家白翔,清华大学副教授刘世霞,京东AI研究院副院长、IAPR Fellow梅涛,旷视科技首席科学家、前微软亚研院首席研究员孙剑,中科院自动化所研究员、模式识别实验室副主任、国家杰青王亮,微软亚洲研究院首席研究员、IEEE Fellow曾文军。

自动驾驶领域的评委团成员包括:飞步科技创始人、浙江大学教授、国家杰青、IAPR Fellow何晓飞,加州PATH项目负责人、伯克利大学BDD副主任詹景堯。

本次大赛理事会委员、创新工场人工智能工程院执行院长王咏刚表示,希望在2018年,AI Challenger 能吸引更多国际、国内的高水平参赛团队,并建立算法、代码、论文、数据、比赛的分享和交流平台。

未来,“AI Challenger 全球AI挑战赛”将持续投入,建设和发布更大规模的AI前沿领域高质量数据集,涵盖自动驾驶、智慧医疗、智慧金融、机器人等行业应用中的核心AI需求,主办世界级的年度AI竞赛,吸引世界范围内的高端AI研发人才,促进人工智能科研生态的持续健康发展。

将在国内外40多个城市举办技术论坛

AI Challenger 2018 除赛事外,还将举办线上线下社区技术交流。线上社区交流包括官网challenger.ai上的在线社区、微信和Slack群交流,线下社区交流则包括国内外40多个城市的大学举办技术论坛(以下城市按字母音序排列):

中国:北京、成都、重庆、广州、哈尔滨、杭州、合肥、南京、上海、沈阳、苏州、台北、台南、武汉、西安、厦门、香港、新竹等。

北美:美国伯克利、波士顿、芝加哥、伊萨卡、洛杉矶、密歇根、纽约、帕罗奥多、匹兹堡、西雅图、华盛顿等;加拿大多伦多、埃德蒙顿等。

欧洲:英国剑桥、都柏林、利物浦、伦敦、曼彻斯特、诺丁汉、牛津等;德国慕尼黑,法国巴黎,荷兰代尔夫特,俄罗斯莫斯科等。

亚太:澳大利亚悉尼,印度德里,日本东京,韩国首尔,马拉西亚吉隆坡,新加坡等。

此外,AI Challenger还为“中国高校人工智能人才国际培养计划”提供在线社区和实践平台的支持,这是目前世界上最大的AI人才培养计划,目标在5年内直接培养至少500位老师和5000位学生,并影响数以十万计的学生。其中,2018年度面向教师的培训班录取了计算机专业排名前50高校的100位教师学员;面向学生的DeeCamp训练营从来自全球600多高校的近7000人报名中录取了来自85个高校的300位学生学员。

“中国版ImageNet”还要实现哪些小目标?

AI Challenger被称为“中国版 ImageNet”,AI Challenger 2018组委会认为,ImageNet薪尽火传,AI Challenger会接棒 ImageNet,将AI挑战精神在中国进一步发扬,打造一个独具特色的、具有世界领先水平的高质量的数据集平台。

AI Challenger今年为自己设定了几个小目标:

首先,AI Challenger提出了“用AI挑战真实世界的问题”的口号。也就是说,AI Challenger希望在数据集的建设上,既具有科研和学术上的前瞻性,也希望数据集能紧贴AI商业化、AI落地的实际场景、实际需求,从产业需要出发,为学术研究和AI人才培养提供方向性的建议,也反过来帮助产业界更好地利用最新的科研成果,解决真实世界的最有价值的问题。

例如,无人驾驶中的车道线识别问题,短视频的实时分类问题,细粒度的用户情感分析问题等,都是这一类的,从产业实际需要出发,又紧扣科研前沿内容的好问题。

第二,今年的AI Challenger希望花大力气,围绕AI数据集和AI竞赛,打造一个AI人才可以自由交流、开放讨论、取长补短、协作互助的世界级的平台。也就是说,AI Challenger不仅仅制作、发布高质量数据,举办大规模的竞赛,还利用数据和竞赛,把人才吸引到这个平台上来,形成一种良好的人才生态,真正促进AI大环境的健康发展。

第三,在AI人才选拔、培养方面,去年的AI Challenger吸引了全球将近9000支团队参赛,参加AI Challenger比赛的有学生、科研工作者、产业一线的研究员和工程师等,来自不同企业、高校、科研机构的人才汇聚在这个大平台上,交流分享比赛中的成功经验,每个参赛者都收获了一段特别有价值的经历和体验。

今年,相信将有更多的参赛团队和参赛选手在AI Challenger这个平台上展示自己的实力。同时,基于AI Challenger的开放式社区和平台的建设,更多的人才、技术讨论、算法、代码、文档等,还可以在这个平台上积淀下来,成为今后相关人才培养的宝贵财富。

AI Challenger的使命之一,就是希望在未来三年里,能消除中美年轻顶尖人才之间的差距,从AI Challenger走出去的优秀选手,最终成长成中国乃至世界AI产业的领军人物。

中国AI商业化和产业化进入非常时期

AI Challenger理事会代表王咏刚表示,今年AI Challenger的主题定为“用AI挑战真实世界的问题”,是有几方面原因的。

首先,人工智能的商业化与产业化进入了一个非常关键的时期,人工智能在那些大数据积累还不完善的领域,如零售、制造、物流、农业、医疗、教育等领域,还需要经历一个长期的发展过程,也会特别严重地依赖于相关场景的数字化程度。

例如,对于一个线下零售卖场来说,如果没有大数据积累,没有摄像头等信息采集设备收集的商品信息、行为信息、场景信息等,就没法针对零售卖场的供应链和销售渠道进行优化,没法提供定制化的服务,没法与拥有大数据的电子商务网站或应用竞争。

因此,人工智能的商业化落地迫切需要符合各行业需求,同时也拥有科技前瞻性的大量训练数据集。AI Challenger希望扮演推动人工智能商业化落地的关键角色,逐步在每个特定领域,投资建立并开放高质量数据,让AI商业化的参与者能更容易地训练AI模型,加速人工智能商业化步伐。

此外,AI科研领域一直有一种倾向,就是与产业界的实际问题距离较远,科研成果到产业界的实际解决方案之间,转化率较低,转化路径非常漫长和坎坷。AI Challenger希望在数据集建设和竞赛设置上,有针对性地突出产业界的需要,围绕产业界中的真实问题,为科研人员和工程技术人员提供最好的支持,拉进科研与产业间的距离。

例如,无人驾驶中的车道线识别问题,短视频的实时分类问题,细粒度的用户情感分析问题等,都是这一类的,从产业实际需要出发,又紧扣科研前沿内容的好问题。

2017年,AI Challenger已经成为目前国内规模最大的科研数据集平台、以及最大的非商业化竞赛平台。王咏刚称,AI Challenger在未来的发展中,会始终坚持科研的前沿性,数据集的高质量,科研与产业的紧密结合,开放的世界级平台等核心目标。

以2018年的AI Challenger规划为例,今年会突出数据集建设和问题设置方面与产业结合的特点,尽量让AI Challenger发布的数据能直接满足科研和产业的一线需求。同时,AI Challenger也会尽量突出人才平台、人才社区、人才网络的建设,利用AI Challenger,把全世界范围内的优秀人才聚集在一起。

主办方对挑战者的“几大期待”

如今,AI已经在现实世界中发挥作用,中国作为世界第二大经济体,在大数据数量方面也具备优势,但在AI技术创新能力方面却仍远远落后美国和其他发达经济体。

AI Challenger组委会认为,目前中国AI产业仍存在很多问题,比如中国欠缺一些深入行业的AI公司,比如说类似IBM Watson这样的、能够针对企业需求开发数据这样的公司,这些应用在医疗、零售、教育等领域的都会产生价值。从业界发展来看,中国科技公司相比国际AI巨头公司,目前也有巨大差距。因此,AI Challenger组委会希望本届挑战赛不仅仅是一场竞赛,更希望挑战者能从现实问题出发,创造出解决现实问题的成果。

创新工场创始人兼CEO李开复表示,数据、算法、计算能力是人工智能的三大基石,其中,数据更是人工智能科研最宝贵的资产。如果没有足够好的数据,就无法取得世界顶级的科研成果,更无法破解真实世界里的难题。希望每一位今天参与AI Challenger还有在中国做人工智能的研究员和学生,要珍惜你们的时代,把握大量的数据,创造出最好的技术,破解产业界的真实问题!

搜狗CEO王小川表示,AI正在经历高速发展,挖掘了许多线上线下的场景。然而企业本身存在思维惯性,希望这样一种活动,激发更多灵感,也为企业打破固有思维,做出更好、更深的研究成果,带来新的惊喜。AI Challenger将吸引中国乃至全球的AI人才产生“共振”,将在比赛中得到知识和技能两方面的提升。在这个年轻的舞台,我们每个人都是AI Challenger。

美团点评CTO罗道锋表示,我们现在的日常生活,吃喝玩乐、衣食住行方方面面,都已经开始有AI在背后支撑,但是AI技术解决真实问题,仍然面临非常多的挑战。希望有更多年轻的技术人员成为AI Challenger,一起拥抱千载难逢的历史机遇。用人工智能挑战真实世界的问题,也希望通过大赛,将真实的、有价值的、高质量的数据集回馈给科研工作者,让先进的人工智能技术,更好的为社会服务,帮大家吃得更好,生活更好!

美图公司创始人兼CEO吴欣鸿表示,现在已经有一种共识,认为AI是产业革命,就像蒸汽机、电力、和计算机一样,将会推动人类的发展。AI已经成为推动全球科技进步的发动机,未来的世界,每个人在生活、工作中都离不开AI。希望在这次大赛中看到全球AI行业的最新尖端科技,与业界同行一起探索各种新的可能性,发掘出更多有天赋的AI人才和团队。

-END-

点赞(0)

全部评论