沙家新闻

中文NL2SQL准确率超92% 产学研携手推动智能交互发展

2019-12-01 11:39:34

10月12日,由chase one technology主办、南京大学计算机软件新技术国家重点实验室协办的“第一届中国nl2sql挑战赛”决赛防御颁奖仪式在南京大学举行。经过五名决赛选手的现场防守和现场评委的评价,国防科技大学队获得冠军,国家双料科技队获得亚军,观安信息与苗营科技联合队获得第三名,华南理工大学和佛罗里达大学队,浙江大学队获得优胜奖。

由中国移动研究院首席科学家冯蓝军、复旦大学教授肖华阳、杨宇新加坡南洋理工大学副教授毛克智、南京大学教授cto刘云峰等众多人工智能权威专家组成的评委团,对决赛选手的技术方案进行了专业分析和评论,从而产生了最终结果。

随着nlp基本功能的发展,将自然语言转换成可执行的sql语句、访问数据库和其他复杂的人机交互逐渐成为可能。仅在几个月的比赛中,顶级玩家模型方案的准确率就达到了92%以上,创下了新的行业纪录。

首席技术官刘云峰

“挑战的规模和参赛者的表现远远超出了预期,显示了nl2sql在学术和工业应用方面的潜力。数据库的交互创新越来越受到重视。”大通一号科技联合创始人兼首席技术官刘云峰表示,大通一号科技将与更多高校和企业的同事合作,共同推动中国自然语言处理的研究和应用取得突破。

新一代数据库交互

自然语言到结构化查询语句是一个新兴的研究领域。salesforce耶鲁大学和其他机构已经在国外发布了wikisql和spider数据集,但在国内市场仍处于初级阶段。这在中国还是第一次。

“认识大数据价值的最大问题是访问门槛太高,”复旦大学杰出的法官代表兼教授肖华阳说。使用自然语言访问关系数据库中的数据一直是数据库行业的梦想。太多的数据“沉睡”在关系表中,使得这种愿望更加迫切。

Nl2sql挑战评审法官兼复旦大学教授肖华阳

作为竞赛的组织者,大通一科技的联合创始人cto刘云峰也表示,大通一在为企业服务的过程中发现,许多企业的知识和数据都以关系数据库的形式存储,如银行用户的消费记录、基金公司的基金属性、保险公司的保险单记录等。如果要更好地利用它,“迫切需要将自然语言转换成可执行的机器语言技术”。

刘云峰认为,nl2sql是一条非常好的技术实现路径,“这也是蔡斯一号发起竞争的原因。”

在此期间,chase one science and technology发布了业界首个大规模的中文数据集,包括4,870个表数据、近50,000个标记数据和相应的sql语句。在众多学术专家和行业合作伙伴的支持下,chase one science and technology希望通过“产、学、研”等多方联动,为nl2sql的研究和应用提供一个平台。

行业-大学-研究参与

据了解,此次比赛吸引了1457支来自国内外的队伍,包括来自大学、机构和企业的开发商。

其中,学生和科研人员占48%,企业技术人员占52%。学生团队来自许多著名大学,如北京大学、清华大学、复旦大学、上海交通大学、南京大学、浙江大学、中国科技大学、哈尔滨工业大学、Xi交通大学等。以及海外cmu、墨尔本大学和新加坡国立大学的顶尖大学。

商业发展爱好者已经成为竞争中的另一支重要力量。中国移动、平安集团、搜狗、塔塔科技、中兴通讯、网景科技、郭爽科技、捷达华盛等众多企业的技术人员也成为参赛队伍中的重要力量。

高校、企业、企业联合“团队组建”的挑战成为竞争的亮点。例如,华南理工大学和佛罗里达大学、上海观安信息技术学院和苗营科技学院,位列前五名,都是联合团队。

“人们拾柴火时,火势很大,”刘云峰说。竞争也是为了在学术界、技术企业家和市场之间建立更好的联系。“让企业的钉子找到锤子,让学术和技术企业家的锤子找到钉子。”

作为高校嘉宾的代表,南京大学人工智能创新研究所所长詹德川表示,除了运动员的热情和参与外,更重视比赛的交流机会,“学术界和产业界可以进行深入交流”他还表示,产学研合作“人工智能的热情不会进入冬天”。此次活动中,南京大学计算机软件新技术国家重点实验室与大通一号科技合作,共同赞助竞赛,协助产学研合作。

南京大学人工智能创新研究所所长詹德川

经过多方努力,nl2sql在短短几个月内就在中国研究领域取得了快速突破。

比赛开始时,准确率仍超过60%。到8月份的预赛结束时,榜单上的头名已经达到89%,接近维基百科。重播结束时,该球员的最高得分达到92%,创下了新的行业记录。此外,所有五支最终进入决赛的队伍都在90分以上。

"最后一名选手的成绩完全超出了我们对比赛的预期."作为评委的代表,小华阳说,事实上,将中文自然语言转换为sql的挑战更大。参赛者的成绩不仅令人惊讶,而且在深度学习、自然语言处理思想和模式方面也显示出深厚的理论基础和熟练程度。

中国移动研究所首席科学家冯蓝军

作为行业专家评委,冯蓝军表示nl2sql是自然语言处理的一个非常重要的应用领域,涉及自然语言处理领域的许多核心问题。他很高兴看到这么多高水平的队伍参加比赛,并取得了很好的成绩。他还看到了生产、学习和研究在这个方向上共同改进技术的热情。

应用前景

在激烈的竞争背后,nl2sql的应用潜力也得到了越来越多的关注。

业内人士表示,nl2sql在银行、保险、证券、电子商务、汽车、房地产等数据挖掘领域具有巨大的应用潜力。它可以大大降低数据库的访问和使用阈值,增强人机交互体验,更好地挖掘数据价值。

"今天,我们在人工智能和数据库之间的互动中看到了另一个突破和新的想象空间."关于此次比赛的举办,创新工场主席兼首席执行官李开复也表示,他期待看到一位或多位nlp开发爱好者继续探索和努力推动nlp创新和包容性应用。

“参与这一挑战的规模比预期的大得多,显示了nl2sql在学术和工业应用中的潜力。数据库的交互创新越来越受到重视。”大通一号科技联合创始人兼首席技术官刘云峰博士表示,大通一号科技将与更多高校和企业的同事合作,共同推动中国自然语言处理的研究和应用取得突破。

广西11选5 11选5购买 辽宁十一选五投注

上一篇:我省平均每台安卓手机20.9个安全漏洞

下一篇:消失的金九银十:有楼盘直降660万,送中间人超60万豪车

热门新闻排行榜

合作专区