survey,专访金山 AILab 实验室负责人李长亮博士:在金山做 NLP 最重要的是维护用户隐私,气温

admin 6个月前 ( 04-04 03:06 ) 0条评论
摘要: 专访金山 AILab 实验室负责人李长亮博士:在金山做 NLP 最重要的是保护用户隐私...

雷锋网 AI 科技谈论按,2018 年年末,在 2018 AI Challenger「英中文本机器翻译」赛道上,金山 AI Lab 以极大的比分优势一举夺冠。这对建立不到两年的金山 AI Lab 来说,含义严重。它不仅仅对团队此前几个月尽力的认可,也证明了金山在机器翻译范畴的技能优势。

作为一家低沉的公司,鲜少见到外界对金山 AI Lab 的报道。近来,雷锋网采访了金山 AI Lab 试验室主任李长亮博士,就 AI Lab 的研讨作业和开展进行了讨论。

初见李博士,是 18 年年末在金山的一次媒体沟通会上。其时,李博士戴着眼镜,说话时温文而有耐性,身上散发着浓浓的学术气质,给雷锋网留下了深入的形象。本次采访再会李博士,在一个多小时的沟通进程中,雷锋网被李博士广博的学问、对科研的酷爱深深信服。

金山集团AI Lab试验室主任李长亮

李长亮,现任金山集团 AI Lab 试验室主任,结业于中国科学院自动化研讨所,从事人工智能与自然言语处理研讨,宣布世界会议论文二十余篇,恳求国家发明专利二十余项,掌管多项严重课题,屡次在世界竞赛中取得冠军谈谈心恋爱情第二部,先后当选中文信息学会青年作业委员会委员、言语与常识核算专业委员会委员、社会媒体处理专业委员会委员、人工智能学会自然言语了解专业委员会委员等等。

许亦如 针眼警官

适应时代大势,建立 Asurvey,专访金山 AILab 试验室担任人李长亮博士:在金山做 NLP 最重要的是保护用户隐私,气温I Lab

2017 年 5 月,适应国家大势和企业开展的需求,金山集团建立 AI Lab,由金山副总裁姚冬直接分担。

AI Lab 的定位是辅佐金山集团女牢一号北海海景彩云宾馆的四个子公司——金山作业、西山居、猎豹移动和金山云进行事务上的落地。据李博士泄漏,AI Lab 首要对金山作业 WPS 供给技能上的辅佐支撑,接下来,团队还会和金山云进行一些深度协作。

现在,金山 AI Lab 主攻 NLP 赛道,包括图画、文本、语音三大方向,首要研讨内容分为常识图谱、机器翻译、内容引荐和智能校对等。研讨项目首要分为两类大蜀山女尸,一类是宫兰芳专心于落地的项目,如机器翻译、智能校对等;另一类是专心于根底效劳的项目,例如常识图谱,能够对这些直接落地的项目供给长时间的辅佐研讨。

建立一年多以来,团队硕果累累,在多个研讨方向上都取得了很大的打破,如常识图谱、机器翻译等。在常识图谱范畴,2018 年金山 AI Lab 援助 WPS 智能公函写作项目,构建了国内第一个党政常识图谱。但开展最大的要数机器翻译范畴。曩昔一年,团队在机器翻译技能方中医排瘀训练面创新出层次注意力机制、高斯查找等一起算法,并在工程细节、特征提取等方葛天中面堆集了丰厚的阅历。

团队还有许多新布局的研讨方向,阅览了解、智能文档、内容引荐、语音组成、语音辨认等等。这些都是依据用户需求而提出的研讨。比方语音辨认和组成,尽管金山有许多的文档,可是关于某些特别的集体(如白叟)或许在特别的环境(如晚上睡觉前)下,有许多用户期望听到文档的内容而不是用眼睛去看。语音组成技能也是用在文档上,能够挑选老练男声、美丽女声童声或许方言等,满足不同用户的需求。

AI Lab 最中心的优势是人才和数据

作为一家建立三十多年的大公司,金山在许多方面都有着自己一起的优势。在李博士看来,金山 AI Lab 有两大中心优势。

第一个中心优势是人才。现在,金山 AI Lab 不只有五十多位专业的 NLP 人才,还有专业的数据标示团队近年来,跟着算法的前进、硬件的开展、大数据和互联网的前进,人工智能技能迎来大迸发。通过一段时间的开展,NLP 技能证明了它落地的或许性,但人工智能特别是 NLP 技能的开展几经起落,学术界对人才的培育还没有跟上来。现在,NLP 人才特别缺少,人才是 AI Lab 最中心的竞争力之一。

金山 AI Lab 的第二个优势是数据。金山作业作为一家专心于文档处理的公司,在文档数据量方面具有较大优势,每天由 WPS Office 创立修改文档达 5 亿,累计存储文件 10PB。金山作业用户同享的海量数据对 AI Lab 研讨 NLP 技能供给了肯定的优势。

作为 AI Lab 的担任人,李博士平常的作业除了科研任务以及事务上的对接之外,还要管Mdoxhide理整个团队,担任人才的招聘和培育。谈到对人才的培育,他以为最重要的一点是,让适宜的人在自己感爱好的范畴里边发挥最大的价值。依据这一理念,团队成员的作业会参阅每个人的爱好不定期进行必定程度的优化调整。

金山AI Lab团队合影

参与 2018 AI Challenger「英中文本机器翻译」竞赛对团队来说是一次十分难忘的一个阅历,在预备竞赛的一survey,专访金山 AILab 试验室担任人李长亮博士:在金山做 NLP 最重要的是保护用户隐私,气温个多月的时间里,每个人都处于战役状况,每天夜以继日地研讨到晚上十二点今后,才会连续有人脱离公司。这个进程不只让他们对机器翻译这peepsamurai个范畴有了愈加深入的了解,而且整个团队的气氛得到了很好的提高,团队之间的协作愈加默契。研讨的进程尽管辛苦,可是也往往会发作一些趣事。比方,在模型测验进程傍边,偶然会呈现一些翻译得风马牛不相干的语句,这给严重的科研进程带来了欢喜。

金山做 NLP 严格遵守并保护用户隐私

谈到在金山做 NLP 的难点,李博士以为,现在业界的难点是共通的,如语句的了解和生成,以及最根底的分词、词性标示。但详细到公司,由于各家研讨侧重点不尽相同,所以面临的难点也都是有差异的。

对金山来说,现在还存人鱼公主的校园生活在许多技能难题需求处理。例如,最基本分词词性标示 NLP,现在对底层的技能还没有彻底霸占,准确率大约才百分之九十几,还不能够到达让用户满足的准确率。除了这些技能攻关外,在运用落地的时分,也会涉及到线上布置、用户恳求效劳survey,专访金山 AILab 试验室担任人李长亮博士:在金山做 NLP 最重要的是保护用户隐私,气温器等技能问题。

AI Lab 一直在进行技能上的优化,在机器翻译、阅览了解、常识图谱、内容引荐和智能文档等技能上的后续优化也是现在一直在改善的方向。除了在功率和准确率上进行提高外,还需求做一些范畴上的打破。比方,尽管 AI Lab 在机器翻译上现已取得了不错的效果,但优化也是无止境的。yourlustmovies关于机器翻译,在李博士看来,要做到「信达」并不难,可是要到达「雅」的境地就特别困难。用机器翻译技能处理公函和一般的文档并不难,可是假如要翻邹扶澜书法译好一些文学作品,就要到达「雅」的境地,这是十分困难的。

除了这些难点,李博士以为在金山做研讨重要的一点是严格遵守并保护用户隐私。他们能够许诺的刘中擎是,云文档放在金山是肯定安全的。尽管他们知道用户数据具有严重的研讨价值,可是他们污慢的原则是,绝不碰用户数据,这也是金山的底线和崇奉。

现在对数据的处理办法是,一切的数据都被分化到不同的当地,存到不同的效劳器上。技能人员接触到的数据都是通过拆分的,并保存在不同的当地。除此之外,他们还拟定了一系列的规章制度,以保证数据的安全。用户上传的数据,任何人都不能碰。

NLP 未来可期,现在的科研环境来之不易

当下人工智能的研讨反常火爆,越来越多的人参加这个范畴的研讨,但在李博士看来,人工智能人才特别的 NLP 范畴的人才依然十分稀缺,这个职业依然处于高速开展期,还远远不到发生泡沫的程度。

李博士以为,NLP 是人工智能里边最难的一个范畴,这是由于它涉及到人类的高级才智survey,专访金山 AILab 试验室担任人李长亮博士:在金山做 NLP 最重要的是保护用户隐私,气温。即使关于受过杰出高级教育的成年人来说,在了解言语的时分也或许不能正确地表达乃至会发生歧义。除此之外,NLP 更是会涉及到杂乱的文化布景,而且生长阅历survey,专访金山 AILab 试验室担任人李长亮博士:在金山做 NLP 最重要的是保护用户隐私,气温不同、所在环境不同的人对言语的了解和运用也是不一样的。

关于这一点,李博士给雷锋网举例说,现在,他们正在做的工作傍边,有一项是依据用户给定的一张图片,生成一段文字来描绘图片中的场景。这就需求通过大规模的学习做到,由于图片中的场景要描绘清楚,都需求知道相关的布景。再比方对某些要求比较高的 survey,专访金山 AILab 试验室担任人李长亮博士:在金山做 NLP 最重要的是保护用户隐私,气温PPT,需求配图,可是或许那个图片描绘的场景在实际中并没有发作过,因而需求用人工智能了解 PPT 的文字描绘,来组成所需求的图片。一切这些,都涉及到人类的高级才智,因而假如要做到很高的准确率,是比较难的。

谈到 NLP 的未来,李博士十分达观。他以为 NLP 技能现在还处于刚起步的阶段,正处于敏捷开展期。近几年,NLP 技能才刚开始找到大规模运用,并有其它技能辅佐支撑,所以接下来的五到十年将是 NLP 的黄金开展期。

跟着科技的开展和全球商业、工业的发童晟智教展,现在优异的效果不只会呈现的企业,也会呈现在高校。现在,越来越多的学者从学术界投身到工业界。李博士以为现在学术界与工业界的研讨处于齐头并进的状况,许多优异的结构都是来自于工业界。去学术界或许工业界仅仅个人挑选,为社会培育人才也是高校的斗破天地龙王求亲请排队职责之一survey,专访金山 AILab 试验室担任人李长亮博士:在金山做 NLP 最重要的是保护用户隐私,气温。比较于校园,企业的项目和社会结合愈加严密。

而当时的科研环境难能可贵,它是许多人通过多年的尽力、沉积和堆集开展起来的,这个环境需求一切人一起爱惜和保护。现在咱们国家的现状是,假如有哪个职业或许技能一旦变得火爆,本钱和媒体就会蜂拥而至。但是,这些外部力气或许不会尊重技能,乃至会使整个职业变得虚浮,带来欠好的影响。作为一个仔细做科研的人,关于这种状况,李博士表明了他的忧虑。他期望咱们能够能够爱惜现在的开展环境。

一个多小时的采访就此结束,在采访的进程中,能够感受到李博士对科研是诚心地酷爱。未来,金山 AILab 会带给咱们怎样的惊喜?让咱们拭目而待。

金山 人才 技能
声明:该文观念仅向曩昔借种代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。
文章版权及转载声明:

作者:admin本文地址:http://www.eigotukai.com/articles/688.html发布于 6个月前 ( 04-04 03:06 )
文章转载或复制请以超链接形式并注明出处涂凯文具,打造世界好文具