返回第20章 天才般的构想(二合一章节)(1 / 2)从信息学霸到神级科学家首页

自从尝到上课回答问题加经验的甜头之后,江铭上课更加积极了,把徐建华推荐的几门课上了个遍。

不出一周,江铭就在三个学科上都增长了可观的经验值。

—————————————

姓名:江铭

信息学(主学科):Lv0 (520/1000)

数学:Lv0 (450/1000)

微电子工程学: Lv0 (200/1000)

积分:0

—————————————

看着自己稳定增长的经验值,江铭不禁露出欣慰的笑容,预计再过两到三个任务就能把信息学和数学提升到Lv1了。

至于微电子工程学...

唉,江铭只觉得自己在微电子工程领域的进展惨不忍睹。

只能考虑后面能不能再多上几门课,或者多去苏宇他们实验室逛逛吧。

系统给的任务总是被动触发,江铭也一直没能遇到加微电子工程学经验的任务。

...

周日,信息计算与智能系统实验室外。

朱宇引着一位中年男子与实验室众人见面。

“爸,这就是我之前和你讲过的江铭,这位是徐建华教授,这边是林欣然师姐。“,朱宇耐心地给朱朝阳介绍着。

江铭定睛看去,只见这个男人留着络腮胡子,头发斑白但非常整洁清爽,极具一种成熟男人的魅力。

徐建华则在一旁尴尬陪笑。

昨天江铭通知他朱朝阳要莅临实验室洽谈项目的时候他都惊了,自己这个学生竟然不声不响地给自己拉了这么大一个校企合作!

虽然当时就气愤地批评了江铭这种越俎代庖的行为,但身体还是很诚实地加了一整晚的班,把实验室的工作都整理了一遍。

没办法,万一今天这尊佛问起来,自己没准备好可怎么办?

可不是哪个实验室都有机会接触这个金陵市本地的著名企业家的,况且江铭还和他说有大的项目合作要谈。

这个江铭,就不能提前和他说一下要谈什么吗,自己这个导师还要不要面子的?

“原来你就是徐教授,幸会幸会。”,朱朝阳抬手与徐建华握手,边表明来意:“我这次来,是听说你们实验室可以解决长文本高精度机器翻译的问题,所以就来讨教一下。”

朱朝阳取出名片递给众人,上面在朱朝阳三个大字下面竟赫然写着物理学中级研究员的title!

等等,机器翻译?!徐建华震惊,身为信息学领域资深研究者的他当然知道朱朝阳所说的长文本高精度的机器翻译究竟得有多难。

到底是谁告诉这尊佛他们实验室能解决这个问题的?

徐建华更紧张了,他冷汗直流,自己这边可完全没准备与机器翻译有关的内容。

况且那朱朝阳竟然是中级研究员,和自己评级!

虽然不是信息学领域而是物理学领域,但是研究这件事讲究一个触类旁通,朱朝阳绝不是可以随便糊弄的,甚至对于机器翻译问题肯定是有所研究的。

徐建华转头看向江铭,如果眼睛能说话此时他已经喊出一连串的救救救了。

还好江铭立刻上前解了围:“朱总您好,我已经做好了具体解决方案的PPT,这就给您讲解一下我们实验室机器翻译的具体方案。”

他引着一行人走到实验室内的小型会议室,打开放映机,幻灯片上正展示着标题《基于LSTM的长文本高精度机器翻译》。

林欣然在旁边帮忙翻页,江铭看向众人,自信地开讲。

他昨天就已经用最后的50积分和系统换取了机器翻译的完整方案,用了一晚上把全部内容梳理得滚瓜烂熟,因此脸上一直挂着自然平和的微笑,与徐建华形成鲜明对比。

“首先,请允许我带大家回顾一下之前的统计翻译问题在哪里,再介绍我们的新方法是如何针对这些问题进行改进的。”

“过去的许多方法是直接通过数据构建从A语言向B语言的映射,在输入的时候将文本表示为一个长向量,向量每一维的元素值表示该词在文本中的存在性。”

朱朝阳在下面频频点头,江铭所讲的内容与他调研的结果一致,他只是觉得这样的方式的确不好,但是又想不到解决的办法。

江铭看众人都清楚自己所讲的内容,便示意林欣然翻到下一页:“然而这样的方式存在三个问题:首先是稀疏性问题,把整个文本表示为长向量那对应中文的话这个向量将会有3500维到7000维左右,其中几乎全部的维度都是零。”

“第二个问题是分布外延的问题,我们的世界是不断产生新单词的,本身每种语言也有大量生僻字,长向量的方式无法扩展也难以训练。”

“第三是我们目前的模型不足以建模长文本的复杂语义表征,使得即使用远超出现存数据量的数据训练,也难以在长文本上做到有效翻译。”

徐建华等人陷入了思考,江铭的总结非常精辟,这几个问题极难解决,几乎封死了原来统计翻译的道路。

这也是为什么特技研究员高泽把机器翻译列为了未来十年的重大课题。

难道江铭就有什么办法解决吗?几人不解。

“这三个问题实际上是源自一个问题,表示。”,江铭继续道。

“表示?”,其他众人对这个突然蹦出的词摸不着头脑,三个这么复杂的问题怎么就和表示有关了?

“我们现在把A语言的一个长句子表示成一个向量,再映射到B语言,就像查字典一样,这虽然简单直观,但是其实没有理解语言翻译真正的含义。”

“我请各位想想,比如高兴、快乐、走路、跑步这几个词,它们在上述的表示方法里是截然不同的词,但是在语义上真的是这样吗,或者翻译成别的语言的时候会不会翻译成同一个意思?”

“我知道我知道!”林欣然举手,“高兴和快乐在语义上很接近,走路和跑步虽然速度不同,但都是相同类型的词,应当也比较接近。”

“你说的很对”,江铭欣慰地看了林欣然两眼,继续道:“一个词有它的词性和词义,不同词性与词义的词通过不同的顺序组合,就形成了语义。”

“因此第一步...”,江铭顿了顿,示意林欣然翻页。

不过林欣然还沉浸在被夸奖的喜悦中迟迟不动,江铭只好自己走过去戳了一下触控屏幕,屏幕上展示出一张由不同词语构成的复杂云图。

“第一步就是构建词语的稠密向量表示!”,江铭走到屏幕前,指向其中某个区域,几人探着头眯起眼睛才看出来这个位置正是写着跑、跳等与行走有关的词语。

“比如现在出现一个新词是彳亍,虽然很少有包含这个词的句子以及整句话的翻译,但只要它在表示上处于这个区域,仍然能做到丝滑翻译。这就解决了刚刚第一第二两个问题。”

台下的几人脸色从疑惑到恍然再到震惊,徐建华甚至接连发出卧槽的声音,只有朱宇听不太懂,但也不明觉厉。

他环顾四周欣赏了一下众人的表情,自己看中的大佬果然没给他丢人,也不枉费他努力在父亲那边争取了。

“通过词向量的方式,的确可以解决前两个问题。但你如何表示词与词之间的顺序关系呢,从一个个词组合成为语义可是复杂的序列建模问题!”,朱朝阳一针见血地道。

就是因为序列建模几乎是绕不过去的难关,之前的机器翻译方法才一直没有选择统计翻译这条路线。

毕竟即使是最新的RNN网络,也只能记录一些简单的顺序关系,因此序列建模这条路几乎无解。

朱朝阳不禁疑惑,难道江铭在这里也有一些自己的想法,通过什么自己没想到方式避免了进行序列建模吗?