果断同意小姜老师的来信以及通讯作者的要求,同时,莫浩波装作纯真的二逼青年,很中二地来了句:我一定会成为最牛的计算机科学家的!
回了邮件,还不等小姜老师回邮件,莫浩波又投入了文本生成词向量的另一个工具,Glove方法的实验以及论文的编写。
数据集是有了的,上次论文的数据就好,方便快捷,而且好比较。
代码也是现成的,前世,菜鸟如莫浩波,对于各种算法等,都要好好看看,简单的就是自己用python实现,复杂的呢,就是clone开源实现了。
好习惯呀,便宜了现在的莫浩波,换换数据集,调调参数,优秀的实验数据就出来了,果然,模仿才是最省力的。
三个小时过去了,五个中小规模的数据集也跑完了,在现有的公开的算法上,词语相似度,分类,命名实体提取等任务上,都优秀于初版的词向量工具ord2vec,部分比莫浩波提出的负采样方法等差些罢了。
忽略这个小缺点,Glove仍然不失为一种好方法,尤其是对于机器学习、以及急于和美国竞争的中国人来说,中国,确实需要一些引领世界的大牛了!
修改了一下斯坦福大学教授在14年发表的Glove论文,莫浩波删删改改,使之符合自己的语言习惯和理解,晚上六点,他便将这篇论文,邮件发了出去,给小姜老师。
这段时间,一直忙于莫浩波上一篇负采样的ord2vec论文的小姜老师,这时候格外注意邮件的信息,或许,还会有什么灵光一闪的学生会邮件她吧!
毕竟,教授什么的,那也是语言高质量论文的呢。
这不,现在,她的一部分精力,也投入了自然语言这方面的大数据研究呢!
论文邮件发了出去,再上传了arXiv,莫浩波终于松下了一口气。接下来,就是碰瓷式炒作的时候了。这个得好好想想。
“叮,恭喜宿主成功完成一篇高质量NLP论文,芯片科技值+1,宿主再接再厉!”声音又消失了,仿佛什么也没来过。
充值满了以后会发生什么呢?莫浩波也很想知道,这点,也激励了他继续论文的心思,加油啊。
网络的另外一边,小姜老师马上就看到了莫浩波的论文邮件,大吃一惊,这论文也是太快了吧!
仔细浏览,即便不精通自然语言处理方面的她,也意识到了莫浩波提出的共现矩阵的价值,这可是货真价实的新思想论文!