欢迎访问:沃派博客 每天不定时发布IT文章相关资讯
当前位置:沃派博客-沃派网 > IT文章 > 正文

AI 研习社大讲堂已逾 100 期!精彩 NLP 分享视频回顾

11-29 IT文章

原标题:AI 研习社大讲堂已逾 100 期!精彩 NLP 分享视频回顾

机器学习、人工智能领域的研究人员,以及任何学术研究人员,都关心这两件事:分享、传播自己的研究成果让更多人知道,以及了解自己研究方向的最新进展、结识更多的研究人员。雷锋网 AI 研习社大讲堂就是一个供研究人员们分享自己成果、促进广泛沟通互动的直播平台。

自 AI 大讲堂去年 7 月上线以来, 已经有来自清华大学、北京大学、上海交通大学、香港科技大学、 MIT、UC Berkeley、悉尼科技大学等知名国内外高校的嘉宾进行直播分享,甚至还举办了线下论文分享会,迄今已完成了 100 期,覆盖影响读者过万人。不仅嘉宾自己的研究成果被直播观众以及读者们了解,也让科技爱好者们、学生们、其它研究人员们增进了对人工智能相关思维、知识、应用的认识,为国内人工智能长期持续发展的氛围出一份力。

下面我们汇总了大讲堂精彩的 NLP 方向分享回顾。

第 12 期,word2vec技术在文本分析中的应用

word2vec是通过文本的语序和语境无监督训练出来能将词的语义表征到向量空间中的模型。自从Mikolov et al.在2013年提出之后,在文本分析中有着广泛的应用。在这次分享中,我将讲解word2vec模型的基本原理,它的一些变形,以及在一些数据挖掘任务中的应用。

第 15 期,基于深度学习的语音分离

语音分离的三个方面:语音增强(语音和非语音分离),多说话人分离和语音解混响;

语音分离的四个部分:模型,训练目标,训练数据和单通道分离算法。

第 20 期,生成式对抗网络在文本生成的探索:基础、前沿以及我们全新的结果

生成式对抗网络(GANs)目前已经得到了广泛研究者的关注并且在很多实际场景中得到应用。但是大多数研究工作仍然集中在例如图片和语音的连续稠密数据上,而对例如文本这样的序列离散数据的生成研究得较少。原因是对这类离散数据无法直接求导,导致原版的GAN模型无法工作。我们课题组在2017年AAAI提出SeqGAN框架来成功绕过这个问题,通过将文本生成器建模成一个强化学习策略并用REINFORCE梯度优化来学习这个生成器,SeqGAN达到了文本生成效果的提升。基于SeqGAN,我们课题组进一步研究了对抗过程中的信息泄露设置,发现判别器泄露的信息其实能很好地帮助生成器快速学习并最终达到更好的文本生成效果,这个新框架我们命名为LeakGAN。

第 22 期,基于LSTM-RNN的语音声学建模技术

LSTM-RNN可以对长时序列信息进行建模,广泛应用于语音识别声学模型建模中。此次主要介绍近期LSTM的一些研究进展包括LC-BLSTM,2D-LSTM等。其中LC-BLSTM采用了双向LSTM结构,并在训练和解码时加入了数帧的未来信息来控制延时,解决了普通双向LSTM无法用于实时语音识别的问题;而2D-LSTM在时间和频域两个维度上进行循环,同时保存时间轴与频域轴的序列信息,Google和微软都在大规模语音识别任务上验证了这类2D-LSTM结构的有效性。

第 25 期,基于深度学习的中文唇语识别

唇语识别,即通过运动的嘴唇,识别其说话内容。通过LSTM模型将CNN抽取出来的图片特征进行时序建模,最后引入Seq2Seq的翻译模型将发音转换成汉字。此次分享,会先简单介绍现有的英文唇语识别的一些工作(《Lip Reading Sentences in the Wild》 和《LipNet: sentence level lipreading》),随后对中文唇语识别展开详细讨论。

第 27 期,面向对象的神经规划用于文档理解

深度好奇提出了用于垂直领域文档理解的OONP框架,它使用离散的对象本体图结构作为中间状态,该状态被OONP创建、更新直至最终输出。这个解析过程被OONP转化成为按照文本阅读顺序的离散动作的决策序列,模仿了人理解文本的认知程。OONP框架提供了神经符号主义的一个实例:在OONP框架内,连续信号、表示、操作和离散信号、表示、操作紧密结合,形成信息闭环。这使得OONP可以灵活地将各种先验知识用不同形式加入到行间记忆和策略网络中。为了优化OONP,深度好奇利用监督学习和强化学习以及二者的各种混合态,以适应不同强度和形式的监督信号以训练参数。

第 32 期,深度学习在语音增强方向上的前沿研究

现实生活中干扰噪声的存在严重影响到助听器、人工耳蜗等听力设备佩戴者的语音可懂度。同时在智能语音交互设备中,这些干扰噪声的存在也严重影响了语音识别的正确率,随着智能音箱等设备的大热,语音前端信号处理越来越被重视起来。本次分享主要对单(多)通道的传统语音增强算法做个简单的汇总,然后重点讲解一下目前学术上比较前沿的基于深度学习的语音增强与分离算法。

第 36 期,强化学习在自然语言处理经典问题上的初探

版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/7337.html