Python中具有深度学习的自然语言处理 | Natural Language Processing with Deep Learning in Python

使用递归网络推导和实现word2vec、GloVe、单词嵌入和情感分析的完整指南
讲师:Lazy Programmer Inc.

双语资源中英文字幕学习课程,独家翻译制作,提供全部配套课程资料。全网最低价享受高品质课程资源,无限分享下载。

你将会学到什么?

  • 理解并实施word2vec
  • 理解word2vec中的CBOW方法
  • 理解word2vec中的skip gram方法
  • 了解word2vec中的负采样优化
  • 使用梯度下降和交替最小二乘法理解和实现GloVe
  • 使用递归神经网络进行词性标注
  • 使用递归神经网络进行命名实体识别
  • 理解并实现用于情绪分析的递归神经网络
  • 理解并实现用于情绪分析的递归神经张量网络
  • 使用Gensim获得预训练的单词向量,并计算相似性和类比
  • 了解OpenAI ChatGPT、GPT-4、DALL-E、Midtravel和稳定扩散的重要基础

课程要求

  • 安装Numpy、Matplotlib、Sci Kit Learn和Theano或TensorFlow(现在应该非常容易)
  • 了解反向传播和梯度下降,能够自己推导和编码方程
  • 根据Theano(或Tensorflow)中的基本基元,特别是扫描函数,对递归神经网络进行编码
  • 在Theano(或Tensorflow)中编码前馈神经网络
  • 有助于掌握树算法的经验

课程说明

有没有想过像OpenAIChatGPTGPT-4DALL-E中端稳定扩散*这样的人工智能技术是如何真正工作的?在本课程中,您将学习这些突破性应用程序的基础知识。

在本课程中,我们将研究NLP(自然语言处理)深度学习

之前,您了解了一些基础知识,比如有多少NLP问题只是常规的机器学习数据科学问题,以及简单实用的方法,比如单词包和术语文档矩阵。

这些让我们可以做一些很酷的事情,比如检测垃圾邮件写诗发表文章,以及将类似的单词组合在一起。

在本课程中,我将向您展示如何做更棒的事情。在本课程中,我们不仅将学习1种新架构,还将学习4种新架构。

首先是word2vec

在本课程中,我将向您展示word2vec是如何工作的,从理论到实现,您将看到它只是您已经知道的技能的应用。

Word2vec很有趣,因为它神奇地将单词映射到一个向量空间,在那里你可以找到类比,比如:

  • 国王-男人=王后-女人
  • 法国-巴黎=英国-伦敦
  • 12月至11月=7月至6月

对于那些觉得算法很难并且只想使用库的初学者,我们将演示使用Gensim库来获得预先训练的单词向量,计算相似性和类比,并将这些单词向量应用于构建文本分类器。

我们还将研究GloVe方法,该方法也可以找到单词向量,但使用了一种称为矩阵分解的技术,这是推荐系统的一种流行算法。

令人惊讶的是,GLoVe产生的单词向量和word2vec产生的一样好,而且训练起来更容易。

我们还将研究一些经典的NLP问题,如词性标记命名实体识别,并使用递归神经网络来解决它们。你会发现,几乎任何问题都可以使用神经网络来解决,但你也会学到过于复杂的危险。

最后,您将了解递归神经网络,它最终帮助我们解决情绪分析中的否定问题。递归神经网络利用了句子有树结构的事实,我们终于可以摆脱天真地使用单词袋的习惯。

本课程所需的所有材料都可以免费下载和安装。我们将在Numpy、MatplotlibTheano*中完成大部分工作。我随时可以回答您的问题,并帮助您完成数据科学之旅。

本课程的重点是“如何构建和理解”,而不仅仅是“如何使用”。阅读一些文档后,任何人都可以在15分钟内学会使用API。这不是关于“记住事实”,而是关于通过实验“亲眼目睹”。它将教您如何在内部可视化模型中发生的事情。如果你想要更多而不仅仅是对机器学习模型的肤浅了解,这门课程就是为你准备的。

上课见!

“如果你不能实施它,你就不理解它”

  • 或者正如伟大的物理学家理查德·费曼所说:“我不能创造的,我不理解”。
  • 我的课程是您将学习如何从头开始实现机器学习算法的唯一课程
  • 其他课程会教你如何将数据插入库,但你真的需要3行代码的帮助吗?
  • 在对10个数据集做了同样的事情后,你会意识到你没有学到10件事。你学到了一件事,只重复了同样的3行代码10次。。。

建议的先决条件:

  • 微积分(取导数)
  • 矩阵加法、乘法
  • 概率(条件分布和联合分布)
  • Python编码:if/else、循环、列表、dicts、集合
  • Numpy编码:矩阵和矢量运算,加载CSV文件
  • 神经网络和反向传播,能够自己推导和编码梯度下降算法
  • 可以在Theano或TensorFlow中编写前馈神经网络
  • 可以从基本基元,特别是扫描函数,在Theano或TensorFlow中编写递归神经网络/LSTM/GRU
  • 有助于掌握树算法的经验

我应该按什么顺序选修你的课程?:

  • 查看讲座“机器学习和人工智能先决条件路线图”(可在我的任何课程的常见问题解答中找到,包括免费的Numpy课程)

独特的功能

  • 详细解释了每一行代码-如果您不同意,请随时给我发电子邮件
  • 不像其他课程那样浪费时间在键盘上“打字”——老实说,没有人能真正在20分钟内从头开始编写值得学习的代码
  • 不怕大学级别的数学-了解其他课程遗漏的算法的重要细节

此课程面向哪些人?

  • 想要为各种NLP任务创建词向量表示的学生和专业人员
  • 对递归神经网络等最先进的神经网络架构感兴趣的学生和专业人士
  • 不应该:任何对先决条件不满意的人。
声明:双语资源网(shuangyuziyuan.com)提供的所有课程、素材资源全部来源于互联网,VIP 赞助仅用于对双语资源服务器带宽及网站运营等费用支出做支持,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。