数据科学:Python中的自然语言处理(NLP) | Data Science: Natural Language Processing (NLP) in Python
应用:解密密码、垃圾邮件检测、情感分析、文章旋转器和潜在语义分析。
讲师:Lazy Programmer Inc.
双语资源中英文字幕学习课程,独家翻译制作,提供全部配套课程资料。全网最低价享受高品质课程资源,无限分享下载。
你将会学到什么?
- 使用遗传算法和马尔可夫模型的语言建模编写自己的密码解密算法
- 用Python编写自己的垃圾邮件检测代码
- 用Python编写自己的情绪分析代码
- 在Python中执行潜在语义分析或潜在语义索引
- 了解如何用Python编写自己的文章旋转器
- 了解OpenAI ChatGPT、GPT-4、DALL-E、Midjourney和稳定扩散的重要基础
课程要求
- 安装Python,它是免费的!
- 你应该至少在编写Python代码时有点舒服
- 知道如何安装Python的数值库,如Numpy、Scipy、Scikit-learn、Matplotlib和BeautifulSoup
- 参加我的免费Numpy先决条件课程(它是免费的,没有借口!),了解Numpy、Matplotlib、Pandas和Scikit learn,以及机器学习基础知识
- 可选:如果你想了解数学部分,线性代数和概率是有帮助的
课程说明
有没有想过像OpenAIChatGPT、GPT-4、DALL-E、Midjourney和稳定扩散这样的人工智能技术是如何工作的?在本课程中,您将学习这些突破性应用程序的基础。
在本课程中,您将使用自然语言处理(NLP)构建多个实用系统,NLP是机器学习和数据科学中处理文本和语音的分支。这门课程不是我的深度学习系列的一部分,所以它不包含任何困难的数学——只是用Python直接编码。本课程的所有材料都是免费的。
在简要讨论了NLP是什么以及它能做什么之后,我们将开始构建非常有用的东西。我们将构建的第一件事是密码解密算法。这些在战争和间谍活动中都有应用。在本节中,我们将学习如何构建和应用几个有用的NLP工具,即字符级语言模型(使用马尔可夫原理)和遗传算法。
第二个项目,我们开始使用更传统的“机器学习”,是构建一个垃圾邮件检测器。与21世纪初相比,由于这样的系统,这些天你可能会收到很少的垃圾邮件。
接下来,我们将在Python中为情绪分析构建一个模型。这让我们可以给一段文字打分,告诉它是积极的还是消极的。人们在推特上使用情绪分析来预测股市**。
我们将介绍一些实用的工具和技术,如NLTK(自然语言工具包)库和潜在语义分析或LSA。
最后,我们通过构建一个文章旋转器来结束本课程。这是一个非常困难的问题,即使是现在最受欢迎的产品也没有解决这个问题。这些讲座旨在让你入门,并为你提供如何自己改进的想法。一旦掌握,你就可以将其用作SEO或搜索引擎优化工具。如果你能为他们做这件事,世界各地的互联网营销人员都会爱你的!
本课程侧重于“如何构建和理解”,而不仅仅是“如何使用”。阅读一些文档后,任何人都可以在15分钟内学会使用API。这不是关于“记住事实”,而是关于通过实验“亲眼目睹”。它将教你如何可视化模型内部发生的事情。如果你想更多**而不仅仅是肤浅地了解机器学习模型,这门课程适合你。
“如果你不能实现它,你就不理解它”
- 或者正如伟大的物理学家理查德·费曼所说:“我不能创造的东西,我不理解。”。
- 我的课程是唯一一门让你从头开始学习如何实现机器学习算法的课程
- 其他课程将教你如何将数据插入库,但你真的需要3行代码的帮助吗?
- 在用10个数据集做了同样的事情后,你意识到你没有学到10件事。你学到了一件事,只是重复了同样的3行代码10次。..
此课程面向哪些人?
- 能够熟练编写Python代码、使用循环、列表、字典等的学生。
- 想学习更多机器学习但不想做很多数学的学生
- 对将机器学习和NLP应用于垃圾邮件检测、互联网营销和情感分析等实际问题感兴趣的专业人士
- 本课程不适合那些认为课程中列出的任务和方法过于基础的人。
- 本课程不适合那些还没有对机器学习和Python编码有基本了解的人(但你可以从我的免费Numpy课程中学习这些)。
- 本课程不适合那些不知道(根据章节标题)每项任务的目的的人。例如,如果你不知道“垃圾邮件检测”可能对什么有用,你就太落后了,不能参加这门课程。