Python中的无监督机器学习隐马尔可夫模型 | Unsupervised Machine Learning Hidden Markov Models in Python
用于股价分析、语言建模、网络分析、生物学和PageRank的HMM。
讲师:Lazy Programmer Team
双语资源中英文字幕学习课程,独家翻译制作,提供全部配套课程资料。全网最低价享受高品质课程资源,无限分享下载。
你将会学到什么?
- 理解并列举马尔可夫模型和隐马尔可夫模型的各种应用
- 了解马尔可夫模型的工作原理
- 用代码编写马尔可夫模型
- 将马尔可夫模型应用于任何数据序列
- 理解马尔可夫链背后的数学
- 将马尔可夫模型应用于语言
- 将马尔可夫模型应用于网站分析
- 了解谷歌PageRank的工作原理
- 理解隐马尔可夫模型
- 用代码编写隐马尔可夫模型
- 使用Theano编写隐马尔可夫模型
- 了解通常用于深度学习的梯度下降如何用于HMM
课程要求
- 熟悉概率和统计学
- 了解高斯混合模型
- 熟悉Python和Numpy
课程说明
隐马尔可夫模型或HMM都是关于学习序列的。
很多对我们建模非常有用的数据都是按顺序排列的股票价格是价格的序列。语言是一系列单词信用评分涉及借款和还款的顺序,我们可以使用这些顺序来预测你是否会违约。简而言之,序列无处不在,能够分析它们是数据科学工具箱中的一项重要技能。
欣赏你从一个序列中获得的信息的最简单方法是考虑你现在正在阅读的内容。如果我把前一句倒过来写,即使它包含了所有相同的单词,对你来说也没有多大意义。所以秩序很重要。
虽然目前深度学习的流行趋势是使用递归神经网络对序列进行建模,但我想首先向大家介绍一种已经存在了几十年的机器学习算法——隐马尔可夫模型。
本课程直接来自我的第一门课程无监督机器学习用于聚类分析,在那里你学习了如何测量随机变量的概率分布。在本课程中,您将学习测量随机变量序列的概率分布。
你们知道我有多么喜欢深度学习,所以这门课有点曲折。我们已经介绍了梯度下降,您知道它对解决深度学习问题有多重要。我声称梯度下降可以用来优化任何目标函数。在本课程中,我将向您展示如何使用梯度下降来求解HMM的最优参数,作为流行的期望最大化算法的替代方案。
我们将在Theano和Tensorflow中进行,这两个库是深度学习的热门库。这也将教你如何使用Theano和Tensorflow中的序列,当我们涵盖递归神经网络和LSTM时,这将非常有用。
本课程还将介绍马尔可夫模型和隐马尔可夫模型的许多实际应用。我们将研究一个疾病和健康的模型,并计算如何预测如果你生病了,你会生病多久。我们将讨论如何使用马尔可夫模型来分析人们如何与您的网站互动,并解决高跳出率等可能影响您的SEO的问题。我们将建立语言模型,用于识别作家,甚至生成文本——想象一台机器为你写作。HMM在自然语言处理或NLP方面非常成功。
我们将看看Markov模型的最新和最丰富的应用——谷歌的PageRank算法。最后,我们将讨论马尔可夫模型的更实际的应用,包括生成图像、智能手机自动建议,以及使用HMM回答生物学**中最基本的问题之一——生命密码是如何转化为生物体的物理或行为属性的?
本课程的所有材料都可以免费下载和安装。我们将在Numpy和Matplotlib中完成大部分工作,还有一点Theano。我随时可以回答您的问题,并帮助您完成数据科学之旅。
本课程的重点是“如何构建和理解”,而不仅仅是“如何使用”。阅读一些文档后,任何人都可以在15分钟内学会使用API。这不是关于“记住事实”,而是关于通过实验“亲眼目睹”。它将教您如何在内部可视化模型中发生的事情。如果你想要更多而不仅仅是对机器学习模型的肤浅了解,这门课程就是为你准备的。
上课见!
“如果你不能实施它,你就不理解它”
- 或者正如伟大的物理学家理查德·费曼所说:“我不能创造的,我不理解”。
- 我的课程是您将学习如何从头开始实现机器学习算法的唯一课程
- 其他课程会教你如何将数据插入库,但你真的需要3行代码的帮助吗?
- 在对10个数据集做了同样的事情后,你会意识到你没有学到10件事。你学到了一件事,只重复了同样的3行代码10次。。。
建议的先决条件:
微积分
- 线性代数
可能性
- 熟悉多元高斯分布
- Python编码:if/else、循环、列表、dicts、集合
- Numpy编码:矩阵和矢量运算,加载CSV文件
我应该按什么顺序选修你的课程?:
- 查看讲座“机器学习和人工智能先决条件路线图”(可在我的任何课程的常见问题解答中找到,包括免费的Numpy课程)
此课程面向哪些人?
- 从事数据分析,特别是序列数据分析的学生和专业人员
- 想要优化网站体验的专业人士
- 希望加强机器学习知识和实践技能的学生
- 对DNA分析和基因表达感兴趣的学生和专业人士
- 对建模语言和从模型生成文本感兴趣的学生和专业人员