从语言学强转NLP学习记录

强转中,持续更新……

数学方法篇

计算语言学工作者需要了解的数学知识-常宝宝

常老师的这篇文档比较全面地概括了计算语言学需要知道的数学知识,可以作为学习索引和复习大纲去使用。而理论想要透彻理解还需要深挖更多资料。

网课:

贝叶斯定理

数学之美-第三章:统计语言模型

贝叶斯推断及其互联网应用(一):定理简介

数学之美番外篇:平凡而又神奇的贝叶斯方法

  • 条件概率公式
  • 全概率公式
  • 乘法公式

朴素贝叶斯法

带你搞懂朴素贝叶斯分类算法
算法杂货铺——分类算法之朴素贝叶斯分类
教你明白啥是朴素贝叶斯分类器

有R语言处理的实例。

Perplexity详解
关于数据平滑的一些理解

工具篇

Jupyter Notebook

在 Jupyter Notebook 中使用Latex

Pandas & Pyplot

Pandas(一个极受欢迎的 Python 数据处理库):十分钟Pandas入门
Pandas手册
Matplotlib(Python 图表绘制与可视化库):Pyplot

Scikit-Learn

英文官方教程
中文翻译教程

NumPy

中文手册

算法学习篇

反向传播

涉及到的数学知识点:

反向传播一定要自己在草稿纸上画草图推一遍,可以参考下面几个博客:
一文弄懂神经网络中的反向传播
使用反向传播训练多层神经网络的原则

道路选择

Linguistics, NLP, and Interdisciplinarity Or: Look at Your Data
(需要翻墙,17年关于语言学在NLP中应用度的讨论)