NLP相关概念汇总

admin

2024-03-22 11:52:35

0次

最近看到很多概念，杂乱无章有点分不清楚，条分缕析来总结一下。

1. XX学习
- 对比学习
- - 相关模型
  - 相关损失
- 度量学习
- 对比聚类
- - 相关模型
- 课程学习
2. XX语言模型
- MLM（掩码语言模型）
- - 相关模型
  - 相关损失
- CLM（因果语言模型）
- PPLM（即插即用语言模型）
- - 相关模型
- VLP（Vision-Language Pre-training，视觉语言预训练）
- - 相关模型
3. XX网络
- 孪生网络（Siamese Network）
- 伪孪生网络（Pseudo-Siamese Network）
4. 词&句向量预训练语言模型
- 词向量预训练语言模型
- 句向量预训练语言模型

1. XX学习

对比学习和度量学习都是表示学习的分支。

对比学习

近几年对比学习如火如荼，其主要思想是，通过构造正负样本，使得正样本间的距离靠近，负样本间的距离拉远，且负样本间的距离远远大于正样本间的距离。对比学习主要用在无监督和半监督任务中，且为单正例，多负例。

一个好的对比学习系统应该兼顾Alignment和Uniformity，若丢失Alignment，则说明该系统并不能学习到良好的表征；若丢失Uniformity，则说明产生了模型坍塌问题。

度量学习

与对比学习相似，度量学习也是通过构造正负样本，拉近正样本间的距离，拉远负样本间的距离。度量学习主要用于有监督任务中，且为二元组或三元组形式。

二元组损失（Pairwise Ranking Loss）：形为（正样本，负样本）的二元组

Pytorch中可直接调用MarginRankingLoss实现

三元组损失（TripletLoss）：形为（锚样本，正样本，负样本）的三元组，通常在计算损失之前会有一个三元组采样的过程。

Pytorch中可直接调用TripletMarginLoss实现

对比聚类

课程学习

2. XX语言模型

这些语言模型的思想本质上都是通过在大规模训练语料上，使用合适的损失函数进行训练，得到能够更好地提取文本特征的预训练语言模型。

MLM（掩码语言模型）

给定上下文信息，预测文本掩码中的词，提高模型对文本的特征提取能力。

CLM（因果语言模型）

给定上文信息，预测文本掩码中的词，提高模型生成的文本的流畅性，一般用于文本生成任务中，如GPT系列、ChatGPT（GPT-3变体）、CTRL等。

值得注意的是，CMU和google brain联手推出的Bert改进版模型XLNet将MLM与CLM二者结合，两全其美。

PPLM（即插即用语言模型）

VLP（Vision-Language Pre-training，视觉语言预训练）

3. XX网络

孪生网络（Siamese Network）

共享权重

伪孪生网络（Pseudo-Siamese Network）

不共享权重

4. 词&句向量预训练语言模型

词向量预训练语言模型

Word2Vec
Efficient Estimation of Word Representations in Vector Space
ELMo（Embeddings from Language Models）
Deep Contextualized Word Representations

句向量预训练语言模型

SIF（Smooth Inverse Frequency，非预训练语言模型）其中用到Word2Vec
A Simple but Tough-to-Beat Baseline for Sentence Embeddings

词库加载错误:未能找到文件“E:\highferrum_mysql\Configuration\Dict_Stopwords.txt”。

上一篇：阿里回应计划出售哔哩哔哩ADR：主要基于自身资本管理目标，不影响业务合作阿里回应计划出售哔哩哔哩ADR：主要基于自身资本管理目标，不影响业务合作

下一篇：36氪独家丨饿了么新三年战略规划：距结束亏损只差一些时间，仍将以上市为目标 36氪独家丨饿了么新三年战略规划：距结束亏损只差一些时间，仍将以上市为目标

NLP相关概念汇总

目录

1. XX学习

对比学习

相关模型

相关损失

度量学习

对比聚类

相关模型

课程学习

2. XX语言模型

MLM（掩码语言模型）

相关模型

相关损失

CLM（因果语言模型）

PPLM（即插即用语言模型）

相关模型

VLP（Vision-Language Pre-training，视觉语言预训练）

相关模型

3. XX网络

孪生网络（Siamese Network）

伪孪生网络（Pseudo-Siamese Network）

4. 词&句向量预训练语言模型

词向量预训练语言模型

句向量预训练语言模型

相关内容

热门资讯