自然语言处理

01 深度学习的基础概念

深度学习是机器学习的一个分支,也是目前最主要的一个研究方向,相对于传统的机器学习而言,深度学习会简单一些。在神经网络中传递的向量就是特征,模型学得好不
2024-03-16
10分钟阅读时长

训练模型训练结果可重现

在模型开发的过程中,由于默认的随机的参数初始化策略,每一次训练损失下降的曲线都是由些许差异的,这种情况下,无法判断自己的优化是否有效,这个时候就需要设
2024-03-16
1分钟阅读时长

自然语言大模型的温度是如何影响输出的?

温度是用于控制自然语言大模型生成多样性的。较低的温度会使模型的概率分布更加明显尖锐,较高的温度会使模型概率分布更加平缓,温度是控制模型生成结果的多样性
2024-03-10
2分钟阅读时长

00 深度学习知识体系

列举和简述自然语言大模型所需要的知识点
2024-03-08
3分钟阅读时长

融合异构因子与 Triaffine 机制用于嵌套命名实体识别

嵌套实体由于其组合性而在许多领域中出现,目前广泛使用的序列标记框架难以识别嵌套实体。一个自然的解决方案是将任务视为词区间(Span)分类问题。为了学习
2022-04-06
5分钟阅读时长