免责声明:网站内容仅供个人学习记录,禁做商业用途,转载请注明出处。

版权所有 © 2017-2020 NEUSNCP个人学习笔记 辽ICP备17017855号-2

《Why Language Models Hallucinate》论文解读(转发)

摘要 就像学生面对难题时会猜测一样,大型语言模型在不确定时也会进行猜测,生成看似合理却错误的表述,而非承认自身的不确定性。这种幻觉现象即便在最先进的大模型中也依然存在,并且会损害用户对模型的信任。我们认为,语言模型产生幻觉的原因在于,其训练与评估流程更倾向于奖励猜测行为,而非奖励承认不确定性的行为;同时,我们也分析了现代训练流程中导致幻觉产生的统计层面原因。 幻觉并非难以解释的神秘现象它本质上源于二分类任务中的错误。若模型无法区分错误表述与事实,那么在自然的统计压力作用下,预训练语言模型就必然会产生幻觉。...

继续阅读 »
分享到:

基于强化学习的课目-素质-动作动态权重的学习(V3)

1. 系统整体架构 该系统是一个基于深度强化学习的体能训练权重优化平台,采用分层架构设计: 1.1 架构层次 ┌─────────────────────────────────────────────────────┐ │ API服务层 (FastAPI) │ ├─────────────────────────────────────────────────────┤ │ 业务逻辑层 │ │ ┌─────────────┐ ┌──...

继续阅读 »
分享到:

基于强化学习的课目-素质-动作动态权重的学习(V2)

1. 系统整体架构 该系统是一个基于深度强化学习的体能训练权重优化平台,采用客户端-服务器架构,通过FastAPI提供RESTful API服务。系统核心功能分为两个主要模块: 1.1 系统组件 FastAPI Web框架 :提供HTTP API接口 PyTorch深度学习框架 :实现神经网络和强化学习算法 CUDA加速 :利用GPU进行高效计算 日志系统 :记录训练和优化过程 模型持久化 :保存和加载训练好的模型 1.2 核心工作流程 用户数据输入 状态编码 策略网络决策 环境交互 奖励计算 ...

继续阅读 »
分享到:

Stroke-based Cyclic Amplifier: Image Super-Resolution at Arbitrary Ultra-Large Scales

1. 研究背景与问题 1.1 核心问题 任意尺度超分辨率(ASISR)的局限性 :现有方法(如LIIF、CiaoSR)在训练覆盖的尺度内(如14)表现良好,但当放大倍数 超出训练范围 (如30100)时,性能急剧下降,产生严重模糊、噪声和伪影(图1, 图2)。 传统级联方法的缺陷 : 需为每个放大步骤训练独立模型(如444实现64),训练复杂度高。 存储开销大,且新尺度需重新训练, 扩展性差 。 循环使用现有ASISR模型会导致 分布漂移 (distribution drift),累积噪声和模糊(图2)。...

继续阅读 »
分享到:

QSAM-Net: Rain streak removal by quaternion neural network with self-attention module

1. 研究背景与问题 核心问题 雨痕对图像质量的影响 :雨滴、雨纹和雾气会导致图像对比度下降、颜色失真、细节模糊,严重影响遥感、监控、自动驾驶等领域的计算机视觉任务(如目标检测)。 现有方法的局限性 : 过拟合与过度平滑 :模型在合成数据上训练后泛化能力差,易去除非雨纹纹理(如垂直背景),导致图像细节丢失。 复杂雨纹建模不足 :难以处理重叠雨纹、雾气等复杂天气混合场景。 数据集缺陷 :现有合成数据集多样性不足,缺乏真实世界的雨纹分布。 颜色处理缺陷 :传统CNN独立处理RGB通道,忽略通道间关联,导致颜色...

继续阅读 »
分享到: