摩尔线程大模型对齐研究获国际顶级学术会议认可:URPO 框架入选 AAAI 2026 11 月 13 日消息,摩尔线程提出的新一代大语言模型对齐框架 —— URPO 统一奖励与策略优化,相关研究论文近日被人工智能领域的国际顶级学术会议 AAAI 2026 收录,为简化大模型训练流程、突... 行业资讯# AAAI 2026# URPO 框架# 摩尔线程 3周前180