模块化思维语言模型MeTHanol技术解析

本文介绍MeTHanol模块化思维语言模型，通过中间层思考、解码和自举推理机制增强大语言模型的认知能力。研究采用双阶段微调和两轮推理机制，在心理理论和情景实验中获得显著认知提升，可生成类人思维并适应开放域任务。

MeTHanol：具有中间层思考、解码和自举推理的模块化思维语言模型

当前研究重点通过提示、数据驱动涌现和推理时计算来增强大语言模型（LLM）的思维推理能力。本研究从模块化视角出发，模拟人脑架构来激发语言模型的思维认知能力。

技术方法

选择特定中间注意力层并植入新的语言头，通过标注的（查询、思维、答案）样本进行双层级微调。实验表明中间层同样能解码流畅合理的语言标记。设计两轮推理机制：首轮生成思维，次轮生成正式响应。

框架特性

该模块化思维语言模型（MeTHanol）可增强LLM的认知行为，具体通过：

心理理论（ToM）实验验证
基于情景的评估实验案例研究表明，MeTHanol具备规划与自反思能力，能生成类人思维和答案，甚至在未见过的开放域任务中表现优异。模型可适配个性化提示并模拟特定角色行为。

研究意义

从模块化视角实现了显著的认知能力提升，相关代码、模型和数据已开源提供。

comments powered by Disqus