论文解读系列-任务向量做模型编辑为何有效?

背景

任务向量(task vector)指微调得到的模型与预训练模型之间的权重差值。
将不同的任务向量进行线性算数运算后叠加在一个预训练模型上可以直接赋予该模型新的能力,比如多任务学习、机器遗忘、分布外泛化等,这种基于任务向量的直接运算对模型进行编辑做下游任务预测的方法称为任务运算。
该文章为任务加减法运算的有效性提供了一个特征学习的理论框架。

参考

When is Task Vector Provably Effective for Model Editing? A Generalization Analysis of Nonlinear Transformers


论文解读系列-任务向量做模型编辑为何有效?
https://summerchengh.github.io/tech-blog/2025/04/23/00-论文解读-大模型-任务向量做模型编辑为何有效/
Author
Your Name
Posted on
April 23, 2025
Licensed under