少用33％数据，模型性能不变，陈丹琦团队用元数据来做降本增效

机器之心 2025-01-08

AI语料

普林斯顿大学陈丹琦团队提出了一种新的预训练方法 MeCo，通过在预训练期间使用元数据（如URL）进行调节，并在最后10%的训练中实施冷却阶段。该方法可以显著提高语言模型的数据效率，减少33%的训练数据量，同时几乎不增加计算开销和复杂性。MeCo 在不同模型规模和数据源上均表现出一致的性能提升，并增强了模型的可控性和实用性。

舆情等级

重要

舆情评分

正面舆情

舆情解析

点击查看舆情源网页

重要提示和声明

本页面内容由AI提炼生成，无法确保完全真实准确，不代表123彩票app稳定版下载官方立场，不构成投资建议。如需详细阅读有关请点击此处