【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs! 通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。 通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。 为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。 在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。 实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。 此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。 Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。 他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。 核心目标是创建结构化、模块化的模型表示:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。 此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
《成色18k1.8.35mb菠萝》减少汽车购买和使用限制。优化小汽车常规增量指标摇号规则,加强“久摇不中”人群购车需求保障。继续放开外地居民、华侨和港澳台地区居民购买新能源汽车限制,放宽企业申请新能源小汽车增量指标条件。小组赛最后一轮对阵博卡青年,克里斯蒂安-格雷在下半场第52分钟破门,帮助奥克兰城扳平比分,这也是奥克兰城本届世俱杯的首粒进球。《成色18k1.8.35mb菠萝》女的高潮过后第二次需要多久恢复“(被淹的摩崖造像和石狮)有10多年完整露出过,每年露出两三个月,涨水后又会被淹。”邓永福还说,2020年以来,被淹的摩崖造像和石狮几乎每年都会露出,其中有三年完整露出。因为近几年受到外界关注,每年枯水季节,都会有游客前来游玩。《中国新闻周刊》:这次空难发生在起飞阶段,第一时间就出现了较多的视频和图像证据。基于现有信息,我们能得出哪些结论?
20250816 🔞 《成色18k1.8.35mb菠萝》但显而易见,这是自2022年俄罗斯对乌克兰进行“特别军事行动”以后,泽连斯基第一次穿西装示人。除了穿军装以外,有一次,他身穿印有英文“让俄罗斯再次变小”标语的汗衫,在直播镜头前露面。《下雨天老师和学生被困在》谈到即将举行的第二届中国—中亚峰会,巴拉耶娃说,这是一个广阔的对话平台,期待哈中领导人就文化和人文合作达成新共识,进一步促进两国人民之间的交流,为两国关系发展注入新动力。
📸 袁贵记者 张成林 摄
20250816 🌸 《成色18k1.8.35mb菠萝》小贝林厄姆这样谈道:“这场比赛非常艰难,我必须这么说。对手真的很强——他们的表现非常出色。在这种气候条件下,他们可以为自己感到骄傲。这种天气对我们来说是全新的,我们还需要适应。这确实是一场非常艰难的比赛,但这场胜利对我们来说至关重要。”www.51cao.gov.cn“埃及计划在2030年前将可持续能源占比提升至全国的45%,这与‘一带一路’倡议的理念高度契合。”埃及规划、经济发展和国际合作部部长拉尼娅·马沙特在“‘一带一路’将如何发展?”分论坛上表示,在交通、能源和港口建设等领域,中国的“一带一路”倡议切实拉动了埃及的经济发展。
📸 王彦军记者 郭文鼎 摄
🔞 报道指出,泽连斯基反对强制征召18岁人员入伍,尽管他的西方支持者希望这样做。“重要的不是人数,而是武器和技术、金钱和施加压力。制裁将针对俄罗斯用于资助战争的资金。”床上108种插杆方式