本文第一作者是徐婷,是香港中文大学博士生,主要研究兴趣是大模型的后训练;通讯作者分别是黄志超和程善伯,来自字节跳动Seed团队。 现在,这些问题迎来了新的解决方案。来自香港中文大学、字节跳动 Seed 和斯坦福大学的研究团队联手提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT) 该方法将同传任务巧妙地建模为序贯决策过程,通过优化完整的决策序列,显著提升了翻译质量,同时有效控制了延迟,其性能直逼、甚至在某些方面超越了同等大小的离线翻译模型。 同声传译的核心在于机器需要动态地决定 “继续听”(READ)还是 “开始说”(WRITE)。这个决策直接影响最终的翻译效果。例如,当模型接收到英文单词 “bark” 时,它面临一个困境:如果立即翻译,可能会译为 “狗叫”,但若后文出现 “of the tree”,则正确翻译应为 “树皮”。 传统的同传方法,它每一步决策(是继续听,还是开始翻译)都是孤立的。它可能会因为眼前的 “小利”(比如翻译出一个词)而牺牲掉全局的 “大利”(整个句子的流畅度和准确性)。 针对这一难点,该论文提出了 SeqPO-SiMT 框架。其核心思想是将同声传译任务建模为一个序贯决策问题,综合评估整个翻译流程的翻译质量和延迟,并对整个决策序贯进行端到端的优化。 该方法的主要特点是:它不再孤立地评估每一步决策的好坏,而是将一整句话的翻译过程(即一个完整的决策序贯)视为一个整体,更符合人类对同传的评估过程。 为了验证方法的有效性,研究者们在多个公开的英汉互译测试集上进行了实验,并与多种现有的同传模型进行了对比。实验结果显示:在低延迟水平下,SeqPO-SiMT 框架生成的译文质量相较于基线模型有明显提升。 本文将 SeqPO-SiMT 的实时同传结果与多个高性能模型的离线翻译结果进行对比。结果显示,SeqPO-SiMT 的翻译质量不仅优于监督微调(SFT)的离线模型及 LLaMA-3-8B,其表现甚至能媲美乃至超越 Qwen-2.5-7B 的离线翻译水平。这表明该方法在 70 亿参数(7B)规模上实现了业界顶尖(SoTA)的性能。 总的来说,SeqPO-SiMT 这项工作的主要贡献在于,为解决同声传译中的质量 - 延迟权衡问题提供了一个新的视角。它强调了对决策 “序贯” 进行整体优化的重要性。该研究提出的方法,对于需要进行实时、连续决策的自然语言处理任务具有一定的参考意义,并为未来开发更高效、更智能的同声传译系统提供了有价值的探索。
少女初次做ae视频教当地时间13日,央视记者获悉,两名美国国务院官员表示,在以色列对伊朗核设施发动袭击之前,美国国务院已于12日成立了一个特别工作组,负责跟踪事态发展并协调美国从中东撤离所需的一切工作。IT之家 6 月 26 日消息,兰博基尼首席技术官鲁文・莫尔表示,合成燃料的应用将使品牌即便在全球大举迈向电动化的趋势下,仍可延续内燃机的制造传统。少女初次做ae视频教亚洲l码和欧洲m码的区别打造出有辨识度的穿搭,不一定要依靠那些颜色特别鲜艳的单品来完成,有的时候,适当的裸露出肩膀的位置,更能达到彰显出个性风范的效果,而且增加了对肩颈线条的拉长的作用。此前曾有报道称莫德里奇加盟米兰的体检被从本周推迟到了皇家马德里参加世俱杯之后,对此意大利名记马泰奥-莫雷托给出了解释。
20250811 🔞 少女初次做ae视频教“从敦煌到大足——石窟艺术中国化流变展”18日在重庆中国三峡博物馆开展。敦煌莫高窟与大足石刻是中国入选世界文化遗产的石窟艺术代表,一前一后、一北一南,勾勒出石窟艺术中国化的线索。y31成色好的s31正品美国企业研究所的防务分析师托德·哈里森(Todd Harrison)说,尽管马斯克后来收回了言论,但他威胁要减少NASA使用“龙飞船”的频率,可能会对SpaceX这家一直是政府最信任合作伙伴之一的公司造成损害。“这几乎就像是对空间站的禁运,马斯克说他要切断NASA在太空的实验室。”
📸 谢珍富记者 吕涛 摄
20250811 🔞 少女初次做ae视频教作为一家房地产投资信托基金(REIT),Ladder 的业务核心,就是为传统银行不敢碰的高风险项目提供融资。他们不依赖储户存款,而是通过资产证券化,将贷款迅速打包卖出,以此来换取流动性和收益。在特朗普 2017 年的财务披露中,Ladder Capital 持有与其至少四处地产的债权,包括第五大道上的特朗普大厦,债务总额超过 2.8 亿美元。宝宝下面湿透了还嘴硬的原因而李艺彤居然在镜头前“活人感”十足,她居然真的当镜头不存在,直接开始在家里洗衣服以及蹲地擦地板。这样的松弛感,是令人很欣赏和羡慕的。
📸 夏白杨记者 陈新 摄
🔞 央视介绍称,“张衡一号”02 星,是国家民用空间基础设施中长期发展规划中,首颗地球物理场探测业务卫星,主要用于对全球电磁场、电磁波、电离层、中性大气层等地球物理场范畴的相关参数开展准实时监测。“张衡一号”系列卫星的天基观测数据可以和地面监测系统形成互补,提升我国对地震等重大自然灾害的监测能力。《一次特殊的游泳课》