2026FIFA世界杯中国官网 腾讯混元最新开源:440M翻译模子手机离线就能用,翻译质料超谷歌

腾讯混元团队 投稿
量子位 | 公众号 QbitAI
离线翻译这件事,正在从“能用”走向“好用”。
对放洋旅行、跨境办公和土产货阅读来说,翻译器具一朝依赖联网,就很容易在弱网、无网或阴私敏锐场景里掉链子。
但把翻译大模子信得过塞进手机,又会碰到内存和算力适度:模子太大、推理太慢,皆很难常驻土产货。
为搪塞这一挑战,腾讯混元团队刚刚开源了一份硬核惩处决议:
推出极致量化压缩版块翻译模子Hy-MT1.5-1.8B-1.25bit,把因循33种说话的翻译大模子压缩至440MB。
无需联网,下载后即可在手机土产货初始 。官方测试表露,其翻译质料优于谷歌翻译。

△高通骁龙865,8GB内存
基于混元翻译大模子Hy-MT1.5打造,翻译成果并列生意翻译模子
Hy-MT1.5是腾讯混元团队打造的专科翻译大模子,原生因循33种说话、5种方言/民汉及1056个翻译标的。从常见的中英互译,到法语、日语、阿拉伯语、俄语,以致藏语、蒙古语等少数民族说话,它皆能哄骗平定地处理。
值得遏制的是,1.8B版块的Hy-MT1.5就杀青了并列生意翻译API和235B级大模子的翻译成果。
在严格的评测基准中,其翻译质料不仅稀少了谷歌翻译、百度翻译等主流系统,更解释了在高效优化下,轻量级模子大要展现出亮眼的翻译能力。

但问题也很径直:原始的1.8B模子即使在FP16精度下,照旧占用3.3GB内存。关于手机上金子般的内存来说,这如故太大、太慢,是以需要量化压缩。
极致量化压缩,把模子装进手机
量化压缩,浅薄来说便是把模子里原来用16位数字(16-bit)暗示的参数,改用更低位数字储存。
这就像把一幅高清像片压缩成缩略图,文献小了许多,2026世界杯官网入口但你如故能看澄莹内部的内容。
针对不同的手机用户,腾讯相配推出了2-bit与1.25-bit两种极致的量化压缩决议。

2-bit模子:性能与质料的均衡(适用:中高端机型)
2-bit模子取舍了业内顶尖的拉伸弹性量化(SEQ),将模子参数目化至{-1.5,-0.5,0.5,1.5},并纠合量化感知蒸馏,在将模子体积压缩至574MB的同期,杀青了险些无损的翻译质料,成果稀少上百GB的大模子。在因循Arm SME2技巧的迁徙建造上,2-bit模子大要杀青更快速、更高效的推理。

△2-bit模子在SME2及Neon内核的速率对比演示
1.25-bit模子:Sherry极致压缩(适用:全系机型)
为了达成极致的轻量化,腾讯推出了基于Sherry(寥落高效三值量化)技巧的1.25-bit模子。该技巧决议已被NLP顶级学术会议ACL 2026请托。
Sherry压缩决议的中枢逻辑在于“细粒度寥落”政策:每4个模子参数,3个最紧迫的用1-bit储存,1个用0储存,平均每个参数仅需1.25-bit。

互助腾讯成心为手机CPU策画的STQ内核,该决议杀青了对SIMD教唆集的适配。最终,3.3GB的原始模子被进一步压缩至440MB,任意常驻后台,让内存弥留的平淡手机也能顺滑进行高质料离线翻译。
FP16(八倍速)vs. 1.25-bit速率对比演示:

△演示建造:高通骁龙888,8GB内存
本次开源不仅包含模子权重,腾讯混元团队还制作了一个本体可用的腾讯混元翻译Demo版,相配适配“后台取词款式”。不管是在土产货检察邮件如故浏览网页,混元翻译皆能随叫随到。无需网罗,无需订阅,十足土产货处理、不触及个东谈主信息聚积和上传,一次下载耐久使用。

统共模子权重、代码及技巧诠释均已全面开源(当今只因循安卓体验Demo,后续郑再版会添加对iOS等平台的因循)。
体验运动:
Hugging Face(国际用户):https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/main/Hy-MT-demo.apk
魔搭社区(国内用户):https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/master/Hy-MT-demo.apk
模子下载:
Huggingface(国际用户):
2-bit 模子权重:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-2bit
2-bit 模子gguf:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-2bit-GGUF
1.25-bit 模子权重:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit
魔搭社区(国内用户):
2-bit 模子权重:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-2bit
2-bit 模子gguf:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-2bit-GGUF
1.25-bit 模子权重:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit
1.25-bit 模子gguf:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF
技巧诠释:
Sherry论文地址:https://arxiv.org/abs/2601.07892
AngelSlim技巧诠释:https://arxiv.org/abs/2602.21233
Hy-MT1.5技巧诠释:https://arxiv.org/abs/2512.24092
代码仓库:
AngelSlim: https://github.com/tencent/AngelSlim
一键三连「点赞」「转发」「小心心」
宽待在褒贬区留住你的念念法!
— 完 —
咱们正在招聘又名眼疾手快、关怀AI的学术剪辑实习生 🎓
感好奇瞻仰的小伙伴宽待关怀 👉 了解细目

🌟 点亮星标 🌟
科技前沿推崇逐日见2026FIFA世界杯中国官网
金佰利app官网下载入口