您的位置：首页 >新能源 >

Meta免费开源AI模型NLLB-200！可精准翻译超过200种语言

时间：2022-07-08 20:16:31 来源： OFweek人工智能网

近日，Meta公司宣布将免费开源旗下AI系统NLLB-200 ，该系统是全球第一个能翻译200种不同语言的单一AI模型，将为超过10亿人提供高品质翻译内容。

Meta公司称，将会把NLLB-200对外开源，同时向非营利机构提供20万美元的资助，以开发该技术应用于更多应用程式上。

德国慕尼黑大学计算机语言学家Alexander Fraser认为，该模型的主要贡献在于数据，包含了100种全新语言。

目前，市面上很多翻译工具并不支持冷门的语言，也就是少于百万人口使用的语言，而NLLB-200解决了这个问题。

【不遗漏任何语言】

全球有数十亿人，但一直以来却没有可以翻译上百种语言的高品质翻译工具，他们无法通过自己惯用的语言或母语浏览网络上的内容，或在网络社群上参与讨论，尤其是对于非洲、亚洲等地区有高达数亿人使用不同种类的语言。

为了突破网络上的语言障碍，并促进元宇宙发展，Meta的AI研究人员早年已成立NLLB专案，开发AI模型为全世界提供高品质的翻译功能。

据悉，NLLB是“No Language Left Behind（不遗漏任何语言）”的缩写，该AI系统可以高质量翻译世界上多达200种语言，除了主流语言外，其中还包含多达55种非洲系语言及其他少数语言。

在多项指标中，相较现有的其他翻译工具，NLLB-200的翻译品质平均高出44％。在部分非洲和印度语言中，提升幅度相较最新的翻译系统更提升了70％。

此外，Meta也与维基基金会合作，希望NLLB-200之后可以提供维基百科翻译的服务，改善维基百科的翻译系统。通过双方的合作，NLLB－200持续学习其他翻译器中无法翻译的语言，AI模型可以自己学习语言中的文字系统，得到更准确的翻译结果。

【多语言翻译系统】

过去几年，AI语言翻译系统的发展非常快。Meta公司曾经指出，目前绝大多数的AI翻译系统是属于“双语言模型”，只是单纯具备一对一的翻译能力，比如英语－中文、英语－日语等等，但Meta希望研发一套“多语言翻译系统”，突破一对一的语音翻译，直接让多种语言的用户可以在同一个聊天室内即时地用口语进行交流。

去年，Meta AI实验室公布了多语言模型，为AI翻译带来了巨大提升。11月，Meta的多语言模型拿下了WMT国际机器翻译大赛2021的冠军。

Meta的模型开发策略分为三部分：大规模的数据挖掘、模型扩展、有效运用运算资源。

1．大规模数据挖掘：为训练多语言模型，Meta研发团队采用两种方式：任意语言到英语，以及英语到任意语言。Meta应用平行数据挖掘技术来收集爬虫取得的网站翻译资料，降低手工翻译成本。

2．模型扩展：为了提高多语言模型设计的容量，模型规模从150亿个参数提高到520亿个，并在此基础上，利用公司最新的GPU内存节省解决方案——Fully Sharded Data－Parallel，将大规模训练的速度提升了5倍。

3．有效运用运算资源：为了节省模型的计算成本，Meta采用了一套新的运算方法，让模型在不同训练场景中，只使用模型的一部分，而非整体，以此更有效率运用硬件资源。

Meta的多语言模型最大特点是针对训练资源少，或小语种的语言翻译，该多语言模型在测试中超过了目前市面上最好的并且经过专门训练的双语模型。Meta认为，这套多语言模型为“通用语音翻译系统”打下了基础。

Meta的愿景是这套系统可以让全球大众广泛使用，但同时也将会成为Meta旗下的VR／AR等穿戴设备的杀手级应用。

可以想象的是，“通用语音翻译系统”一旦在元宇宙中实现，可以让全世界不同语种的用户，在元宇宙虚拟空间里沟通、开会、玩游戏，将会比在现实中更加方便，也将更进一步实现Meta对发展元宇宙的野心。

郑重声明：文章仅代表原作者观点，不代表本站立场；如有侵权、违规，可直接反馈本站，我们将会作修改或删除处理。

相关阅读

技术研发+先进产能驱动业绩高速增长，TCL中环总市值首破两千亿大关！

无晶圆厂供应商去年全球IC销售营收占比34.8%

法国拟全面国有化法国电力公司

水利部副部长陆桂华一行到国家电投座谈交流

分布式光伏0.10元/度！西安西咸新区出政策了！

异形孔切割，不同厚度切割，光至GT系列激光器如何实现？

猜你喜欢

中国电科院研发变电模型转换工具实现自动化系统模型向信息化系统模型的自动转换

2022-07-06

世界一流财务 | 全面预算管理帮助集团企业构建7大核心能力

2022-06-28

推荐一个物联网IoT系统集成平台，支持开源，低代码二次开发实现数据采集、组态大屏和3D数字孪生

2022-06-27

电促会组织召开电力行业数字化转型相关开源技术体系建设线上研讨会

2022-06-20

从科研创新到产业落地华为发布人工智能大模型全流程使能体系

2022-06-15

配网融合终端就地研判示范区在山东淄博建成

2022-06-15

开源，真有源头活水来吗？

2022-04-25

自然语言处理序列模型——HMM隐马尔可夫模型

2022-04-13

开源软件提供商Grafana Labs完成2.4亿美元融资，帮助客户实现数据可视化

2022-04-08

4种在生产中扰乱计算机视觉模型的方法

2022-04-06

国网新疆电力开发应用智能分类程序

2022-03-30

又一款15MW漂浮式海上风电基础上线在即！

2022-03-30

西北电网调控云新能源模型管理平台正式上线运行

2022-03-21

FORESEE参数模型提取设计仿真

2022-03-15

全国人大代表、安徽理工大学校长袁亮：提升煤炭安全智能精准开采水平

2022-03-11

最新快讯

Meta免费开源AI模型NLLB-200！可精准翻译超过200种语言
2022-07-08

我才不是搬砖人！KUKA AMR助你清凉一夏～
2022-07-08

2022上半年立达信、艾比森、中微在国际形势日益紧张之下因何实现增产增收?
2022-07-08

是风口？还是泡沫？西门子与英伟达共同打造工业元宇宙！
2022-07-08

黔西南自治州安龙县新能源园区项目土地征收成片开发方案获批
2022-07-08

贵州省“十四五”氢能产业发展规划获批
2022-07-08

国际能源网-氢能每日报，纵览氢能天下事【2022年7月8日】
2022-07-08

安倍遇刺身亡！日本氢能社会能否实现？
2022-07-08

开展兆瓦级绿氢示范！上海发布绿色低碳产业行动方案！
2022-07-08

国能包神铁路集团有限责任公司2022年系统内招聘公告
2022-07-08

越南茶荣东城一期80兆瓦海上风电项目开工建设
2022-07-08

涉嫌未经批准非法占用土地，国电电力胶南风力发电公司违规被罚
2022-07-08

维斯塔斯碳梁专利本月到期碳纤维风电应用空间加速开启
2022-07-08

中国船舶七〇八所研发设计两艘海上风电施工船交付、出坞
2022-07-08

国家能源集团安徽合肥公司首个光伏项目实现局部并网发电
2022-07-08

大全能源110亿定增结果出炉！兴证全球、财通基金、华夏基金等19家获配
2022-07-08

东方日升助力宁海加快布局千亿级“光伏+储能”产业链
2022-07-08

2025年光伏装机超35GW！江苏省发布“十四五”可再生能源发展规划
2022-07-08

广东清远加快建设中核水头乡村振兴200MW农光互补、华电清远英德英红仙桥农光互补等光伏项目
2022-07-08

技术研发+先进产能驱动业绩高速增长，TCL中环总市值首破两千亿大关！
2022-07-08

国家电投牵手阿里巴巴、京东打造三网融合新态势
2022-07-08

甘肃省内首次利用“一键顺控”技术启动变电站
2022-07-08

汕头市潮阳区生活垃圾焚烧发电厂掺烧一般工业固体废物技改项目环境影响报告书审查公示
2022-07-08

国网东海县供电公司“网上电网”与同期线损融会贯通助力提质增效再提升
2022-07-08

中国能建新疆院中标哈密-重庆±800千伏特高压直流输电线路工程
2022-07-08

国务院国企改革领导小组办公室召开以高质量党建引领国企改革三年行动弘扬企业家精神激励担当作为专题推进会
2022-07-08

行业观察 | 中小型抽水蓄能项目建设箭在弦上
2022-07-08

中电联：预计下半年用电量增速升至7%
2022-07-08

国家能源局：电网企业要主动、超前做好电网规划，加快输电通道、主网架和配电网建设
2022-07-08

中国新汽车超充大合联盟开启补能3.0时代
2022-07-08

基于维生素D3，如何开发具有前景的抗癌分子？
2022-07-08

显示器需求旺盛！红魔将于7.11发布Mini LED新品
2022-07-08

PG的wal receiver进程如何启动
2022-07-08

VulcanForms融资3.55亿美元，新开两大工厂实现2兆瓦激光生产制造
2022-07-08

无晶圆厂供应商去年全球IC销售营收占比34.8%
2022-07-08

海洋照明科普：灯光对远洋捕捞的影响有多大？
2022-07-08

美国和捷克科学家正在研究用高功率激光产生伽马射线
2022-07-08

安谋科技发布两款自研处理器：充分满足高能效、大算力IP市场需求
2022-07-08

法国拟全面国有化法国电力公司
2022-07-08

担心“断气” 德国呼吁加拿大交还“北溪-1”部件
2022-07-08

应对能源短缺德国重新转向煤电
2022-07-08

工信部：拟建立新能源汽车正积分收储、释放机制
2022-07-08

政策解读 | 《辽宁省“十四五”节能减排综合工作方案》
2022-07-08

甘肃省工业项目土地使用标准印发
2022-07-08

安徽省人民政府印发《安徽省“十四五”节能减排实施方案》
2022-07-08

辽宁省人民政府印发《辽宁省“十四五”节能减排综合工作方案》
2022-07-08

甘肃省风力发电项目建设用地标准印发
2022-07-08

甘肃省加油站、加气站、加油加气合建站建设用地标准印发
2022-07-08

百万千瓦级!全球最大水光互补电站开工建设
2022-07-08

硅料龙头大全能源百亿定增落地多家公募基金大手笔参与
2022-07-08

深度专题

开展兆瓦级绿氢示范！上海发布绿色低碳产业行动方案！

越南茶荣东城一期80兆瓦海上风电项目开工建设

东方日升助力宁海加快布局千亿级“光伏+储能”产业链

显示器需求旺盛！红魔将于7.11发布Mini LED新品

热门文章

技术研发+先进产能驱动业绩高速增长，TCL中环总市值首破两千亿大关！

新能源

2022-07-08

无晶圆厂供应商去年全球IC销售营收占比34.8%

新能源

2022-07-08

法国拟全面国有化法国电力公司

新能源

2022-07-08

水利部副部长陆桂华一行到国家电投座谈交流

新能源

2022-07-08

分布式光伏0.10元/度！西安西咸新区出政策了！

新能源

2022-07-08

首页

要闻

科技

环保

新能源

太阳能

宏观经济

Meta免费开源AI模型NLLB-200！可精准翻译超过200种语言

中国电科院研发变电模型转换工具实现自动化系统模型向信息化系统模型的自动转换

世界一流财务 | 全面预算管理帮助集团企业构建7大核心能力

推荐一个物联网IoT系统集成平台，支持开源，低代码二次开发实现数据采集、组态大屏和3D数字孪生

电促会组织召开电力行业数字化转型相关开源技术体系建设线上研讨会

从科研创新到产业落地华为发布人工智能大模型全流程使能体系

配网融合终端就地研判示范区在山东淄博建成

开源，真有源头活水来吗？

自然语言处理序列模型——HMM隐马尔可夫模型

开源软件提供商Grafana Labs完成2.4亿美元融资，帮助客户实现数据可视化

4种在生产中扰乱计算机视觉模型的方法

国网新疆电力开发应用智能分类程序

又一款15MW漂浮式海上风电基础上线在即！

西北电网调控云新能源模型管理平台正式上线运行

FORESEE参数模型提取设计仿真

全国人大代表、安徽理工大学校长袁亮：提升煤炭安全智能精准开采水平

技术研发+先进产能驱动业绩高速增长，TCL中环总市值首破两千亿大关！

无晶圆厂供应商去年全球IC销售营收占比34.8%

法国拟全面国有化法国电力公司

水利部副部长陆桂华一行到国家电投座谈交流

分布式光伏0.10元/度！西安西咸新区出政策了！

首页

要闻

科技

环保

新能源

太阳能

宏观经济

Meta免费开源AI模型NLLB-200！可精准翻译超过200种语言

中国电科院研发变电模型转换工具实现自动化系统模型向信息化系统模型的自动转换

世界一流财务 | 全面预算管理帮助集团企业构建7大核心能力

推荐一个物联网IoT系统集成平台，支持开源，低代码二次开发实现数据采集、组态大屏和3D数字孪生

电促会组织召开电力行业数字化转型相关开源技术体系建设线上研讨会

从科研创新到产业落地 华为发布人工智能大模型全流程使能体系

配网融合终端就地研判示范区在山东淄博建成

开源，真有源头活水来吗？

自然语言处理序列模型——HMM隐马尔可夫模型

开源软件提供商Grafana Labs完成2.4亿美元融资， 帮助客户实现数据可视化

4种在生产中扰乱计算机视觉模型的方法

国网新疆电力开发应用智能分类程序

又一款15MW漂浮式海上风电基础上线在即！

西北电网调控云新能源模型管理平台正式上线运行

FORESEE参数模型提取设计仿真

全国人大代表、安徽理工大学校长袁亮：提升煤炭安全智能精准开采水平

技术研发+先进产能驱动业绩高速增长，TCL中环总市值首破两千亿大关！

无晶圆厂供应商去年全球IC销售营收占比34.8%

法国拟全面国有化法国电力公司

水利部副部长陆桂华一行到国家电投座谈交流

分布式光伏0.10元/度！西安西咸新区出政策了！

从科研创新到产业落地华为发布人工智能大模型全流程使能体系

开源软件提供商Grafana Labs完成2.4亿美元融资，帮助客户实现数据可视化