查瓦云汉藏英尼等多文种翻译SDK(Software Development Kit)是面向移动智能设备的机器翻译引擎,支持汉藏英尼等10+语言智能互译,无网络环境下也能使用。采用模型压缩和CPU加速技术,针对广泛应用的各种智能设备,拥有20M-200M大小不同的离线模型,在特定领域与在线模型性能相当。支持SDK批量授权,一经购买可永久使用。
产品功能:
(1)覆盖语种多 :支持汉藏英尼等10+语言方向的智能互译, 支持语种定制。
(2)翻译速度快: 汉英互译达到英文六级水平,结果返回响应时间<800毫秒。
(3)多种芯片架构:支持X86、ARM、MIPS架构,具有良好的兼容性。
(4)支持永久授权:支持SDK批量授权,购买后可永久使用。
应用场景:
解决异国社交沟通障碍 实时会议语音翻译 即扫即翻外语纸质资料
内嵌机器翻译辅助外语学习 便携式实时翻译工具 集成翻译功能的通讯设备
应用案例:按照不同客户的需求,我们可以定制以下具有民族特色的各种翻译应用产品。
(1)智能翻译机
用户需求:实现藏、英、尼、日、韩、俄、法、德、意等十余种语言与汉文的双向翻译,满足异国旅游、跨国商务等场景应用。
用户痛点:需要语种多、要求翻译速度够快、翻译语意清晰。
实施方案:为用户量身打造一款翻译模型,且支持不同语种之间的互译,翻译质量在口语领域效果优异,可达到人工翻译的80%,并且翻译速度秒级响应,提高了产品体验。查瓦云翻译还为用户提供自定义术语词典功能,进一步保证能够升级优化翻译质量。
(2)翻译词典笔
用户需求:实现汉英双向的实时翻译 ,主要用于中小学生日常学习、 查阅资料。
用户痛点:离线状态下词、句、段的实时翻译。
实施方案: 查瓦云翻译为用户基于K12教程,定制优化训练模型,提高了在此领域的翻译质量,并且查瓦云翻译为固定的情景例句提供了翻译记忆优化,极大程度保证了教学翻译的准确性。整体优化后的翻译效果较通用领域的模型提高20%。在多行扫描翻译的场景下,查瓦云翻译做了算法优化,翻译等待时间缩短60%。
(3)智能翻译耳机
用户需求:实现藏、英、尼、日、韩、俄、法、德等语言与汉文的双向翻译,满足跨国生活旅游学习等场景应用。
用户痛点: 翻译速度快,翻译模式多样。
实施方案:查瓦云翻译为用户定制训练了口语领域的多个语种方向的模型,翻译效果满足日常交流,翻译结果更地道。查瓦云翻译还支持多样翻译调用方式,减少信息传输的时间成本,保证了实时交流中的快速翻译,效率提高40%。
(4)手持翻译棒
用户需求:备需要方便携带,满足跨国交友、旅游社交等功能。
用户痛点:设备硬件性能相对较差,存储空间相对较小,芯片深度适配。
实施方案: 查瓦云翻译适配用户采用的低性能芯片,从多个角度进行算法层面的优化,翻译性能较未优化之前的提升了一倍,满足用户的预期标准。查瓦云翻译采用最新量的化技术,在不降低翻译质量的基础上,压缩模型的占用空间,降低到之前的30%,速度也相应提升了40%。
查瓦云慧言一体机:针对日常办公、宣讲汇报、问询审讯、多人会议、对外交流等多种语音场景设计的一款高度集成化的轻便一体智能产品。查瓦云慧言软件以语音识别技术为核心,结合机器翻译、声纹识别等人工智能技术,提供汉语藏语等多语种语音互译(支持汉语普通话和四川话、卫藏、安多、康巴方言以及英语等语言),提供智能语音输入法、离线翻译、字幕上屏、会议内容记录、音视频转写、Office/WPS 语言模块等多种特色功能。整个软件安装在专用便携一体机硬件上,开机即用,使用灵活,操作简单,无需连接互联网。
查瓦云慧言一体机用于政府、司法、金融、交通、电信、教育、医疗、军队等单位办公会议、大型发布会、课程培训、电视节目直播等对语音转写、翻译的实时性和准确率要求较高的场景。
查瓦云完全自主研发的基于深度学习框架为核心的汉藏双向机器翻译引擎,适配主流国产软硬件平台,构建100% 国产机器翻译服务解决方案。
支持离线部署与高安全性的机器翻译需求,保证解决方案自主可控、安全可靠。
与多种主流国产操作系统和国产芯片高效适配,支持在华为、海光、龙芯、飞腾、兆芯等主流国产服务器以及麒麟、统信UOS等国产操作系统环境中部署。
(1)支持doc,docx,xls,xlsx,ppt,pptx,txt,pdf,eml,json,xml 格式文件。
(2)文本翻译:支持离线文本翻译,性能出色,翻译准确度可媲美人工翻译,满足用户办公场景下所有文本翻译需求。
(3)文档翻译:支持多格式文档的批量翻译,译文保留原文格式,免去在整篇文档翻译时重新排版的困扰。
(4)支持PDF 文件批量上传,自动转换为 Word 文档 ,完全保留原PDF 文件的排版格式。
(5)快捷嵌入到 Office 和 WPS 软件,提供更快更准确的翻译服务,提供单语排版、双语对译的格式输出,满足不同用户对译文展示的需求。
(6)支持用户以单机、集群、私有云或混合云方式的部署,满足用户的所有部署要求。
查瓦云汉藏英音视频辅助翻译系统:提供私有化部署模式的音视频翻译、字幕加工等解决方案,利用语音识别、机器翻译来解决音视频的内容提取、翻译、字幕生成等需求,支持单个、批量化操作。
1. 支持汉、藏、英等音视频文件的提取和翻译功能;
2. 支持文本和音视频时间轴对齐,词句联动音视频对应定位功能;
3. 支持对转写结果、翻译结果内容查找、编辑、批量替换的功能;
4. 支持内容转写结果合并、拆分,对应时间戳联动更新功能;
5. 支持双语字幕、编辑功能;
6. 支持以docx、txt、xlsx格式导出转写结果、翻译结果功能;
7. 支持提供翻译引擎所需的记忆库、术语库的选择;
8. 支持以srt、ass格式导出字幕文件和硬字幕视频功能,具备对硬视频字幕字体大小、颜色的设置;10 支持音视频文件批量生成字幕功能;
查瓦云汉藏英视频辅助翻译系统完成语音转文字,视频字幕提取和校对编辑等功能,广泛应用于以下场景,将推进媒体融合高质量发展,实现AI+媒体。
媒体和新闻行业:媒体和新闻工作者经常需要从视频采访和新闻报道中提取关键信息。音频转文字技术可以帮助他们快速生成文字稿件,提高新闻制作的效率和准确性。
在线教育:在在线教育领域,许多课程都是以视频形式提供的。通过将视频中的音频内容转化为文字,学生可以快速获取课程内容,进行笔记和复习。文字内容还可以用于制作课程教材和讲义。
企业会议和讲座:企业的会议记录和讲座内容通常需要记录和存档。将会议和讲座的视频音频转化为文字,不仅方便记录,还能帮助员工快速回顾和查找信息,提高工作效率。
法律和医疗行业:在法律和医疗行业,音频记录(如庭审记录、医生的口述病历等)转化为文字,可以方便记录、存档和查找,确保信息的准确和完整。
视频编辑与创作:系统不仅支持视频字幕识别,还提供字幕编辑和调整功能。这些工具适合视频制作者和教育工作者,能够简化视频内容的文本化过程,提高创作效率。
查瓦云全智能能力平台NCAI(Net-Cloud AI)为基础,挂接语音识别引擎、语音合成引擎、机器翻译引擎、图像识别引擎、人脸识别引擎、声纹识别引擎等,为平台提供实时汉藏(普通话、四川话等,卫藏、康巴和安多方言)语音识别、汉藏语音合成、汉藏机器翻译、汉藏英多文种图像字符识别、人脸识别、声纹识别等服务以及其它人工智能各项能力。通过提供MRCP、HTTP、Websocket、http_trans等接口对接项目使用方等各渠道端业务系统,满足不同部门和渠道的应用需求。
查瓦云全智能能力平台还自带管理平台,提供建设具有动态调整资源池分配、应用管理、监控管理、日志管理的系统管理服务。
语音识别 ASR:汉语普通话识别准确率97%以上,藏语(卫藏、康巴和安多方言)识别正确率95%以上。识别速度快,支持实时识别、支持语法识别与自由说识别、领域模型可定制;
语音合成 TTS:支持汉语普通话、藏语、英语等多种语言、提供风格多样的音色选择,合成效果清晰、自然、流畅、支持多种采样率、比特率、编码格式输出、支持用户定制化需求;
语义理解 NLU:支持场景对话和知识问答、语义理解能力强,知识表述能力强、支持上下文语义分析与相关问题联想、支持多种领域意图解析;
光学字符识别 OCR:识别准确率99.99%、支持票据、证照、银行卡、文档等,支持汉藏英等多文种混合识别、支持行业定制模板;
手写识别 HWR:具有高识别准确率与高识别效率、支持汉文藏文等多种语言、支持藏文手写;
人脸识别 AFR:支持人脸检测、关键点定位、特征提取、人脸识别、支持“一对一确认”与“多选一辨别”、支持人脸属性检测、支持活体检测;
声纹识别 VPR:支持“一对一确认”与“多选一辨别”、使用先进的模式匹配识别模型,大幅降低等错误率、支持文本无关识别、文本相关识别、数字串识别;
指纹识别 FPR:识别准确率高、支持“一对一确认”与“多选一辨别”、 支持多种类型的指纹采集设备。
机器翻译 MT:采用国际先进的翻译技术及深度学习算法,具有翻译准确率高、翻译快速等优点,支持汉英、汉藏、藏英等多种语言互译。
查瓦云双屏同显翻译机是一款高效便捷的会议等辅助设备。它采用双屏设计,可同时显示原文和译文,方便与会者实时对照理解。其支持多语种互译,精准度高,能应对复杂场景。设备操作简单,连接稳定,具备高灵敏麦克风,确保清晰拾音。此外,它还具有便携性,适合多种会议环境,提升跨语言沟通效率,是现代商务会议不可或缺的智能工具。
查瓦云双屏同显翻译机是一款专为高效商务沟通设计的硬件设备。该设备采用创新的双屏架构,能够同步呈现源语言和目标语言文本,确保与会者能够实时、精准地理解会议内容。其内置先进的查瓦云汉藏英AI翻译引擎,支持汉藏英尼等多语种互译,翻译精准度达到专业水准,能够应对高规格、多语言的复杂会议场景。设备操作界面直观,连接稳定,并配备高灵敏度麦克风阵列,确保在各种会议环境中均能实现清晰拾音。此外,其便携式设计使其适用于会议室、桌面办公,政务窗口等多种场景,是提升跨国企业及国际组织会议效率的理想选择。
多场景应用场景
大规模、高质量、多样化的数据集是大模型性能突破、落地应用的核心,对于人工智能技术的突破和应用起着关键作用。
查瓦云数据资源中心(Data Resource Center)建设和收集了藏语智能语音处理、机器翻译、文字识别等技术所需要的大规模藏语语言资源(含卫藏、安多和康巴方言语音)。
1、开发涵盖数据采集、数据清洗、数据标注、数据测试、数据发布等功能的藏语数据管理平台
(1) 设计并实现数据采集模块,支持多种数据源接入。
(2) 开发数据清洗与标注工具集,提升数据处理效率。
(3) 构建数据集发布与管理系统,方便用户查询与使用。
(4) 成本控制、权限管理等功能,确保数据安全与合规。
(5) 开放式API与接口设计,便于与其他系统集成。
2、多领域语料数据收集与整理
(1) 广泛收集涉藏地区政治、经济、教育、科技、文化、历史、法律、金融、医疗、农牧业、宗教等多方面的资料。
(2) 组建公司数据专业团队,明确各领域的资料收集范围与标准。
(3) 与相关机构、学者、社区和数据公司等建立合作关系,拓宽资料来源。
(4) 收集到的资料进行筛选、分类与初步整理。
3、结构化数据转换与标注
(1) 将收集到的非结构化或半结构化数据转换为结构化数据,并进行必要的标注工作。
(2) 开发或采用现有的自动化工具辅助数据清洗与转换。
(3) 组织专家团队进行人工审核与标注,确保数据质量。
(4) 搭建数据标注平台,支持汉文、藏文、图文对、音频、视频等模态训练语料。
截至目前有1200万句段以上藏文文本语料,其中标注语料达到2.15亿音节字;已标注1000万对句子的汉藏平行语料;卫藏、安多、康巴方言语音识别语料分别达到1000H,800H和600H。以及尼泊尔等双语文本平行句对500万等。
查瓦云从汉藏英尼多语种数据采集、数据标注、平台私有化部署,到标注驻场服务,提供一站式服务。