查瓦云AI产品生态

查瓦云在藏汉英语音识别、合成、翻译、理解等方面实现了技术突破,建设和收集了藏语智能语音处理、机器翻译、文字识别等系统所需要的大规模藏语语言资源,形成了覆盖智能语音、智能语义、智能视觉和大数据分析四个方面核心技术,构建了由资源层、技术层、平台层、应用层全覆盖的“查瓦云”人工智能产品生态体系,涵盖了算法、技术、产品、平台和应用的数智平台。

智能平台.jpg


查瓦云汉藏英尼等多文种翻译SDK

      查瓦云汉藏英尼等多文种翻译SDK(Software Development Kit)是面向移动智能设备的机器翻译引擎,支持汉藏英尼等10+语言智能互译,无网络环境下也能使用。采用模型压缩和CPU加速技术,针对广泛应用的各种智能设备,拥有20M-200M大小不同的离线模型,在特定领域与在线模型性能相当。支持SDK批量授权,一经购买可永久使用。

产品功能:

(1)覆盖语种多 :支持汉藏英尼等10+语言方向的智能互译, 支持语种定制。

(2)翻译速度快: 汉英互译达到英文六级水平,结果返回响应时间<800毫秒。

(3)多种芯片架构:支持X86、ARM、MIPS架构,具有良好的兼容性。

(4)支持永久授权:支持SDK批量授权,购买后可永久使用。

应用场景:

语言翻译机.jpg     语言翻译机.jpg    语言翻译机.jpg   

解决异国社交沟通障碍   实时会议语音翻译   即扫即翻外语纸质资料

语言翻译机.jpg     语言翻译机.jpg   语言翻译机.jpg

内嵌机器翻译辅助外语学习   便携式实时翻译工具    集成翻译功能的通讯设备

应用案例:按照不同客户的需求,我们可以定制以下具有民族特色的各种翻译应用产品。

(1)智能翻译机

       用户需求:实现藏、英、尼、日、韩、俄、法、德、意等十余种语言与汉文的双向翻译,满足异国旅游、跨国商务等场景应用。

      用户痛点:需要语种多、要求翻译速度够快、翻译语意清晰。

     实施方案:为用户量身打造一款翻译模型,且支持不同语种之间的互译,翻译质量在口语领域效果优异,可达到人工翻译的80%,并且翻译速度秒级响应,提高了产品体验。查瓦云翻译还为用户提供自定义术语词典功能,进一步保证能够升级优化翻译质量

    (2)翻译词典笔

     用户需求:实现汉英双向的实时翻译 ,主要用于中小学生日常学习、 查阅资料。

      用户痛点:离线状态下词、句、段的实时翻译。

      实施方案:    查瓦云翻译为用户基于K12教程,定制优化训练模型,提高了在此领域的翻译质量,并且查瓦云翻译为固定的情景例句提供了翻译记忆优化,极大程度保证了教学翻译的准确性。整体优化后的翻译效果较通用领域的模型提高20%。在多行扫描翻译的场景下,查瓦云翻译做了算法优化,翻译等待时间缩短60%。

   (3)智能翻译耳机

      用户需求:实现藏、英、尼、日、韩、俄、法、德等语言与汉文的双向翻译,满足跨国生活旅游学习等场景应用。

    用户痛点: 翻译速度快,翻译模式多样。

   实施方案:查瓦云翻译为用户定制训练了口语领域的多个语种方向的模型,翻译效果满足日常交流,翻译结果更地道。查瓦云翻译还支持多样翻译调用方式,减少信息传输的时间成本,保证了实时交流中的快速翻译,效率提高40%。

   (4)手持翻译棒

      用户需求:备需要方便携带,满足跨国交友、旅游社交等功能。

    用户痛点设备硬件性能相对较差,存储空间相对较小,芯片深度适配。

       实施方案:    查瓦云翻译适配用户采用的低性能芯片,从多个角度进行算法层面的优化,翻译性能较未优化之前的提升了一倍,满足用户的预期标准。查瓦云翻译采用最新量的化技术,在不降低翻译质量的基础上,压缩模型的占用空间,降低到之前的30%,速度也相应提升了40%。   

查瓦云慧言一体机

   查瓦云慧言一体机:针对日常办公、宣讲汇报、问询审讯、多人会议、对外交流等多种语音场景设计的一款高度集成化的轻便一体智能产品。查瓦云慧言软件以语音识别技术为核心,结合机器翻译、声纹识别等人工智能技术,提供汉语藏语等多语种语音互译(支持汉语普通话和四川话、卫藏、安多、康巴方言以及英语等语言),提供智能语音输入法、离线翻译、字幕上屏、会议内容记录、音视频转写、Office/WPS 语言模块等多种特色功能。整个软件安装在专用便携一体机硬件上,开机即用,使用灵活,操作简单,无需连接互联网。

一体机.jpg一体机.jpg一体机.jpg一体机.jpg

查瓦云慧言一体机用于政府、司法、金融、交通、电信、教育、医疗、军队等单位办公会议、大型发布会、课程培训、电视节目直播等对语音转写、翻译的实时性和准确率要求较高的场景。

查瓦云安全机器翻译系统 MT

   

       查瓦云完全自主研发的基于深度学习框架为核心的汉藏双向机器翻译引擎,适配主流国产软硬件平台,构建100% 国产机器翻译服务解决方案。

支持离线部署与高安全性的机器翻译需求,保证解决方案自主可控、安全可靠。

      与多种主流国产操作系统和国产芯片高效适配,支持在华为、海光、龙芯、飞腾、兆芯等主流国产服务器以及麒麟、统信UOS等国产操作系统环境中部署。

(1)支持doc,docx,xls,xlsx,ppt,pptx,txt,pdf,eml,json,xml 格式文件。   

(2)文本翻译:支持离线文本翻译,性能出色,翻译准确度可媲美人工翻译,满足用户办公场景下所有文本翻译需求。   

(3)文档翻译:支持多格式文档的批量翻译,译文保留原文格式,免去在整篇文档翻译时重新排版的困扰。   

(4)支持PDF 文件批量上传,自动转换为 Word 文档 ,完全保留原PDF 文件的排版格式。   

(5)快捷嵌入到 Office 和 WPS 软件,提供更快更准确的翻译服务,提供单语排版、双语对译的格式输出,满足不同用户对译文展示的需求。

(6)支持用户以单机、集群、私有云或混合云方式的部署,满足用户的所有部署要求。

         

国产MT1.jpg     国产MT2.jpg    MTTH.jpg

查瓦云藏汉英音视频辅助翻译系统

   

     查瓦云汉藏英音视频辅助翻译系统提供私有化部署模式的音视频翻译字幕加工等解决方案,利用语音识别、机器翻译来解决音视频的内容提取、翻译、字幕生成等需求,支持单个、批量化操作。

   1.   支持汉、藏、英等音视频文件的提取和翻译功能;

   2.   支持文本和音视频时间轴对齐,词句联动音视频对应定位功能;

   3.   支持对转写结果、翻译结果内容查找、编辑、批量替换的功能;

   4.   支持内容转写结果合并、拆分,对应时间戳联动更新功能;

   5.   支持双语字幕、编辑功能;

   6.   支持以docx、txt、xlsx格式导出转写结果、翻译结果功能;

   7.   支持提供翻译引擎所需的记忆库、术语库的选择;

   8.   支持以srt、ass格式导出字幕文件和硬字幕视频功能,具备对硬视频字幕字体大小、颜色的设置;10 支持音视频文件批量生成字幕功能;


   一体机.jpg一体机.jpg一体机.jpg

  查瓦云汉藏英视频辅助翻译系统完成语音转文字,视频字幕提取和校对编辑等功能,广泛应用于以下场景,进媒体融合高质量发展,实现AI+媒体。

    1. 媒体和新闻行业媒体和新闻工作者经常需要从视频采访和新闻报道中提取关键信息。音频转文字技术可以帮助他们快速生成文字稿件,提高新闻制作的效率和准确性‌。

    在线教育‌:在在线教育领域,许多课程都是以视频形式提供的。通过将视频中的音频内容转化为文字,学生可以快速获取课程内容,进行笔记和复习。文字内容还可以用于制作课程教材和讲义‌。

  1. ‌企业会议和讲座‌:企业的会议记录和讲座内容通常需要记录和存档。将会议和讲座的视频音频转化为文字,不仅方便记录,还能帮助员工快速回顾和查找信息,提高工作效率‌。

  2. ‌法律和医疗行业‌:在法律和医疗行业,音频记录(如庭审记录、医生的口述病历等)转化为文字,可以方便记录、存档和查找,确保信息的准确和完整‌。

  3. ‌‌视频编辑与创作‌:系统不仅支持视频字幕识别,还提供字幕编辑和调整功能。这些工具适合视频制作者和教育工作者,能够简化视频内容的文本化过程,提高创作效率‌。



查瓦云全智能能力平台 NCAI

  查瓦云全智能能力平台NCAINet-Cloud AI)为基础,挂接语音识别引擎、语音合成引擎、机器翻译引擎、图像识别引擎、人脸识别引擎、声纹识别引擎等,为平台提供实时汉藏(普通话、四川话等,卫藏、康巴和安多方言)语音识别、汉藏语音合成、汉藏机器翻译、汉藏英多文种图像字符识别、人脸识别、声纹识别等服务以及其它人工智能各项能力。通过提供MRCPHTTPWebsockethttp_trans等接口对接项目使用方等各渠道端业务系统,满足不同部门和渠道的应用需求。

   查瓦云全智能能力平台还自带管理平台,提供建设具有动态调整资源池分配、应用管理、监控管理、日志管理的系统管理服务。

SDK接入.jpg

通过以上接入流程,查瓦云为您提供以下接入服务


ASR.png      语音识别 ASR:汉语普通话识别准确率97%以上,藏语(卫藏、康巴和安多方言)识别正确率95%以上。识别速度快,支持实时识别、支持语法识别与自由说识别、领域模型可定制;

TTS.png语音合成 TTS:支持汉语普通话、藏语、英语等多种语言、提供风格多样的音色选择,合成效果清晰、自然、流畅、支持多种采样率、比特率、编码格式输出、支持用户定制化需求;


NLU.png语义理解 NLU:支持场景对话和知识问答、语义理解能力强,知识表述能力强、支持上下文语义分析与相关问题联想、支持多种领域意图解析;


OCR.png     光学字符识别 OCR:识别准确率99.99%、支持票据、证照、银行卡、文档等,支持汉藏英等多文种混合识别、支持行业定制模板;

HWR.png     手写识别 HWR:具有高识别准确率与高识别效率、支持汉文藏文等多种语言、支持藏文手写;

AFR.png   人脸识别 AFR:支持人脸检测、关键点定位、特征提取、人脸识别、支持“一对一确认”与“多选一辨别”、支持人脸属性检测、支持活体检测;

VPR.png   声纹识别 VPR:支持“一对一确认”与“多选一辨别”、使用先进的模式匹配识别模型,大幅降低等错误率、支持文本无关识别、文本相关识别、数字串识别;

FPR.png    指纹识别 FPR:识别准确率高、支持“一对一确认”与“多选一辨别”、 支持多种类型的指纹采集设备。

MT.png   机器翻译 MT:采用国际先进的翻译技术及深度学习算法,具有翻译准确率高、翻译快速等优点,支持汉英、汉藏、藏英等多种语言互译。

查瓦云汉藏英多文种光字符识别系统(OCR

   查瓦云汉藏英多文种光字符识别系统(OCR)是基于最新的深度学习算法,具有识别率高,识别速度快,稳定性强,对设备的要求低等特点,轻松实现图片PDF等文件的数字化处理,为用户提供图像识别和分析能力。

        OCR5.jpg            OCR4.jpg  

OCR6.jpgOCR8.jpg



查瓦云智能OCR图像识别系统支持文档识别,票据识别,银行卡识别名片识别,身份证识别,营业执照识别,房产证识别,驾驶证识别,行驶证识别等多文种应用领域。并支持汉文,藏文,英文等多文种字符识别。

查瓦云藏智译

随身翻译器1.png       随身翻译器2.png


         

       查瓦云•藏智译,是出国旅行和多语言沟通的理想选择。它支持汉语、藏语、英语、尼泊尔语等多种离线语种,并配备了先进的查瓦云汉藏英AI翻译技术,实现同声、拍照及小语种翻译的一键完成。简约大方的精美藏式外观设计,加上随身携带的便捷性,让它成为您不可或缺的翻译助手。

选择查瓦云•藏智译,轻松解决语言沟通难题。


查瓦云双屏同显翻译机

       


   SHP2.jpg   SHUP3.jpg

  SHUP3.jpg

查瓦云双屏同显翻译机是一款高效便捷的会议等辅助设备。它采用双屏设计,可同时显示原文和译文,方便与会者实时对照理解。其支持多语种互译,精准度高,能应对复杂场景。设备操作简单,连接稳定,具备高灵敏麦克风,确保清晰拾音。此外,它还具有便携性,适合多种会议环境,提升跨语言沟通效率,是现代商务会议不可或缺的智能工具。

查瓦云双屏同显翻译机是一款专为高效商务沟通设计的硬件设备。该设备采用创新的双屏架构,能够同步呈现源语言和目标语言文本,确保与会者能够实时、精准地理解会议内容。其内置先进的查瓦云汉藏英AI翻译引擎,支持汉藏英尼等多语种互译,翻译精准度达到专业水准,能够应对高规格、多语言的复杂会议场景。设备操作界面直观,连接稳定,并配备高灵敏度麦克风阵列,确保在各种会议环境中均能实现清晰拾音。此外,其便携式设计使其适用于会议室、桌面办公,政务窗口等多种场景,是提升跨国企业及国际组织会议效率的理想选择。


多场景应用场景    


SMT1.jpg      SMT2.jpg      SMT3.jpg


SMT4.jpg     SMT5.jpg       SMT6.jpg


查瓦云数据服务平台

大规模、高质量、多样化的数据集是大模型性能突破、落地应用的核心,对于人工智能技术的突破和应用起着关键作用。

查瓦云数据资源中心(Data Resource Center)建设和收集了藏语智能语音处理、机器翻译、文字识别等技术所需要的大规模藏语语言资源(含卫藏、安多和康巴方言语音)。

1、开发涵盖数据采集、数据清洗、数据标注、数据测试、数据发布等功能的藏语数据管理平台

(1) 设计并实现数据采集模块,支持多种数据源接入。

(2) 开发数据清洗与标注工具集,提升数据处理效率。

(3) 构建数据集发布与管理系统,方便用户查询与使用。

(4) 成本控制、权限管理等功能,确保数据安全与合规。

(5) 开放式API与接口设计,便于与其他系统集成。

2、多领域语料数据收集与整理

(1) 广泛收集涉藏地区政治、经济、教育、科技、文化、历史、法律、金融、医疗、农牧业、宗教等多方面的资料。

(2) 组建公司数据专业团队,明确各领域的资料收集范围与标准。

(3) 与相关机构、学者、社区和数据公司等建立合作关系,拓宽资料来源。

(4) 收集到的资料进行筛选、分类与初步整理。

3、结构化数据转换与标注

(1) 将收集到的非结构化或半结构化数据转换为结构化数据,并进行必要的标注工作。

(2) 开发或采用现有的自动化工具辅助数据清洗与转换。

(3) 组织专家团队进行人工审核与标注,确保数据质量。

(4) 搭建数据标注平台,支持汉文、藏文、图文对、音频、视频等模态训练语料。

截至目前有1200万句段以上藏文文本语料,其中标注语料达到2.15亿音节字;已标注1000万对句子的汉藏平行语料;卫藏、安多、康巴方言语音识别语料分别达到1000H,800H和600H。以及尼泊尔等双语文本平行句对500万等。

   查瓦云从汉藏英尼多语种数据采集、数据标注、平台私有化部署,到标注驻场服务,提供一站式服务。


接入.jpg




查瓦云各系统演示视频
卫藏方言识别效果
查瓦云安全机器翻译系统
安多方言识别效果演示
康巴方言识别显示效果
汉-藏机器翻译
卫藏方言合成系统
汉藏英多文种光字符识别OCR