登录灵云开发者社区,开发者即可下载包括语音识别、语音合成、语音唤醒、语义理解、文字识别、人脸识别、手写识别、机器翻译、声纹识别、键盘输入在内的十多项人工智能技术SDK,支持Windows/Android/Linux/IOS等各种主流操作系统,能方便的集成到各种应用与客户业务系统中。除此之外,在社区内还有麦克风阵列、灵云种子等聚合性SDK以方便开发者快速实现近远场语音交互。
语音合成SDK
作为国内最早从事语音技术研究与应用的企业,捷通华声为广大开发者提供的灵云语音合成SDK可将文本实时准确地转换为自然、流畅的语音,并提供男声、女声、童声等多种合成音色,支持中文普通话、粤语、维语、英语、日语等21种语言,并可为用户提供定制化的语音合成服务。
语音合成SDK可以根据当前网络状况及指令的类型,自动判断使用本地引擎还是云端引擎进行语音合成。此次版本的升级优化了优化TTS Player,提升云端访问速度。
语音识别SDK
采用行业领先的深度学习算法,捷通华声为开发者提供行业领先的语音识别SDK,普通话识别准确率高达96%,并采用实时识别方式,实时率可达0.3以下,已支持普通话、英语、粤语、维吾尔语、客家话等多种语言,具备很强的口音普适性,并可自由定制垂直领域的语音识别模型,识别效果更精确。
此次版本更新,SDK增加了本地语音意图理解、云端本地双路识别功能,优化ASR Recorder,提升云端访问速度。
语音唤醒SDK
灵云语音唤醒SDK采用先进的芯片,ROM小于40K,低功率持续侦听,用户使用无感知,无需网络,实时离线唤醒,唤醒率大于95%,且误唤醒率低于小于 1次/24小时,并支持自定义设置多个唤醒词,满足用户个性化需求。
语义理解SDK
为开发者提供的语义理解SDK可实现意图理解与智能问答两类核心功能,支持上下文语义分析、多轮对话、实体属性等,支持天气、导航、航班、音乐、闲聊等20多个常见领域,且支持HTTP、Socket、WebService以及MRCP等多种接口,满足不同需求。
声纹识别SDK
灵云声纹识别技术采用端点检测和噪声消除技术,克服环境噪音对的影响,识别准确率高达99%,能够在多人对话场景中分离出单个说话人音频,并识别出每个人的说话内容,并提供声纹自由说、动态数字、开放文本、固定文本密码等多种识别模式。
人脸识别SDK
灵云人脸识别技术,采用最新深度学习算法,并引入国际领先的多模型融合技术,具备“一对一确认”与“多选一辨别”功能,可对人脸五官定位并对性别、表情、年龄、肤色、姿态等人脸属性进行分析,提供人脸属性识别、关键点定位、人脸1:1比对、人脸1:N识别、活体检测等能力。
光学字符识别SDK
捷通华声与清华大学合力攻关,应用最新机器学习算法,光学字符识别技术国际领先,识别率高达99.99%,让机器不再只能识别“清晰、端正的文字”,还能识别“倾斜、相对模糊的文字”,并且支持更多的字体。支持文档识别、票据识别、证照识别、银行卡识别、名片识别等多种应用领域。
手写识别SDK
灵云手写识别技术采用最新深度学习算法,正楷、连笔字、无笔顺识别率均在98%以上,且可支持中文、英文、维吾尔文、日文、韩文等多种语言、50多种笔势识别,还拥有倾斜校正、简繁体自动判断、拼音获取等强大功能,同时提供钢笔、铅笔、毛笔等多种笔形,将输写体验融入艺术与传统文化。
机器翻译SDK
灵云机器翻译技术采用国际先进的翻译技术及深度学习算法,可生成流畅的译文,翻译结果地道流畅,忠实表达原文内容,满足高质量的翻译要求,该版本SDK支持中英、中维等多种语言互译,具有翻译准确率高、翻译快速等优点。
键盘输入SDK
灵云开放平台为广大开发者提供键盘输入SDK,支持中文,外文,韩文,日文等识别,同时支持多种键盘(T9,Qwerty以及容错键盘)以及多种输入模式(拼音,五笔,笔画等)。
全方位AI技术 助力智能场景应用落地
十多年的行业积累,捷通华声灵云全方位人工智能技术已在各行各业得到广泛应用实践,灵云SDK在移动应用、智能客服、智能家电、智能音箱、智能车载、机器人等应用领域大显神通:可为移动应用提供智能语音、图像、手写、生物特征识别等智能技术集成手段,可利用语音识别SDK、语音合成SDK、麦克风阵列SDK等让电视、空调等实现自然远场语言交互,可通过SDK结合打造可语音、手写的智能车载输入法,让车载设备拥有远场语音识别能力,可真正实现让机器人“能说会听、能写会看、能辨音会认人、能思考会判断”。
未来,捷通华声将通过灵云全方位人工智能开放平台,为广大企业及个人开发者提供更多更加智能的人工智能能力SDK,助力企业智能化产品、设备的快速落地,从而实现“让每个企业都拥有人工智能,让每个人都能享受到人工智能的轻松与便捷”。
为您推荐
人去世之后,QQ和微博等帐号将如何处理,这是一个很多人都关注的问题,其中也存在许多商机。英国一款应用LivesOn可以在Twitter帐号所有者去...