语音识别

采用国际领先的流式端到端语音语言一体化建模算法,将语音快速准确识别为文字,支持手机应用语音交互、语音内容分析、机器人对话等多个场景

产品列表

1

语音识别

采用国际领先的流式端到端语音语言一体化建模算法,将语音快速准确识别为文字,支持手机应用语 ...
了解更多
1

呼叫中心

提供基于呼叫中心、智能客服等场景下的语音识别及语音在线合成的能力及解决方案。可用于语音 ...
了解更多
1

语音合成

基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方 ...
了解更多
1

智能硬件

通过麦克风阵列前端处理算法、远场阵列信号实时处理、高精度超低误报语音唤醒、离线语音识别等 ...
了解更多

应用场景

语音输入法

摆脱生僻字和拼音障碍,将所输入文字,直接用语音的方式输入,让输入法更加便捷
主要服务:  语音识别 长语音识别
合作案例:  百度输入法   魅族输入法

语音搜索

搜索内容直接以语音的方式输入,让搜索更加高效
主要服务:  语音识别 长语音识别
合作案例:  手机百度   爱奇艺

智能家居

通过远场语音识别技术,可以让用户,即使在三至五米的距离,也可对智能家居进行语音操作
主要服务:  远场语音识别   语音合成  语音唤醒
合作案例:  暂无

机器人语音交互

提供麦克阵列前端算法,解决人机交互中,距离较远带来的识别率较低的问题,让人机对话更加方便
主要服务:  远场语音识别   语音合成  语音唤醒
合作案例:  暂无

实时字幕

将直播、视频、现场演讲等音频进行实时的字幕转换,降低理解成本,提升用户体验
主要服务:  长语音识别
合作案例:  暂无

语音笔记

可将笔记、总结等,通过语音的方式转为文字,进行记录,大幅提升了用户的录入效率
主要服务:  长语音识别
合作案例:  暂无

特色优势

全线免费试用

公有云API最高可享10 QPS无限量免费调用,人脸离线采集SDK永久免费

稳定服务保障

提供企业级稳定、精确的大流量服务,拥有毫秒级识别响应能力、弹性灵活

算法世界领先

基于百度专业的深度学习算法和海量数据训练,人脸识别算法在最权威的公开评测比赛中排名世界领先

端云能力齐全

在线API、离线SDK、私有化部署多种服务形式全面开放,适配多种应用场景

常见问题

人脸识别和人脸认证,有什么区别?

人脸认证与人脸识别的差别在于:人脸识别需要指定一个待查找的人脸库中的组,而人脸认证需要指定具体的用户id即可,不需要指定具体的人脸库中的组。实际应用中,人脸认证需要用户或系统先输入id,这增加了验证安全度,但也增加了复杂度,具体使用哪个接口需要视您的业务场景判断。

什么是base64编码,如何提供?

图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后用Base64格式编码即可。注:图片的base64编码是不包含图片头的,(data:image/jpg;base64)

人脸库的设置限制?

各项限制如下所示:每个开发者账号可以创建100个appid,每个appid对应一个人脸库,且不同appid之间,人脸库互不相通;每个人脸库下,可以创建多个用户组,用户组(group)数量没有限制;每个用户组(group)下,可添加最多无限张人脸,无限个uid;每个用户(uid)所能注册的最大人脸数量没有限制。

人脸识别、认证我应该取多少分算是同一人?

推荐可判断为同一人的相似度分值为80,大概对应的误识率为万分之一,您也可以根据业务需求选择更合适的阈值。

相关推荐

人脸实名认证解决方案

提供活体检测、身份核验、人脸比对等多项组合能力,确保用户是「真人」且为「本人」
了解更多

人脸考勤解决方案

利用高精度的人脸识别、对比能力,搭建考勤系统,提升考勤效率,抵御作弊行为
了解更多

人脸闸机解决方案

软硬一体的人脸识别闸机解决方案,提升人员系统化管理的安全性与便捷性
了解更多

视频监控开发平台

预置丰富的AI技能模型,零算法门槛,快速搭建一套多路智能视频监控系统
了解更多

人脸抓拍机—寻相

百度自研人脸抓拍机,支持最多30人脸同时检测和跟踪,1100元/台起
了解更多

人脸识别私有化部署包

部署到本地服务器的纯软件人脸识别服务,支持百万级超大型人脸库,可实现毫秒级响应
了解更多