开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
语音识别
短语音识别
识别率高,支持中文、英语、粤语、四川话等
短语音识别极速版
极速识别60秒内语音,简单易用
实时语音识别
将音频流实时识别为文字,并返回每句话的开始和结束时间
音频文件转写
将批量上传的音频文件识别为文字,12小时内返回识别结果
EasyDL语音自训练平台
零代码自助训练语音识别语言模型
语音合成
在线合成-臻品音库
高度拟人、流畅自然的语音合成服务
在线合成-精品音库
提供包含童声在内的五种精选发音人
在线合成-基础音库
提供标准男声女声、情感男声女声四种发音人
离线语音合成
在无网或弱网环境下,可在智能硬件设备终端进行语音播报
呼叫中心
音频文件转写
低成本进行大批量呼叫中心音频转写
呼叫中心语音解决方案
呼叫中心场景的端到端的语音技术解决方案
智能硬件
远场语音识别
远距离精准识别
百度鸿鹄语音芯片
超低功耗远场语音交互芯片
机器人平台ABC Robot
为行业客户提供搭载了ABC Robot平台的行业解决方案
语音翻译
语音翻译SDK
为开发者提供在线语音翻译能力
AI同传
提供高质量、低延迟的机器同传服务解决方案
场景方案
智能语音会议
以语音识别为核心功能的一站式产品解决方案
智能语音指令
智能一体化的语音指令系统
图像技术
图像识别
通用物体和场景识别
识别超过10万类常见物体和场景
品牌logo识别
识别2万类商品logo,支持定制logo图库
植物识别
识别2万多种通用植物和近8千种花卉
动物识别
识别近8千种动物
菜品识别
识别超过5万种菜品,支持定制菜品图库
地标识别
识别5万中外著名地标、景点
果蔬识别
识别近千种水果和蔬菜
红酒识别
识别数十万中外红酒名称及详细介绍
货币识别
识别国内外常见货币,支持正反面、纪念钞
图像主体检测
检测图片中的主体,支持单主体检测、多主体检测
翻拍识别
精准识别对屏幕进行翻拍的造假照片
快消商品检测
无需训练即可直接使用的商品检测API
车辆分析
车型识别
识别3千款常见车型,可返回车型百科信息
车辆检测
检测图像中所有车辆,识别车辆类型和位置
车流统计
基于车辆检测和追踪,统计进出车流量
车辆属性识别
识别小汽车11种外观属性,如是否有车顶架
车辆损伤识别
针对常见小汽车,识别外观部件受损情况
车辆分割
识别车辆的轮廓范围,与背景进行分离
图像审核
色情识别
智能识别图片和视频中的色情和性感内容
暴恐识别
血腥场景及恐怖组织头目,旗帜等违禁内容
政治敏感识别
识别政治人物与敏感政治事件场景
广告检测
检测图像中的文字、水印、二维码、条形码
恶心图像识别
准确识别恶心,令人不适类的图像
图像质量检测
检测图像色彩、构图及清晰度情况
图文审核
图像中的文字内容进行多维度审核
公众人物识别
支持国内外16万个公众人物人脸识别
图像特效
黑白图像上色
智能识别黑白图像内容并填充色彩,使黑白图像变得鲜活
图像风格转换
将图像转换成卡通画、铅笔画、哥特油画等9种艺术风格
人像动漫化
为用户量身定制千人千面的二次元动漫形象
天空分割
可智能分割出天空边界位置,输出天空和其余背景的灰度图和二值图
图像搜索
相同图片搜索
适用于图片精确查找、重复图片过滤
相似图片搜索
语义相似的图片集搜索,支持亿级图库
商品图片搜索
以图搜商品,拍照搜同款,相似商品推荐
绘本图片搜索
拍照搜儿童书本,精准检索自建库中对应绘本教材
图像增强
图像去雾
对浓雾天气下拍摄的图像进行去雾处理
图像对比度增强
调整过暗或者过亮图像的对比度
图像无损放大
将图像在长宽方向各放大两倍,保持质量无损
拉伸图像恢复
识别过度拉伸图像内容,并恢复成正常比例
图像修复
去掉图片中不需要的遮挡物;修复图片缺损内容
图像清晰度增强
智能去噪、强化图像纹理细节,输出更清晰的图片
图像色彩增强
智能调节图片的色彩饱和度、亮度、对比度
开发平台
内容审核平台
全方位、精准、可配置的内容审核服务
EasyDL定制化图像识别
零算法基础定制高精度图像应用AI模型
Easymonitor视频监控开发平台
助力开发者零算法门槛快速搭建一套多路智能视频监控系统
文字识别
通用场景文字识别
通用文字识别
多场景、多语种、高精度的整图文字检测和识别服务
网络图片文字识别
针对网络图片进行专项优化,支持识别艺术字体或背景复杂的文字内容
办公文档识别
可对办公类文档的版面进行分析
数字识别
对图片中的数字进行提取和识别,自动过滤非数字内容
手写文字识别
支持对图片中的手写中文、手写数字进行检测和识别
表格文字识别
对图片中的表格文字内容进行提取和识别
二维码识别
对图片中的二维码、条形码进行检测和识别
卡证文字识别
身份证识别
识别二代居民身份证正反面所有8个字段
银行卡识别
识别银行卡卡号、有效期、卡类型、发卡行
营业执照识别
识别各版式营业执照所有关键字段
名片识别
识别姓名、公司、职位、电话、地址等字段
护照识别
识别中国大陆护照个人资料页所有10个字段
户口本识别
识别姓名、身份证号、出生地、出生日期等字段
港澳通行证识别
识别卡号、中英文姓名、有效期限等字段
台湾通行证识别
识别卡号、中英文姓名、有效期限等字段
出生医学证明识别
识别新生儿姓名、性别、生日、父母姓名等字段
多卡证类别检测
对同一张图片中的多种卡证进行类别检测和定位
财务票据文字识别
混贴票据识别
切分并识别原始票据粘贴单上的多种票据
银行回单识别
识别收/付款人信息、金额、日期等关键信息
增值税发票识别
识别增值税普票或专票所有30个字段
增值税发票验真
支持全部9类增值税发票的信息核验
定额发票识别
识别各类定额发票的代码、号码、金额字段
通用机打发票识别
识别国家/地方税务局发行的机打发票信息
火车票识别
识别红、蓝火车票的8个关键字段
出租车票识别
识别全国各大城市出租车票的6个关键字段
飞机行程单识别
识别飞机行程单的姓名、日期、票价等字段
汽车票识别
识别发票代码、发票号码、到达站等字段
过路过桥费发票识别
识别发票代码、发票号码、入口、出口等字段
船票识别
识别发票代码、发票号码、发票日期等字段
网约车行程单
识别服务商、行程开始及结束时间、车型、总金额等14个关键字段
通用票据识别
针对票据场景专项算法优化,按行识别各类票据
银行汇票识别
识别出票金额、承兑人信息等21个关键字段
银行支票识别
识别收款/付款人信息、金额等7个关键字段
教育场景文字识别
试卷分析与识别
输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果
公式识别
支持对试卷中的数学公式及题目内容进行识别
汽车场景文字识别
行驶证识别
识别机动车行驶证主页及副页所有21个字段
驾驶证识别
识别机动车驾驶证正本所有9个字段
车牌识别
识别蓝牌、绿牌、单/双行黄牌等类型车牌
VIN码识别
识别车辆挡风玻璃处的车辆识别号码
机动车销售发票识别
识别发票号码、发动机号、VIN码、价格等字段
车辆合格证识别
识别合格证编号、车架号、排放标准等字段
二手车销售发票识别
识别发票代码、发票号码、开票日期等25个关键字段
车辆合格证识别
识别合格证编号、发证日期及制造企业名等23个关键字段
iOCR自定义模板文字识别
iOCR通用版
支持用户自助创建识别模板和分类器,实现图片自动分类并结构化输出识别结果
iOCR财会版
针对财会报销场景提出的专项解决方案
医疗票据文字识别
医疗发票识别
支持识别业务流水号、发票号、住院号等关键字段
医疗费用结算单识别
支持识别姓名、出/入院时间、发票总金额等 6 个关键字段
病案首页识别
支持识别病案号、姓名、性别、出生日期、身份证号等 15 个关键字段
保险单识别
支持识别投保人、被保人、受益人的各项信息及保费等字段
其他场景文字识别
仪器仪表盘读数识别
可识别表盘上的数字、英文、符号,支持液晶屏、字轮表等表型
门脸文字识别
识别图片中的门脸文字信息,自动过滤非门脸文字内容
印章识别
检测并识别合同文件或常用票据中的常见印章
拍照翻译
支持对图片中包含的文本内容OCR识别并翻译成目标语言
彩票识别
支持对大乐透、双色球彩票票面文字内容进行识别,并按行返回结果
智能结构化识别
可直接上传各类卡证、票据图片即获得结构化识别信息
人脸与人体识别
人脸识别云服务
人脸关键点
对图片中的人脸进行关键点定位,并返回常用人脸关键点坐标位置
人脸检测与属性分析
快速检测人脸并返回人脸框位置,输出人脸150个关键点坐标
人脸对比
评判两张人脸图片的相似程度
人脸搜索
将一张图片在指定人脸库中进行1:N搜索
活体检测
抵御人脸识别过程中的图片、模具等作弊攻击
合成图检测
甄别人脸图片是否造假
明镜实名认证解决方案
标准级
提供H5、APP身份验证能力
增强级
标准级基础上推出人脸身份验证全链路风控能力
金融级
活体防攻击+生物识别技术
虚拟形象
虚拟形象智能交互解决方案
基于终端实时渲染的虚拟人方案
虚拟形象视频播报解决方案
仅需文字输入,即可快速生成虚拟主播播报视频
人体与行为分析
人体关键点识别
精准定位人体21个核心关键点,适应大动作
人体检测与属性
检测图像中的所有人体,识别20余类属性
3D肢体关键点SDK
通过普通单目摄像头输入RGB图像,实时检测跟踪并精准估算人体三维姿态
人流量统计
统计图像中的人体个数和流动趋势
手部分析与跟踪
检测图片中的手部位置和手势类型
驾驶行为分析
有效识别驾驶员使用手机、抽烟等动作姿态
危险行为识别
针对短监控视频片段,识别常见危险行为
人脸离线识别SDK
Android版
兼容主流的Android设备,提供业务级二次开发接口和场景化示例工程
Windows版
全方位适配兼容Windows多系统平台,可在无网环境快速完成人脸识别
Linux版
兼容多款ARM结构的Linux设备,广泛应用于开发低成本、弱交互的人脸识别设备
海思版
针对Hi3516DV300芯片专项开发的SDK,具备算力高、速度快、成本低的特点
RV1109版
完美适配瑞芯微RV1109/RV1126芯片,实现万级人脸库毫秒级识别
服务器私有化部署方案
人脸私有化部署包
部署到「本地服务器」的「纯软件」人脸识别模型
人体私有化部署包
部署到「本地服务器」的「纯软件」人体识别模型
度目硬件
CM-Min智能面板机
全场景覆盖,轻松上手
CM-Lite智能面板机
精工打造,支持戴口罩识别,部署灵活
CM-Lite-T智能测温面板机
精准人体测温,口罩识别通行
人脸抓拍机 VOF/VOF-S
实现对人脸的检测、跟踪、抓拍、去重、计数,支持同屏抓拍30张人脸
人脸应用套件
仅需加装外壳,即可快速投产部署的人脸应用套件组合
AI镜头模组
算法应用小巧化,可广泛应用于门禁闸机等场景
视频分析盒子
快速对接网络摄像头智能化改造视频监控
人像特效
人脸融合
将两张人脸的外貌特征融合并生成新的人脸图片
人像分割
识别图像中的人体轮廓,与背景进行分离
美化特效
提供包含美颜滤镜、美妆试妆、美发染色、人脸贴纸等多项能力
皮肤分析
提供肤色、皮肤光滑度、眼袋等多维度的皮肤问题检测
人脸驱动
让视频中人物的表情驱动静态照片变得鲜活生动
AR与VR
增强现实
AR开放能力
构建虚实互联的基础设施,变革人机交互的创新体验
AR SDK基础版
AR SDK基础能力介绍及应用开发
虚拟形象生成驱动
一站式/低成本/个性化 虚拟形象生成与驱动解决方案
虚拟主播视频智能制作
生产虚拟主播播报视频,支持真人、动漫化的虚拟主播形象定制
虚拟主播直播解决方案
集主播定制、表情、动作捕捉、开播导演系统于一体
AR特效人脸小游戏
支持模板化生成多种趣味互动的AR人脸游戏
3D物品跟踪SDK
支持日常生活、工业环境下丰富纹理或弱纹理的3D物体跟踪
视觉定位与增强SDK
返回信息维度更多的六自由度位姿信息
AR导航导览SDK
帮助用户锁定目标的空间位置并精准叠加AR内容
虚拟现实
VR Suit开发者套件
百度VR开发者套件
Cloud VR
云端实时渲染,终端流畅体验
VR编辑管理系统
提供VR内容编辑创作功能
VR播控系统
提供VR设备管理、播放控制等功能
百度美拍3DAPP
高效便捷的VR内容采集APP
3D环物采集硬件
支持多类商品3D环绕展示效果
百度VR一体机
内置丰富的虚拟现实体验资源
自然语言处理
语言处理基础技术
词法分析
提供分词、词性标注、命名实体识别
词向量表示
帮助完成语义挖掘、相似度计算
词义相似度
通过词语向量化来计算两个词之间的相似度
依存句法分析
自动分析文本中的依存句法结构信息
DNN语言模型
判断一句话是否符合语言表达习惯
短文本相似度
计算两个短文本之间的语义相似度,实现推荐、排序等应用
语言处理应用技术
文本纠错
识别文本中的错别字,给出提示以及正确的建议文本内容
情感倾向分析
对包含主观信息的文本进行情感倾向性判断
评论观点抽取
分析评论关注点和观点,输出标签及观点极性
对话情绪识别
识别会话者所表现出的情绪类别及置信度
文章标签
输出能够反映文章关键信息的多维度标签
文章分类
输出文章的主题分类及对应的置信度
新闻摘要
抽取关键信息并生成指定长度的新闻摘要
地址识别
精准提取快递填单文本中的姓名、电话、地址信息
文本审核
色情识别
识别文本中的色情行为描述、色情资源链接等涉黄内容
暴恐违禁
识别暴力行为、恐怖描述等违禁文字内容
政治敏感
识别文本中的敏感事件、涉政人物等违禁内容
恶意推广
识别售卖意向的软文广告、个人联系方式等违规内容及变体
低俗辱骂
识别侮辱谩骂、人身攻击、消极宣泄等不良内容
低质灌水
识别常见乱码、水帖、刷屏等无意义的灌水信息
机器翻译
通用文本翻译
提供200+语种互译的在线文本翻译服务
垂直领域翻译
特定领域术语翻译更准确,句式更符合行业特点
翻译定制化训练
垂直领域个性化翻译需求解决方案
文档翻译
可实现Word/PPT/Excel/PDF等文档的全文翻译
语音翻译
支持4种源语音识别,12种语言翻译输出
图片翻译
支持直接识别图片中包含的文本内容并翻译为目标语言
英语口语评测
对发音的准确度、完整性、重音、流利度等进行全维度评分
AI同传
高质量、低延迟的机器同传服务解决方案
翻译私有化部署
提供涵盖文档翻译、图片翻译、翻译引擎优化等私有化服务
场景方案
智能招聘
提供简历解析、人岗匹配、人才评估等多项应用能力
合同智能处理
在合同处理场景提供交易签订、合同审查、合同归档管理等应用服务
媒体 策采编审
面向媒体业务(如策划、采编)流程推出场景方案
消费者评论分析
评论核心观点挖掘,好评差评自动分类
开发平台
内容审核平台
全方位高效解决敏感内容安全隐患
智能创作平台
覆盖媒体内容生产全流程,提供一站式服务
智能对话定制与服务平台UNIT
定制专业、可控、稳定的对话系统提供全方位技术与服务
知识图谱
知识理解
实体标注
结合百科知识库进行文本知识解析
汉语检索
汉语领域的知识检索服务
知识问答
提供多领域、细粒度的知识问答服务
作文检索
提供体裁类别与多样化标签标记、内容检索
事件图谱
咨询事件判别
判断资讯文本中是否包含事件描述并给出置信度
事件名抽取
自动抽取出事件名及对应的置信度
事件属性抽取
可抽取事件参与者、时间、地点、事件触发词等对应通用属性
事件相似度判别
自动判别两个事件是同一事件的概率
场景方案
智能庭审辅助
支持庭审要素的自动识别、归纳与推荐
行业知识图谱解决方案
提供知识图谱构建一站式解决方案
数据智能
大数据分析
数据仓库
PB级关系数据分析引擎,多维分析服务
搜索分析
全托管的Elasticsearch服务
舆情分析
舆情平台
专业、开放、易用的互联网舆情分析平台
舆情API
个性化定制輿情分析能力,准确把握时事脉搏
大数据风控
度御大数据风控
覆盖多个金融业务场景,标准API接口简单易用
大数据营销
百度慧眼
时空大数据服务专家
客情
提供人群的精细画像、线下位置分布等分析服务
场景方案
场景方案
企业服务
人脸实名认证
识别用户是否为“真人”且为“本人”
人脸闸机
多硬件环境适配的大规模端云人脸识别
人脸考勤
高精度的人脸识别、对比能力,搭建考勤系统
人脸口罩检测与识别
戴口罩状态检测及戴口罩人脸识别
消费者评论分析
评论观点抽取,好评/差评自动分类
智能招聘
简历解析、人岗匹配、人才评估、招聘机器人等
呼叫中心语音解决方案
呼叫中心场景端到端的语音技术解决方案
VR实训
将VR技术与各行业实训需求融合的一站式行业培训解决方案
智能零售
数字化访销解决方案
基于AI技术对访销过程进行精细化管理
自助结算台
通过摄像头自动识别结算区商品,快速结算
AR商品包装展示
通过领先AR技术,生动呈现品牌创意主张
VR商品包装展示
低成本3D展示高清商品画面
信息服务
行业知识图谱解决方案
提供知识图谱构建一站式解决方案
视频直播行业应用方案
一站式AR娱乐互动解决方案
虚拟主播视频智能生产
文字输入后快速生成虚拟主播播报视频
虚拟形象与生成驱动解决方案
一站式虚拟形象生成与驱动服务
虚拟主播直播解决方案
集形象定制、表情、动作捕捉驱动技术、开播导演系统于一体
智能医疗
医学文本结构化
将自然语言表达的医学文本转化为结构化数据
智能合理用药引擎
智能全面的药品审查维度,保障用药安全
智能分诊
分析患者表达的不适,智能定位科室及医生
智能工业
工厂安全生产监控
监测员工着装、生产作业、仪表指标等异常
工业智能质检
工业产品的外观瑕疵进行自动化识别
智能教育
AR教育行业解决方案
引领互动式AR体验教学,变革传统教育模式
VR K12教室
优质VR内容助推教学教育
VR高校实验室
为高校提供一站式复合型人才培养解决方案
智能农业
农作物生长预测
机器识别和预测农作物生长
农作物病虫害识别
多维数据病虫害预警模型
作物生长影响因素智能调解
基于农作物生长因素模型智能调解
无接触牲畜估重
不同牲畜模型库实现无接触估重
特殊牲畜活体识别
基于视觉、声音多维度识别活体
农业场景数字化能力
提供农业关键环节软硬一体化AloT产品
智能硬件
EdgeBoard嵌入式AI解决方案
面向嵌入式与边缘部署场景的FPGA AI加速方案
机器人平台ABC Robot
为行业客户提供搭载了ABC Robot平台的行业解决方案
百度VR一体机
内置丰富的虚拟现实体验资源
部署方案
部署方案
设备端部署
离线语音合成SDK
无网合成,14种音库包含英语、粤语
人脸离线采集SDK
离线的人脸检测、人脸追踪、人脸采集等能力
人脸离线识别SDK
离线的人脸采集、活体检测、人脸比对与识别能力
美颜滤镜SDK
美颜、滤镜、人脸塑形等人像处理能力
3D肢体关键点SDK
实时定位跟踪人体16个核心关键点,输出三维坐标信息
3D物体跟踪SDK
领先的3D模型注册能力,实时稳定的物体跟踪技术
文字识别离线SDK
离线识别各类文件、卡证、票据等文本信息
EasyEdge端计算模型生成
生成端模型及SDK,适配多种芯片与操作系统
服务端部署
人脸识别私有化部署包
部署到「本地服务器」的「纯软件」人脸识别模型
人体分析私有化部署包
部署到「本地服务器」的「纯软件」人体识别模型
文字识别私有化部署方案
在专有网络环境下部署应用,支持多类模型
AI产品私有化解决方案
本地服务器一键部署,安全易用
软硬一体部署
Edgeboard嵌入式AI计算卡
面向嵌入式打造的AI计算卡
EdgeBoard边缘AI计算盒
高性能、支持多模型私有化部署的微型AI服务器
EasyDL定制AI软硬一体方案
多种方案可选,让定制离线AI更轻松
PaddlePi终端运算模块
紧凑小巧、性能优越的AI核心运算处理单元
百度大脑认证硬件产品
认证的硬件产品与百度AI协同应用
度目人脸抓拍机
支持30人脸同时检测和跟踪
度目AI镜头模组
镜头算法一体化,体积小巧易部署
度目人脸应用套件
仅需加装外壳,即可快速投产
度目视频分析盒子
视频流人脸分析方案
开发平台
开发平台
开发平台
飞桨PaddlePaddle
百度自主研发的源于产业实践的开源深度学习平台
AI Studio
基于百度深度学习平台飞桨的一站式AI开发平台
EasyDL可视化模型训练与服务平台
一站式定制高精度AI模型
EasyData智能数据服务平台
提供数据采集、标注、清洗等一站式数据服务
全功能AI开发平台BML
面向企业和个人开发者的全功能AI开发平台
语音自训练平台
零代码自助训练语言模型,提升业务领域识别率
iOCR自定义模板文字识别
自助定制专属模板,实现海量单据卡证的结构化识别
对话定制与服务平台UNIT
智能对话系统定制平台,快速拥有对话交互能力
智能创作平台
提供自动创作和辅助创作的能力,提升内容创作效率
内容审核平台
通过界面化的操作,提升审核效率,降低人工成本
EasyEdge端计算模型生成平台
快捷生成端计算模型及封装SDK
EasyMonitor视频监控开发平台
零算法门槛快速搭建一套多路智能视频监控系统
文心ERNIE
基于语义理解技术,提供NLP定制与应用能力
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件