亲爱的读者朋友们,3月,百度智能云的AI技术又有上新和优化啦。在新增AI技术方面,我们在语音技术、人脸与人体识别、语言处理基础技术、文字识别等方面都有上新。在AI技术模型优化方面,我们提升了文字识别和图像审核的准确率和易用性,让企业以最简单、最便利的方式享受到AI。
让我们详细看一下吧。
新开放AI技术能力
我们按照技术分类来梳理。
语音技术:又快又准
这一次重点推出了语音识别极速版,速度更快,适用范围更广。
语音识别极速版,支持60秒内音频使用REST API方式进行调用,简单易用。采用国际领先的注意力(Attention)模型,实时率小于0.1,5s音频不到500ms即可完成识别过程,极大提升语音交互体验。近距离安静环境下,识别准确率可达98%,为手机、小程序、智能交互设备的语音搜索、语音输入提供更高效的识别能力。
语音识别极速版上线即带来“限时领取最高80W免费调用量”的福利活动,机不可失!
另外,呼叫中心实时语音新增REST API调用方式,大幅降低接入难度,可截取通话中有效音频进行识别,减少呼叫中心语音识别成本。
人脸识别:新增人脸融合
人脸融合可以将两张人脸进行融合处理,生成的人脸同时具备两张人脸的外貌特征,意味着你可以将两个心爱的偶像的脸放在一起生成“400年”才见的脸。此服务也支持对图片进行涉黄涉暴及政治人物过滤,让人脸识别服务业务更安全。
人体分析:免费调用额度升级,在线购买QPS每月200元起
人体关键点识别、人体检测与属性识别、人流量统计、人像分割、手势识别等5个接口免费调用额度升级。个人用户每日免费调用额度提升至50000次,并发量为2QPS;完成企业认证后,立享无限制调用,并发量提升至5QPS。如需更高并发量,可以在控制台自助购买QPS,可按月、按天两种模式灵活搭配购买。
智能写作平台重磅上线
众多粉丝期待的智能写作平台终于上线了,这是基于百度深耕多年的自然语言处理技术(NLP)和知识图谱技术(KG)打造的应用平台,可提供自动写作和辅助写作技术,内置丰富的数据和素材,配置简单、生成快速,零代码基础也可以轻松使用。可应用于:智能春联、智能写诗、结构化数据写作、热点事件脉络梳理、热点发现等场景中。
语言处理基础技术
► 情感倾向分析定制版重磅上线。使用情感倾向分析定制版功能,你可以上传适合自身应用场景的情感极性标注语料,在通用模型基础上进行优化训练,满足在专属场景下的更高准确率要求。
► 15个接口提供低价购买QPS服务。为了提供更稳定可靠的技术服务,满足有更高并发需求的用户,NLP在提供5QPS免费并发量基础上,向有更高并发要求的用户提供低价QPS购买服务。支持自助购买QPS的15个NLP技术接口为:文本审核、词法分析、词法分析(定制版)、情感倾向分析、短文本相似度、评论观点抽取、评论观点抽取(定制版)、依存句法分析、词向量表示、词义相似度、对话情绪识别、文本纠错、文章分类、文章标签、DNN语言模型。
文字识别OCR:两款新品正式发布
► VIN码识别。可对车辆车架上、挡风玻璃上的VIN码进行识别,识别准确率为90%,用户可通过文档自行调用测试,提供200次/天的免费使用次数。
► 护照识别。支持对中国大陆护照个人资料页所有10个字段进行结构化识别,识别准确率为90%,用户可通过文档自行调用测试,提供200次/天的免费使用次数。可应用于境外旅游产品预订、酒店入住登记等场景。
图像处理四款新品上线
本次四款新品注重在不同场景下的图像处理技术,重建高清图像。
► 图像去雾上线。对浓雾天气下拍摄,导致细节无法辨认的图像进行去雾处理,还原更清晰真实的图像,适用在安防监控、车载系统场景下,对受浓雾天气影响拍摄的视频、图像进行优化处理,重建更可辨析的监控材料。
► 图像对比度增强上线。调整过暗或者过亮图像的对比度,使图像更加鲜明。适用于海量图片优化、监控视频优化、彩印照片美化等场景。
► 图像无损放大上线。可将图像在长宽方向各放大两倍,保持图像质量无损。多用于安防监控、车载系统场景中视频或图像无损放大优化,重建更可辨析的监控材料,以及彩印照片美化等场景。
► 黑白图像上色邀测中。智能识别黑白图像内容并填充色彩,使黑白图像变得鲜活。可应用于主题活动小程序或网页等。
图像识别两款新品,适用于更多菜品
► 果蔬识别。可精确识别近千种水果和蔬菜的名称,适用于识别只含有一种果蔬的图片,可自定义返回识别结果数,可应用于零售结算和果蔬介绍等业务场景中。
► 自定义菜品识别。识别超过5万种菜品,支持创建属于自己的菜品图库,可准确识别图片中的菜品名称、位置,并获取百科信息,适用于多种客户识别菜品的业务场景中。
车辆分析:车辆属性识别邀测中
检测图像中的各类车辆,并针对小汽车识别11种外观属性,包括:是否有车窗雨眉、是否有车顶架、副驾驶是否有人等,可用于交通安防场景的特定车辆检测追踪。
AI技术模型优化
在技术模型方面,主要提升了相关技术的易用性和准确率。这样,企业应用AI技术的门槛更低,应用效果也将更好。
OCR增值税发票识别重磅升级
全新的模型和算法在响应时间和识别准确率上有了大幅提升,耗时骤降66%,从3秒缩短为1秒。准确率方面在单位、数量、税率三个字段有30%以上的提升,价税合计(小写)、规格型号、销售方地址电话、购买方地址电话等均有10%左右的提升。
OCR行驶证识别
新增对行驶证副页所有字段的识别能力,识别准确率高达99%,应用的范围和领域更多了。
图像审核
色情识别模型优化升级。此次主要针对欧/美/非的人物特征进行了专项优化升级,在欧/美/非的人物直播、社交场景下,色情违规图片识别的准确率提升20%,快速精准,解放审核人力。如果你的应用要走向海外,这次升级不容错过。
定制化平台与工具增加新功能
通过定制化平台与工具,可以零算法零门槛实现业务定制,满足不同类别的业务需求,本次升级如下:
► 升级EasyDL定制化训练及服务平台
新增高精度算法,离线识别更准确;对IOS、Android系统新增按产品线授权,方便多台终端设备同步激活服务;EasyDL图像识别现已支持生成Linux、Windows操作系统的离线SDK。
► 在理解与交互技术UNIT中,新增两个功能
一个功能是在UNIT的预置技能中,增加了成语解答。
另一个功能是对已有的预置技能进行干预的能力上线。用户可以根据自己的业务需求添加词槽的词典值,干预平台上已有的预置技能,提升预置技能的对话效果。首批开发的可干预的预置技能为:订机票、打电话、订咖啡、音乐、故事、闹钟、通讯录等,后续将为大家开放更多可干预的预置技能,敬请期待。
来体验百度AI体验中心小程序
最后,我们也同步更新了百度AI体验中心微信小程序,你可以在这个小程序中,体验百度AI的诸多能力。本次,我们新上线的能力有:地标识别、定额发票文字识别、机动车销售发票文字识别、机打发票文字识别等4项能力体验。
听说体验过的小伙伴们都忍不住分享到朋友圈!目前“百度AI体验中心”共有38项AI能力可体验。关注百度智能云微信公众号,即可体验