关注民生周刊

微信
微博
微博|微信

扫一扫,用微信浏览

|客户端
丝路聚焦人民日报全媒体平台
当前位置:首页 > 丝路民生 > 丝路聚焦

搜狗携旗下九大AI技术产品亮相2018重庆智博会

来源:中国新闻网2018-08-28 09:54:21 重庆 技术产品 搜狗 旗下

8月23日-8月25日,以“智能化:为经济赋能,为生活添彩”为主题的首届中国国际智能产业博览会在重庆举行,在这一国家级展会中,包括谷歌、微软、英特尔、腾讯、搜狗等500余家全球领先企业纷纷亮相,展示全球大数据智能化领域新产品、新技术、新业态和新模式。

在国内外前沿科技云集的智博会现场,搜狗首次全面展示多领域、九大AI科技成果,主打趣味又实用的AI黑科技,成为本届智博会最“吸睛”展台。

AI换脸术? 人脸迁移让人人都能七十二变

搜狗展台全场风头最盛的,当属搜狗“人脸迁移”体验区。观众只要选择自己喜欢的明星,镜头便会捕捉观众的人脸并与明星脸进行融合,生成专属观众的“明星脸”。从娱乐圈顶级男神彭于晏,到宅男女神林志玲,到当红小花迪丽热巴,再到今夏爆火《延禧攻略》强势女主“魏璎珞”(吴谨言),秒变多位明星的“换脸”体验吸睛无数,引得众多参展者体验拍照围观。当看到该技术除了“换脸”,还可以动态捕捉屏幕中的人脸,随人脸动作而随之变动后,体验者纷纷感叹“真是太厉害太神奇了”。

据了解,搜狗人脸迁移技术结合了人脸识别、三维人脸拟合、表情控制等多项前沿技术,能瞬间完成“换脸”体验,并可实现面部实时动态变化效果,跟随用户的脸部动作,完成多种表情、口型的变化。未来,该项技术还可以运用在直播、视频互动、影视制作以及教育等丰富场景中。

AI读唇术让科幻片场景成现实

除了人脸迁移技术,唇语识别技术体验区也是搜狗展台的一大热门。现场观众只需对着大屏幕默声说出一句话,如古诗“长风破浪会有时,直挂云帆济沧海”,无需发出声音,机器就能通过面部识别和唇型特征读出对应的发音,识别其说话内容,并生成文字呈现于大屏幕。这一互动,让在场观众亲身体验了一把“不发声,只动嘴,就知道你在说什么”的一大开挂技能。

唇语识别技术是一项集机器视觉与自然语言处理于一体的世界前沿技术。经过数千小时真实唇语数据训练,搜狗“唇语识别”系统在垂直场景命令集,如车载、家居等场景下已达到90%的识别准确率。可以预见,在残障教育和公共安全等不易捕捉语音、不易了解语义的情况下,唇语识别技术将大有作为。

“说”“唱”俱佳 AI语音合成再升级

随着如今语音技术的逐渐成熟,语音合成技术已较为常见,但这次的智博会上,搜狗却带来了高定版的个性化语音合成。搜狗语音合成技术通过少量数据即可生成该说话者的合成音色,现场观众可以体验到由几近真人的AI合成声音,如合成搜狗CEO王小川的声音来播报消息以及演唱歌曲。

值得一提的是,搜狗目前已实现语音风格迁移。现场选择王小川的音色后,再匹配歌曲《蓝精灵之歌》,通过风格迁移技术,最终能生成王小川版《蓝精灵之歌》。这版歌曲中既包含了歌曲的曲调和节奏,也融入了王小川的声线及语言风格,生动有趣地呈现了搜狗语音合成和风格迁移技术。

据了解,搜狗基于深度神经网络的新一代合成引擎,目前已支持中英文、男女等二十多个音色的合成,而搜狗个性化语音合成技术仅使用个人10分钟左右的语音数据,即可训练生成具有该说话人特色的音色,合成效果处行业领先水平。今年搜狗初次征战国际顶尖语音合成大赛——“Blizzard Challenge 2018 ”即斩获2项冠军,技术实力惊艳全球。

AI虚拟主播现场报道

除以上几项令人惊艳的AI黑科技外,全球首个高度定制化的搜狗虚拟主播技术这次也来到重庆,为观众进行现场报道。在虚拟主播体验区,屏幕上生成电视台主持人播报新闻的视频,播报效果与真人无异。

未来,该技术还将应用在线上教学、直播、视频互动、影视制作等丰富场景中,搜狗亦在不断探索与未来生活的连接点。

AI+医疗 让权威、真实有效的医疗信息触手可得

在搜狗明医智能分诊体验区,搜狗“分诊助手小汪”也收获了不少粉丝。参展者可以通过与小汪互动,了解自己可能患有的病症。比如,有体验者告诉小汪“肚子疼”时,它会询问具体的症状细节,并根据体验者的症状描述,给出相应的病症判断,并建议前往相关科室就诊,不少体验者纷纷感慨“小汪很厉害,这项功能很是实用”。作为搜狗独家首创的、将AI技术与医疗搜索创新结合的一项功能,搜狗明医智能分诊功能,通过模拟医生与患者对话的模式,针对性别、年龄、病症等问题与体验者展开多轮对话,为用户提供了症状初步诊断和医院分诊等贴心服务。

除了智能分诊服务外,搜狗明医一直秉承“让权威、真实有效的医疗信息触手可得”的理念,今年新整合了全球700余家权威健康网站的近千万优质内容,让海内外权威健康信息得以更快捷精准地传递给亿万用户,为用户了解病情提供更多便利。

两大AI翻译硬件亲测 网红出国必备神器

硬件方面,搜狗今年大热的两大AI翻译硬件——能支持42种语言互译的“搜狗旅行翻译宝”和33种语言对话翻译的“搜狗录音翻译笔”,也亮相本次智博会。在语音识别、图像识别、AI机器翻译、语音合成等多重人工智能技术的加持下,搜狗的AI翻译机已成为“便携翻译官”,吸引了现场诸多外国友人光顾展台,让外国友人通过翻译机就能完成对话,体会外文对中文的翻译效果。

糖猫儿童智能硬件则是搜狗另一明星产品,它可以实现视频通话、实时电话、精准定位、一键拍照等诸多实用功能,而这也吸引了众多家长的咨询与试用。

此外,搜狗语音识别体验区也不走寻常路,通过绕口令等好玩的挑战互动游戏,让参展者体验搜狗的语音识别技术,带动现场气氛High到停不下来。当前,搜狗语音识别准确率已高达98%,依托该技术,即使是夹杂着各地口音的绕口令这种高难度语音,搜狗智能语音识别技术都能准确将其转化为文字。同时,对于技术无法达到的最后2%的准确率,搜狗还业内首创语音修改功能,通过自然语言交互的形式修改所输入的文字,为用户提供了解放双手的智能输入体验。可以说,搜狗智能语音识别功能是非常贴心了。

自智博会开幕以来,S3馆中的搜狗展区始终人头攒动,惊叹声不断。从“秒变明星脸”,到“唇语识别”,再到“出国翻译神器”等,搜狗九大AI黑科技不仅全方位展现了搜狗语音、图像、问答、翻译等多领域AI成果,更让参展者切身体会到AI技术对外貌、交流方式、安全等生活各方各面带来的改变与便利。未来,搜狗还将持续发力人工智能,在提升技术水平的同时,逐步渗透行业上下游,“软硬结合”,持续推动中国智能产业发展,连接智能生活。

 

 

(责任编辑:高丹丹)

合作单位

友情链接

民生网新闻热线:010-65363346  010-65363014        投稿邮箱:msweekly@sina.com
违法和不良信息举报电话:010-65363027        举报邮箱:msweekly@sina.com
 京公网安备 11010502042254号    |    互联网新闻信息服务许可证:10120180029    |    京ICP备10053091号-5    |    中国互联网举报中心
《民生周刊》杂志社有限公司运营