数码控科技猎奇Iphone动漫星座游戏电竞lolcosplay王者荣耀攻略allcnewsBLOGNEWSBLOGASKBLOGBLOGZSK全部技术问答问答技术问答it问答代码软件新闻开发博客电脑/网络手机/数码笔记本电脑互联网操作系统软件硬件编程开发360产品资源分享电脑知识文档中心IT全部全部分类全部分类技术牛文全部分类教程最新网页制作cms教程平面设计媒体动画操作系统网站运营网络安全服务器教程数据库工具网络安全软件教学vbscript正则表达式javascript批处理更多»编程更新教程更新游戏更新allitnewsJava新闻网络医疗信息化安全创业站长电商科技访谈域名会议专栏创业动态融资创投创业学院 / 产品经理创业公司人物访谈营销开发数据库服务器系统虚拟化云计算嵌入式移动开发作业作业1常见软件all电脑网络手机数码生活游戏体育运动明星影音休闲爱好文化艺术社会民生教育科学医疗健康金融管理情感社交地区其他电脑互联网软件硬件编程开发360相关产品手机平板其他电子产品摄影器材360硬件通讯智能设备购物时尚生活常识美容塑身服装服饰出行旅游交通汽车购房置业家居装修美食烹饪单机电脑游戏网页游戏电视游戏桌游棋牌游戏手机游戏小游戏掌机游戏客户端游戏集体游戏其他游戏体育赛事篮球足球其他运动球类运动赛车健身运动运动用品影视娱乐人物音乐动漫摄影摄像收藏宠物幽默搞笑起名花鸟鱼虫茶艺彩票星座占卜书画美术舞蹈小说图书器乐声乐小品相声戏剧戏曲手工艺品历史话题时事政治就业职场军事国防节日风俗法律法规宗教礼仪礼节自然灾害360维权社会人物升学入学人文社科外语资格考试公务员留学出国家庭教育学习方法语文物理生物工程学农业数学化学健康知识心理健康孕育早教内科外科妇产科儿科皮肤科五官科男科整形中医药品传染科其他疾病医院两性肿瘤科创业投资企业管理财务税务银行股票金融理财基金债券保险贸易商务文书国民经济爱情婚姻家庭烦恼北京上海重庆天津黑龙江吉林辽宁河北内蒙古山西陕西宁夏甘肃青海新疆西藏四川贵州云南河南湖北湖南山东江苏浙江安徽江西福建广东广西海南香港澳门台湾海外地区

AI突破新边界 王小川在香港亮出全球首个虚拟主播

来源:CHINAZ  责任编辑:小易  

 2018 年 7 月 9 日,有着“科技界达沃斯”之称的Web Summit团队来到香港,开启了为期四天的RISE科技大会。包括微软总裁Brad Smith、亚马逊CTO Werner Vogels在内的上百位全球顶级科技企业高管和先锋创业者齐聚一堂,就人工智能、大数据、区块链等时下热门主题进行了思想和灵感的交流,带来了全球科技发展最新进展。

作为中国用户量第四大的互联网公司、AI领军企业,搜狗受邀参加了此次大会。搜狗CEO王小川在活动上进行了题为《人工智能的下一个应用突破》的演讲,分享了搜狗对“人工智能的意义”、“语言与AI的关系”等问题的思考,并通过全球首个虚拟主播等产品秀出了搜狗的“AI肌肉”。王小川表示,年内搜狗将再推出四款新智能硬件,进一步落地搜狗的AI能力。

(图1:搜狗CEO在RISE大会发表演讲)

自然交互+知识计算 搜狗的语言AI版图

在王小川看来,“语言”是AI的未来,“掌握一种语言就是掌握了一种灵魂”,而语言则是人工智能皇冠上的明珠。无论是百箱大战中Amazon Echo、Google Home等多款围绕着语音交互打造的智能音箱,还是会打电话的Google Duplex、会辩论的IBM Projector Debater,都聚焦于让机器拥有“语言”这颗明珠。

搜狗以“让表达与获取信息更简单”为使命,多年坚持以语言为核心,围绕于自然交互和知识计算两大方向,在语音、图像、翻译等语言类AI技术上不断突破。王小川认为,通过自然交互,人与机器能够更自由地表达;通过知识计算,让机器来帮助人类,实现智能的体外进化。

在自然交互版块,搜狗不断在语音识别和语音合成方面进行开拓创新。搜狗输入法是中国最大的语音输入法,目前语音识别准确率已超98%;日均语音输入调用次数峰值达 4 亿次;支持外文多语种和中文方言识别;智能断句、标点预测、识别结果顺滑等功能也领先于业界。语音合成支持多种音色选择,通过少量数据即可生成说话者自己的合成音色,还可实现说话人风格的迁移。

王小川现场展示了用“王小川讲话训练数据”,结合庞麦郎的《我的滑板鞋》歌曲素材,经机器进行语音识别、语音合成后,生成王小川版的《我的滑板鞋》。这版歌曲中既包含了歌曲的曲调和节奏,也融入了王小川的声线及语言风格,生动有趣地呈现了搜狗语音合成和情感迁移技术。

(图2:搜狗CEO王小川现场展示语音合成与情感迁移技术)

虚拟主播生动播报RISE新闻 搜狗语音技术的最新尝试

在此次活动上,王小川展示了搜狗推出的全球首个高度实用化、定制化的虚拟主播。结合唇语合成、语音合成、音视频联合建模与深度学习技术,可驱动机器生成对应的唇语图像与声音,进而输出统一的音视频素材。此次展示的虚拟主播,是搜狗使用央视新闻主播姚雪松数十个小时的音视频素材进行训练与计算的结果,最终生成了一段音视频同步的RISE大会新闻播报,与真人播报无异。

(图3:虚拟主播新闻播报画面)

AI技术为搜狗全线产品赋能 问答、对话、翻译是搜狗的产品方向

除了新产品外,搜狗已让AI技术为搜狗的全线产品赋能,无论是搜狗搜索,还是搜狗输入法,都做到了更懂用户,给出的选项和推荐也能直捣用户内心的需求。王小川认为,AI时代企业要做的不是多面开花,而是应该认准战略方向让技术有的放矢。

对于未来,王小川的判断是:搜索会升级为问答,输入法会演化成辅助对话系统。当输入关键词或问句后,搜索引擎将会直接给出你想了解的答案;用机器帮助人类完成更便捷、更高质量的对话。

(图4:RISE大会参会者)

此外,随着人们跨国交流需求的增加,翻译的需求将会激增。运用领先的神经网络机器翻译技术,加之以上亿级双语平行语料训练,搜狗目前已经支持 61 种语言的互译,凭借丰富的产品场景,翻译技术已经运用在了输入法和搜索产品中。结合用户出国和学习工作的使用场景,搜狗在今年连续推出了搜狗旅行翻译宝和搜狗录音翻译笔两款智能硬件,进一步推动了AI翻译技术的实用化。

提及搜狗AI的下一步,王小川说:“以语言为核心,一方面我们在年底之前还会再发布四款新的智能硬件;另一方面会把这种计算能力用到医疗、法律这些垂直的领域,使得机器在垂直领域会变得更加的聪明。”

关于AI整体技术发展和产业落地,王小川有着这样的判断:美国固有的优势在于顶尖的科研技术,而中国的优势在于用户规模和应用领域。目前全球已实现知识共享的联通,前沿的人工智能学术论文发布后,中国可以学习和借鉴前沿的学术成果,并把它转化为生产力。所以在人工智能领域,中国有机会跟美国在应用层面上齐头并进。同时,应用层面生态的进化,可以反过来推动整个系统的发展,最终实现良性循环。

“技术改变世界”正在成为现实,搜狗不仅持续在技术领域开拓创新,更驱动着技术的不断落地化、打造消费级产品,将“中国制造”转变为“中国智造”。相信在未来,搜狗可以持续“让表达和获取信息更简单”,让科技真正地惠及人们的生活。

本文由站长之家用户投稿,未经站长之家同意,严禁转载。如广大用户朋友,发现稿件存在不实报道,欢迎读者反馈、纠正、举报问题(反馈入口)。

免责声明:本文为用户投稿的文章,站长之家发布此文仅为传递信息,不代表站长之家赞同其观点,不对对内容真实性负责,仅供用户参考之用,不构成任何投资、使用建议。请读者自行核实真实性,以及可能存在的风险,任何后果均由读者自行承担。


  • 本文相关:
  • 站长必读,如何真正写好一篇原创文章
  • 互联网之路细嗅蔷薇 资深站长分享掘金之道
  • 企业站的站长的工作重心究竟有哪些
  • 浅析:行业门户网站的一些盈利模式
  • 3000IP的企业网站每天订单不到30个的苦恼
  • 网站想内外兼修?先学习提高网站可用性的6大原则
  • 浅谈网页设计中的简约之美
  • 网页改版实战:日本设计师如何彻底优化旅游网站?
  • 网页改版实战!日本设计师如何彻底优化招聘网站?
  • 2015年值得关注的21个网页设计趋势
  • 免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.zgxue.com All Rights Reserved