智能语音产业规模将破百亿 普及面临技术壁垒
近日,由工业和信息化部电子科学技术情报所洪京一所长代表联盟秘书处单位发布的《2013中国智能语音产业发展白皮书》指出,智能语音已经进入快速应用阶段,预计到2017年,产业规模将达到101.4亿元。而语音作为人类沟通和获取信息最自然最便捷的方式,势必会成为人机交互的未来趋势。
智能语音开启移动互联网发展新时代
随着移动互联网时代的来临,智能语音作为信息交互的重要入口之一,成为各大手机制造商、运营商和互联网企业等巨头争相抢占的制高点。在过去的三年中,全球智能语音市场不断扩大。日前,微软也亮出其智能语音技术的最新成果:“实时语音翻译系统”和“基于Kinect的手语翻译系统”。此前,在“百度世界2013”大会上,百度宣布向开发者免费开放整个语音识别平台。
事实上,智能语音产业主要指通过语音合成技术和语音识别技术,为用户提供各种服务的产业。一般来说,用户只需要用说话的方式给服务终端发布命令,就能得到相应的服务。智能语音交互首先改变的是移动互联网。以iPhone中内置的Siri为例,用户以自然语言的方式对智能手机下达指令,而手机根据用户语音和用户当前的环境及上下文对用户意图进行理解,并按照用户意图执行命令的过程。
尽管目前智能语音产业规模相对较小,但业内人士普遍认为,语音技术在两三年内,会彻底改变当前的人机交互方式。移动互联网、云计算、大数据技术的飞速发展,智能语音已由技术研发进入快速应用阶段,产业规模大幅提升。根据工业和信息化部电子科学技术情报研究所数据,2012年全球智能语音产业规模整体达到24.4亿美元,同比增长24.0%。其中,中国智能语音产业规模近8.6亿元,同比增长38.2%,带动移动互联网、智能家电、教育等相关产业规模增长100亿元。
智能语音应用渐成信息消费热点
目前,在全球电子设备制造业中,微型电声元器件的应用较为广泛,随着下游手机、笔记本电脑、平板电视、数码相机等个人消费类电子产品的持续发展,其市场需求将不断快速增长。百度多媒体负责人余凯曾表示“如今的语音搜索不同于传统搜索模式,不是基于无关联的几个关键词来反馈结果,而是能够理解用户指令,完成一项完整的任务。”基于此,语音必将成为日后移动互联网的入口之一。
智能语音技术发展至今,市场上也涌现出越来越多的语音识别软件,如语音类搜索应用Dragon Search、语音类听写功能整合软件讯飞口讯、语音类音乐软件Shazam、口语在线学习平台思必驰AIChinese,以及语音控制软件Siri等。在国外语音市场主要以语音识别为主,具有代表性的产品有Nuance的Dragon Dictation,苹果新推出的Siri;而在国内,语音市场主要以语音合成为主,其中科大讯飞及捷通华声基本占领了语音合成市场。
市场规模的大幅提升为行业企业提供了巨大的市场空间。微信的微语音插件、搜狗语音助手、易信等,都采用了语音识别应用。另外,电视和机顶盒也是采用智能语音交互比较积极的行业。传统的电视机和机顶盒的遥控操作都比较复杂,而采用智能语音交互技术,只需对着遥控器说话,就可以控制电视,输入文字、打开应用、播放视频都可轻松实现。汽车、玩具、穿戴设备也都对智能交互技术能提供的全新交互方式抱有很大的期待。语音技术作为一个已经渐渐成熟的基础技术,用户认知度和市场规模也正在逐渐扩大。
智能语音产业如何破解技术壁垒?
虽然人工智能技术是从计算机出现以来就开始研究,但智能语音离实际应用还有相当的距离,路还很长。据易观智库发布的数据显示,语音助手类应用累积下载量排行中,冲动语音助手以29.8%占比第一,其次是智能360占25.2%,而科大讯飞旗下的讯飞语点由于灵犀的分流,排名第三,占到20.1%。据虫洞语音助手创始团队成员王向一透露,目前虫洞语音助手总用户为1600万。按比例计算,国内所有语音助手总每月下载量仅为4442万,用户量总和仅5000万。
此外,一份国外最新的调查显示,截至目前,约有85%的iOS 7用户从未使用过Siri,在使用Siri的用户中,有46%的用户感到失望,认为Ssiri发挥的实际作用不大。这些数据都可以看出,智能语音技术离实际应用还很远。当前,智能语音类应用在语音识别,语义解析,内容问答等方面存在较大的技术壁垒。在全球范围内,将此技术与商业化完美结合的厂商也是寥寥无几。人机交互式的语音技术仅是在诸如输入法等产品中充当配角,真正的语音产品形态尚未出现。
目前还没有一个较为成功的前端语音产品可以主宰市场,功能上的同质化、用户体验的不流畅、语音识别的准确率不高等等问题严重影响其发展。如何突破技术壁垒实行商业化运作将是智能语音规模普及的关键。因此,在未来发展过程中,厂商仍应加强语音操控功能的技术完善。另外,还应着眼于提升用户的综合使用体验,而不仅仅是技术层面的应用,切忌陷入单纯的技术比拼怪圈。