智能工作助理时代已来!

云投研究
云投汇 2018-05-24

随着智能手机和移动互联网的普及,以及大数据、云计算、人工智能的运用,互联网迎来了加速裂变的革新,人们的工作生活因此发生了颠覆性的变化,通过在线沟通的方式来获取各种服务成为常态。如让秘书安排出差的机票和酒店、让司机接送等,这些原本发生在线下的交互场景,逐渐向线上转移,为高端人繁忙之余减轻冗繁的工作量,提高效率,这也让一线投资机构真格基金看到了智能工作的发展前景,联合云投汇平台共同为Remi创业公司注入快速发展的资本支持。这种针对行业、针对具体场景的智能助理产品或将更有用户和商业价值,出现独角兽企业。

根据相关数据统计,仅在中国,智能手机(含平板电脑)拥有的用户就超十余亿,而每部智能手机平均携带多达16种传感器,每天产生1G左右的数据,数据以前所未有的速度在产生和发展。基于大量能够被沉淀下来的数据,就可以通过机器学习等方法来辅助人提升效率,甚至在某些场景下替代人,从而实现智能助理。智能助理可以定义为:基于人工智能技术,通过理解语音或文本形式的自然语言来满足用户需求的软件应用或平台。

01

一、智能助理相关技术及发展历史

人工智能的一项基本挑战就是赋予机器使用自然语言与人交流的能力。从架构来看,智能助理属于对话系统中的一个形态。相关支撑技术主要可划分为基础语音技术、智能化技术以及大数据技术。

 图:对话管理的典型架构

语音识别的目标在于使机器最终可以识别语音中的内容、说话人、语种等信息。自1952年AT&T贝尔实验室开发的Audrey语音识别系统成功识别10个英文数字起,语音识别在技术路径上经历了基于标准模板匹配和基于统计模型匹配。随着2010年在语音识别领域引入深度学习并在此基础上派生的各类模型的组合,2017年语音识别错误率降低到5.5%,机器已经极为接近人类水平。

图:2011-2017年语音识别错误率

语音合成已有百余年历史,在计算机技术出现之前主要模仿人体发声原理制作相应硬件,计算机技术出现后音质、音色和自然度都有提升。随着技术演进,语音合成的复杂度、自然度和音质都已取得不错的成绩,但表现力尚有待继续提升,如语气和情感等。

图:语音合成技术发展历史

对话管理,主要建立在语音识别、合成以及自然语言理解等技术基础之上。整体对话系统一般分为任务型和非任务型,任务型是协助用户完成具体的某项事情,如:设置闹钟、查天气等;而任务型是实现人机的情感聊天互动,如聊天。对话管理是实现多轮对话系统的核心,功能分为对话状态追踪(DST)和对话决策(Dialog Policy),前者作用是更新对话状态,记录到目前为止用户所有的聊天记录和系统行为,后者依据DST对话状态产生系统行为,即决定下一步反馈或调用等行为。目前自然度和准确度有待提高

02

二、智能助理行业分析及发展现状

(一)移动红利期结束

2007-2016年,从人口红利到移动互联网红利,依靠智能移动设备的普及、线上获客成本低等优势,大量公司跑马圈地。然而,2016年底,各种数据显示,移动互联网的渗透率已经见顶,流量红利耗尽。以中国互联网网民的成长速度和中国GDP成长速度的数据为例,2007年中国互联网网民增速在50%以上,而近几年互联网网民增速已慢于GDP增速,互联网的高速增长已近饱和。

图:2007-2016中国GDP增速与网民增速对比

(二)变革中的新蓝海

在移动红利期之后,成长的动力点在哪?回顾人机交互方式的变化,移动互联网时代核心驱动的硬件是触摸技术、计算能力的提升,软件方面是iOS&Android的颠覆式出现,使得交互形式从键鼠时代跨越到触控时代。未来以人工智能为代表的创新,或许不需要有“计算设备”这个中间载体的概念,直接提出需求,就能获得结果,这将成为未来的几十年当中不断推动数字经济发展的新动力。在这个过程中,随着用户的习惯、偏好、需求等数据的积累,智能助理将成为一个超级入口。

图:人机交互方式变迁发展概览

(三)服务模式不断优化

随着深度学习等技术的应用以及技术的平民化,人机交互正不可逆转地向人的方向靠近。一方面,智能助理的服务模式将由执行式服务转向交互式服务,不再机械单一地执行人类指令,而是根据数据自我学习优化,提供持续性、交互式服务,交互更接近人的自然行为。另一方面,随着计算设备价格的下降以及操作的人性化,使得越来越多的人可以轻松获得相应服务。

(四)千亿级市场待开发

Tractica机构预测2021年活跃消费者智能助理用户将从2015年的3.9亿增长至18亿;同期,企业用户智能助理用户将从1.55亿增长至8.43亿。2021年智能助理收入将从2015年的16亿美元增长至158亿美元。

目前智能助理完成任务有限,全球智能助理使用频率偏低,平均来看英美地区37%智能设备用户每天至少使用1次智能助理。但随着技术和数据的积累,智能助理将很快就能执行更复杂的任务,未来智能助理普及率将达90%,用户使用量也会有大幅上升。

图:智能助理用户数量

图:智能助理市场规模

03

三、智能助理平台介绍及应用场景

人工智能将成为人机互动的中流砥柱已成为了行业共识,因此主流科技公司均通过智能助理为切入点,布局他们的人工智能市场,并已开始逐步渗透进人们的生活之中。如:苹果的Siri、微软的Cortana、谷歌的谷歌助理,以及亚马逊的Alexa等。

表:巨头公司智能助理产品布局

公司

智能助理

公司

智能助理

苹果

Siri

微软

Cortana

谷歌

Google assistant

亚马逊

Alexa

百度

度秘

腾讯

腾讯小鲸

(一)Siri

助理简介:Siri是苹果公司在其产品iPhone4S,iPad 3及以上版本手机和Mac上应用的一项智能语音控制功能。提到人工智能助理,很多人第一个想到的就是Siri,因为是第一款进入公众视野的软件,具有最高的知名度。

应用场景:Siri将逐渐作为用户使用苹果设备的媒介,为他们接收信息,像助手一样朗读收到的文字信息。同时Siri还能够被用来控制客厅里的娱乐系统(通过Apple TV)、走廊的灯(通过HomeKit)、车载信息娱乐系统和通讯(通过CarPlay)、厨房音乐和通讯(通过Apple Music和iMessage),它还准备监控健身房、泳池以及跑步路线(通过Workout app、Apple Music和HealthKit)。

(二)Cortana

助理简介:微软旗下有两款智能产品,小娜和小冰,这两款产品分别主打自然语音理解和语音识别,前者更多体现的是“助理”的概念,后者则体现的是“语音”的概念,所以本部分重点介绍小娜(智能助理)。Cortana (微软小娜)是微软发布的全球第一款个人智能助理。它通过记录用户的行为和使用习惯,利用云计算、搜索引擎和“非结构化数据”分析,读取和“学习”包括手机中的文本文件、电子邮件、图片、视频等数据,来理解用户的语义和语境,从而实现人机交互。

应用场景:除了提供天气信息、即时新闻、交通路线建议、美食娱乐、备忘录以及跟踪快递和交通航班这些基本功能,Cortana 还能让手机与 Windows 电脑协作,智能识别用户的指令并作出相应反馈。

(三)Google assistant

助理简介:Google Assistant是一款智能助理,2016年05月19日在谷歌I/O大会上由谷歌推出,逐步代替原有Google Now。截至目前,全世界已经有超过超过5亿智能设备、40个汽车品牌、5000个家具设备都搭载了Google的AI智能助理。

应用场景:除基本功能外,场景还包括查询菜谱、智能家居方面(调节温度、开关灯泡)、订餐、流媒体音乐服务、打车服务等。

(四)Alexa

助理简介:是亚马逊旗下产品,通过Echo音箱为载体,为用户进行服务。凭借优质的语音识别,以及多麦克风的配置,Alexa拉近了智能助理与用户之间的关系。

应用场景:除了查询天气、询问问题等基本的功能,Alexa 也已经可以支持 Uber 打车、查询菜谱、控制家用电器等多方面的功能。

整体来看,巨头的智能助理产品同质性较强,均以通用型语音助手作为入口,但是不同行业的在线交互需求度和领域知识专业度都有所不同。因此,靠数据驱动的智能助理产品更适合在不同行业中以行业助理的形态落地,而不是以通用助理的形态落地,目前也已有不少公司聚焦于垂直领域。

(五)Remi(一款好用富有灵性的智能助理工具)

Remi是来由海归组成的创业团队,潜心打造的智能工作助理系列产品。依托云计算、商业智能技术等核心能力,REMI让用户事半功倍。Remi VIP是为高端人士专业设计的智能工作助理,其应用场景聚焦于工作助理领域。包括日程播报、安排车辆、高铁航班动态同步、备忘录、事件提醒等与工作生活相关的服务。Remi主要专注于行程安排,通过利用大量的场景数据,让智能助理产品更懂人心。同时,团队通过语义解析算法、主动学习以及与其它平台端口的打通,让智能助理可以聪明地给予用户最需要的提醒。比如助理可以在准确的时间点、地点提醒用户下一步安排,具体来讲,若用户在下午三点需要在某餐厅会面,助理会提前通知,并规划路线根据路况信息提醒用户出发时间。这相对于巨头什么都做的入口,Remi做的更专业,更细化,更贴合高端客户场景使用。这样超智能的助理能手谁不喜欢?

智能、灵性的工作助理正在寻找它的BOSS!快来认领!

参考文献

1. Honnibal M. Embed, Encode, Attend, Predict: The NewDeep Learning Formula for State-of-the-art NLP Models. Available at https://explosion.ai/blog/deep-learning-formula-nlp, 2017.

2. Conneau A, Kiela D, Schwenk H, et al.Supervised Learning of Universal Sentence Representations from Natural LanguageInference Data. In Proc. EMNLP, 2017.

3. 胡一川,《深度学习在智能助理中的应用》,2017

4. 张颖,《智能语音行业研究报告》,2017 

5. 华为,《GIV2025打开智能世界产业版图》,2018

6. 互联网

打开微信扫一扫
即可关注公众号

客服热线

010-52411871