語音識別技術的進步,使語音正成為可被計算機所接受的一種數據接口,也是計算機輸入最有效率的一種形式,由此,人機交互的方式將發生變革。
近來,國內、外媒體時常會提到一款智能語音產品——Echo,根據Amazon公布的最新消息顯示,語音交互的代表——Echo的累計出貨量已經超過1000萬臺,在美國家庭的滲透率達到5%。
這個小圓筒機器人體內的家伙“ Alexa”的技能已經超過了10000項,分分鐘秒殺Siri——時刻聽你說話,不用按按鈕觸發;通過藍牙來播放音樂;從Amazon Prime上語音購買任何東西;可以語音追蹤你的包裹而且你不用等到Echo的喚醒燈亮起來再說話。
根據Alexa Skills Marketplace 的數據,Alexa10000 項技能中,被使用最多的Top 10技能是:
① 歷史上的今天:是從 history.com網站收集來的每日歷史知識。
② 睡前小故事:可以設置孩子們的名字,為他們講一個大約一分鐘的睡前故事。
③~⑤ 環境聲音:雷聲、海浪和雨聲。這個技能只播放環境聲音。
⑥ Jeopardy! J6:是一個來自電視節目的每日腦筋急轉彎。
⑦ Ditty:會根據你的話語,做成一首歌。歌曲可以選擇快節奏或慢節奏,或基于某個主題。
⑧二十題挑戰:在20個問題之內讓你猜測動物、植物等。
⑨ 好奇心:分享各種知識。
⑩ Inspire Me:提供每日格言。
另外,Echo最強大的技能是遠距離語音識別和噪聲抑制,你在家里任何一個地方呼喚Echo,即使有噪音,它都能聽到,最遠距離可達12米!這下Siri真的被啪啪啪打臉了。可憐的Siri只能在近距離且安靜的環境中才能被你調戲。
VoiceLabs估計,2015年以語音為主要交互方式的智能硬件出貨量為170萬臺,2016年的出貨量達到650萬臺,預計2017年將有2450萬臺智能語音設備送到消費者手上,累計出貨量將達到3300萬臺,市場規模超過200億美元。從圖中可以很明顯的看出,以語音為主要交互方式的智能設備出貨量的增速非常快,超過3倍。
美國市場在該領域比較典型的就是Echo和Google Home,中國市場有Rokid和叮咚。
Rokid是一家面向C端用戶,提供新型家庭機器人助手和智能家庭產品的公司,其主打產品為Rokid家庭智能機器人以及即將正式出售的便攜款Rokid.Pebble。 而叮咚則是由一款智能音箱產品。這兩款產品都是以語音為主要交互方式的智能設備。另外,不管是美國還是中國,廠商都有一個野心——想做一款入口級產品,即智能家居控制中心(盡管目前中美兩國都還處于早期探索階段)。
在 Echo 流行之前,已有一家叫 Nest 的公司將智能硬件普及到美國的很多家庭中。從“2016年中美用戶安裝智能家居系統的家庭數量對比圖”可以很明顯的看出,中國目前的智能家居產品的覆蓋率還非常非常低,距離美國有15倍的差距。而只有智能家居產品的覆蓋率達到一定程度,類似于Echo這種智能音箱的“語音控制智能家居產品”的功能才有用武之地,否則只會是一個多余的功能擺設。當然,不管是中國還是美國,也都在等這塊市場成熟,顯然中國等待的時間還會更長,小米等廠商的智能家居布局之路“任重而道遠”。
美國用戶已經養成了為內容付費的習慣,他們非常重視版權保護。雖然從去年開始,中國的內容或者知識付費被提到很多,但是讓用戶、尤其是普通用戶養成為內容付費的習慣還有很長的路要走。目前由于國內智能家居市場還遠沒有成熟,所以用戶對通過智能語音設備控制智能家居的需求度還很低,更多的用戶會拿這些設備去聽音樂、聽故事或者是書籍等。但是由于近來版權收緊,這些智能語音設備廠商要么與版權方在資源上有合作,要么就需要為版權付費,然而設備廠商又無法通過內容從C端用戶身上收到錢,這就很尷尬了。
所以,國內廠商目前還處于非常早期的探索階段。即使“渠道+技術”優勢都已經具備,但是做得還是不溫不火,這與國內大環境和用戶習慣有非常大的關系。即使是在美國,Echo目前常用的功能也就是播放音樂、控制智能燈、定鬧鐘、讀新聞等。這些常用功能和控制智能家居,成為入口級產品的野心相差還是非常遠的。在美國尚且如此,在中國就更不用說了。
Echo的成績前面也已經提過了,目前的數據非常亮眼,所以我們也有必要來總結和復盤一下,為什么Echo能取得如此好的成績。
第一、Amazon對Echo的支持力度和決心非常大。Echo的內部研發工作從2011年就已經開始,并且之前在硬件(Kindle等)方面就已經有一定的積淀,隨后吸收了語音識別公司Nuance的部分員工,并且還收購了兩家語音技術公司Yap和Evi。等到Echo正式面市的時候,Amazon又不惜投入重金在各大渠道為Echo宣傳和促銷,同時還將Echo放在Amazon電商網站的顯眼位置,從而獲得了巨大的流量。而Echo的研發團隊也在不斷擴大,目前整個團隊已經超過1000人。除此之外,Amazon的CEO貝索斯對于產品近乎嚴苛的要求,例如:要求將Echo的反應時間控制在1秒。
第二、Echo尋找到了一個正確的“引爆點”來激發消費者的購買欲。超過 40% 的早期測試者說他們使用 Echo 主要目的是聽音樂。然后研發小組加倍投入精力,把音樂設計為 Echo 的主要功能之一。在人工智能還處于“弱智”階段時,以“智能音箱”的邏輯切入,用戶可以通過語音來播放音樂,能夠降低用戶的期望值。并且Echo是第一款能通過語音(遠距離拾音)來控制設備的產品,正如iPhone面市時的觸摸屏方式,對人機交互方式做出了一定的變革,能夠給用戶帶來新意和好奇感。再加上價格也不算很貴(最高價:179.99美元,約合1250人民幣;最低價:49.99美元,約合345人民幣),所以用戶會很愿意去嘗試。
第三、圍繞語音交互設計產品。Echo只提供語音一種交互方案,除了揚聲器和麥克風,Echo沒有其它交互接口。Echo“強迫”用戶使用語音與設備互動,教育用戶,培養用戶的使用習慣。
第四、硬件設備(Echo)+軟件服務(Alexa),打造生態體系,建立數據壁壘。Echo成為Amazon將智能硬件產品鋪到千家萬戶的“殺手锏”,Echo的數據表現也讓人們看到了以語音為交互方式的智能硬件時代已經到來,這就為Amazon開放基于Alexa的軟硬件開發者平臺提供了良好的基礎。Alexa Skills呈現出爆發式的增長,目前的Skills已經超過10000種。同時,接入Alexa的智能硬件設備也在快速增長,比如:華為美國版Mate 9手機就內嵌了Alexa語音系統等。整個生態體系的搭建離不開最初Echo的推出。而Echo的大規模鋪貨以及生態體系的搭建,又能為Amazon帶來大規模的數據,尤其是專業領域的真實場景數據和實時數據,從而將Alexa訓練得更加“聰明”。
另外,Amazon Echo和Google Home還沒有進入國內,一方面由于中文語音/語義識別和文化差異導致,另一方面中國的防火墻將國外廠商給“無情”地擋在了外面。那么,國內市場中目前主要的廠商/產品就是Rokid和叮咚了,同時也還有不少潛在進入者,就目前整個市場階段來看,還處于非常早期的教育用戶和培育市場階段,各廠商當下最重要是要找到中國市場的“引爆點”或者是應用場景,同時去打磨產品,等待這塊市場的爆發。所以現在談競爭還為時尚早。
微軟和蘋果據傳一直在研發類似于Echo和Google Home的產品,但是這兩家巨頭也可能從其他角度切入市場。例如微軟的HoloLens VR頭顯,目前也支持語音控制VR體驗;蘋果的無線耳機AirPods,支持通過Siri來控制。在推出的短短一個月內,蘋果AirPods就占據了美國無線耳機26%的市場份額。而三星在2016年8月也被曝出正在做類似于Echo的智能音箱,并且其新品Scoop的設計圖還在網上被曝光,但直到現在該產品也沒有正式面市。同時,三星也在2016年10月收購了AI助手系統Viv公司,而其聯合創始人正是“Siri之父”。并且在2017年3月,三星在 Galaxy S8 問世之前,率先公布了內置于手機之中的人工智能助理 Bixby。
可以看到,不管是國內還是國外,巨頭們都紛紛在語音交互市場搶奪賽道。尤其是面向C端用戶提供以語音為基礎的智能硬件市場,巨頭林立,創業公司涉足會面臨非常大的壓力,但是面向C端用戶的市場想象空間更大,如果創業公司能夠找到具體的落地場景和應用,并且對于團隊、資金、技術、資源等各方面都足夠自信,或者能夠伴上“干爹”,涉足C端市場也是很好的選擇。但目前對于國內的大多數創業公司來說,針對B端客戶或者是垂直行業輸出解決方案是更好的選擇。這樣可以避開巨頭的直面競爭,在技術發展早期段彌補產業的薄弱環節,現金流情況會更好。
另外,語音和視覺目前還被分得比較開,但是長遠來看,語音和視覺在AI領域一定會統一,因為這更符合人的自然習慣。這也是為什么VR/AR會火的重要原因,VR/AR最后也會將語音統一進去。