【活動花絮#29】萬物聯網時代,AI 產品經理的思維、價值與定位

智能語音的實踐涵蓋到五種核心技術,包含:聲音信號處理、熱詞喚醒、語音辨識 ASR、語意處理 NLP,以及語音合成 TTS。

本次【產品經理菁英會社團暨PM Tone產品通】的分享主題將聚焦於【AI與物聯網結合的策略與技術】,主講者是之前任職於KKBOX IoT商務發展副理,目前在出門問問(中國10大AI獨角獸)擔任AI商業化 商務發展經理的沈品勳(Seff Shen)。首先,Seff將從全球智能語音的發展趨勢切入,和大家分享「AI」與「物聯網」如何充分結合的具體做法及如何將產品商業化的過程;其次,Seff將分享傳統的產品經理面臨AI時代的來臨,PM該如何重新定位以及該具備那些技能?才不會被時代演化所吞沒! 滿滿的case study及solution,非常充實的知識饗宴~

讓我們一起來回顧一下本場次精彩的分享吧!

以下的筆記內容由團友 Jia-Ying Liu 提供,非常感謝! ! !


AI Voice Revolution 下一代人機互動智能語音「喚」醒全球商機

【Part One】語音「喚」醒全球商機 全球智能語音大趨勢 AI 與物聯網繃出的新火花 企業也需要語音?機器人的崛起 

沈品勳 Seff 從政大資管所畢業後,在 KKBOX 擔任商務發展副理的期間,點燃了對 AI 的熱情,進一步到台灣人工智慧學校進修,獲得經理人班認證,修業完成後也獲得機會加入中國 10 大 AI 獨角獸的【出門問問 mobvoi】,繼續擔任 AI 商業化商務發展經理的職務。

圖片來源 : PM Tone 產品通

【出門問問】的背後投資戰略夥伴是眾所皆知的 Google,以及車界大廠 Volkswagen,同時投入在智能語音互動的研發,以及智慧車機的研發。

什麼是智能語音?

智能語音的實踐涵蓋到五種核心技術,包含:聲音信號處理、熱詞喚醒、語音辨識 ASR、語意處理 NLP,以及語音合成 TTS。

語言理解是人工智能皇冠上的明珠 – Bill Gates 

而對語言理解的應用,可以廣泛應用在各種研發領域:

  1. 人機互動
  2. 神經機器翻譯 – 透過類神經網路進行自然語言翻譯
  3. 語言閱讀與理解 – 透過讓機器不斷的考試與學習,擴增機器的問答能力
  4. 機器創作 – 機器可以學習文本的一些核心特色,例如詩詞的韻律,進而運用語言元素創作

IoT 物聯網,主要有三大領域:消費物聯網、工業物聯網、智慧城市 。

而「消費物聯網」則是「智慧語音」應用的最大領域,又細分為三個主題:

  1. Smart Home 
  2. Wearable Tech
  3. Automobile 

Smart Home

出門問問投入在「智慧音箱」的研發上,認為智慧音箱是以語音連動消費物聯網的關鍵,透過智慧家居,成為打開物聯網的鑰匙。日本的 NAVER 即有開發自己的音箱,台灣遠傳也與出門問問合作出了「問問音箱」,而 Google 也加入了這個高速發展的一級戰區。
在中國,出門問問發展出「帶屏音箱」,將視覺與智能語音的結合,應用在熟齡長照的領域,協助長者紀錄日常生理數據以及常民生活的語音互動。

圖片來源 : PM Tone 產品通

收斂到家庭,美國甚至發展出「語音芭比娃娃屋」,可以透過聲控進行娃娃屋的操作改造;而 Adobe 的統計數據,「語音」已經成為美國家庭選購電視、車子的重要考慮因素之一。

Wearable Tech

語音智慧穿戴的發展近幾年從未停下,出門問問也透過 Tic Watch 加入這個戰場。例如「速食店店長專用智慧錶」,因應特殊場景,嘗試透過智慧語音解決人工認知超載的問題。

Automobile

出門問問與 Volkswagen 合作了「大眾問問」,也加入了車載語音的進化浪潮。

而智慧語音帶來了哪些商機呢?SEO、Ad.、Shopping,當人們開始習慣跟智慧音箱互動時,智慧音箱提供的 content 便開始加劇對消費者的影響力,優先被播放的內容,將成為最有力的廣告互動;延伸廣告的應用,語音購物也逐漸成為電商的新通路。

不僅是單方面投放 content 的消費領域,Open Banking 是一種智慧語音在服務業的應用範例。

除了消費物聯網,企業也開始將語音應用在更廣泛的商用題目上。提到企業開發的智能語音,最有名的就是 Siri,是最早面世的語音助理,但隨著 Jobs 的離世,對 Siri 的諸多理想也未能實現,反而成為業界進化最緩慢的語音助理。

對話即平台 CaaP( Conversation as a Platform) – Satya Nadella

Chatbot:服務導向的小娜 & 聊天高手第六代微軟小冰
進一步從文字的 Chatbot,企業也將此類型智慧語音應用至 Call Center,以節省人工成本。在 Inbound 的場景,可直接進行「服務查詢、業務申辦、語音答錄以及透過聲紋辨識建構的身分核查」。在 Outbound 的部分,則包含「回訪、電銷、問卷調查」,透過越來越聰明的語音互動,篩選出低中高潛力的客戶,將人力投入在中高潛力客戶的刀口上。

較知名的 Outbound 案例是 Google 曾 demo 的 Google AI Duplex;Inbound 案例則是 2019 年 LINE 發表的 LINE BRIAN 電話語音機器人。

實體智慧機器人分為四大類型:陪伴型、迎賓型(Pepper)、服務型(獵豹移動的豹小蜜),以及特種機器人(極端環境的運輸工作等)。
從 Chatbot 到 Voicebot,各大企業前仆後繼的投入了語音發展。

  • 通用語音助理:Siri、Cortana、Alexa、Google Assistant
  • 企業服務整合:Nuance、科大訊飛、出門問問
  • Cloud Solution Provider – SaaS: Google Cloud、AWS etc. 

語音甚至也應用在醫療領域,用以解讀漸凍人的語意表達。

【Part Two】AI 時代的 PM 長什麼樣 多模態 AI 的產品解構(語音 + 機器人 + 人臉辨識)AI 所孵育的跨國與新型態工作,從 BD 角度觀察 AI PM 該具備的特質

多模態 AI 的產品結構

What’s AI? 用很多的數據和過去的規則,去推估出未來的走向。

  • 訓練 Training: 利用統計原理運算變數間的數學關係,進而生成演算法。
  • 預測 Inference: 基於訓練後的演算法,透過已取得的變數推論未知變數。

Machine Learning 處理可量化的元素:Dimension Reduction、Clustering、Regression、Classification。

Continuous (predicting a quantity)

Discrete (predicting a category)

Deep Learning 處理難以量化的元素:NN、RNN、CNN 為深度學習的主流模型。

圖片來源 : PM Tone 產品通

AI 的應用:

  1. Chatbot (Google – Dialogflow)
  2. Voicebot (語音辨識 > 語意理解 > 語音合成 – 語素轉音素、預測持續時間、基頻預測、音頻合成)
  3. AIoT (商湯 – AI 人臉辨識)
    1. 結合 AI 的 ibon 高鐵訂票場景,縮短一半的 user journey,提升操作效率,並加入精準廣告投放應用
      1. 人臉啟動
      2. 人臉辨識
      3. 喚醒啟動 – 聲音信號處理、熱詞喚醒
      4. 精準廣告推播 – 人臉分析、年齡分析、SEO 等
      5. Voicebot and chat 
    2. 深度個人化情境 – 帶屏音箱家庭娛樂 Google Home Hub 
      1. 聲紋辨識
      2. 用戶畫像
      3. 人臉比對 / 臉部辨識 – 驗證購買
      4. Machine learning 喜好推薦

AI 所孵育的跨國與新型態工作

  • 傳統資訊系統 SI、UI / UX
  • AI 資訊系統 SI、UI / UX、AI

以 IoT 產品的 ASR 訓練為例:

  1. 去敏(保護敏感資訊)
  2. 標註(標註語音正確文字作為訓練資料)
  3. 聲學
  4. 語言
  5. 服務化(打包語言模行為服務的 API 等工具)
  6. 硬體
  7. 佈署

Google Hangout 近期發展出即時線上會議多國語音翻譯,甚至包含繁簡中文在地化用詞轉換。

UI / UX 的需求變化 – Google Conversation Design,需考慮 Language、Technology、Psychology 

  1. 交談人性化
  2. 推進對話(在相同情境,進一步以關聯性材料延伸對話的長度)
  3. 簡單扼要
  4. 串通語境
  5. 靈活的調整語序
  6. 不要教用戶怎麼說話

VUI 和過去觸控 UI 的差異 – Richart 的 App 人性對話轉帳操作是近期台灣的經典範例。

系統整合的需求變化 – 跨裝置的全通路支援:Web/App、Phone、TV、Wearable device、Smart home, etc.  PM 需要能注重多種通路的產品發展。

消費物聯網的 SI 變化 – KKBOX IoT,KKBOX 透過 API、APK / AIDL、KKLINX 多重的技術開發跨裝置的 AI 訂購方案推薦。

AI PM 的 7 個特質

圖片來源 : PM Tone 產品通
  1. 軟實力
    1. 現學現賣 – 會遇到連總部都沒經驗的「第一次」,快速透過網路上的資源學習、需消化思考後並實踐 。
    2. 教育客戶 – 與其糾結於技術語言,讓客戶感受前後差異(如節省成本、執行效率、辨識率等)和買單更重要 。
  2. 硬實力
    1. 機器學習 – 模型訓練的成長、複用性、I/O Data 與不確定性(AI 的東西是概率性的東西)。
    2. 雲端運算 – 模型訓練和推測(使用既有模型)為獨立作業,要有 Google Docker、最佳化運算能力與 HA 的概念。
    3. 全通路 – AI 將不再限於網站與 App,了解各通路、IoT 的軟硬體運作方式。
  3. 創造力
    1. 具象化 – AI 非常虛無飄渺,用簡單道理來譬喻舉例,和具象化邏輯與畫面的能力。
    2. 想像力 – AI 就像人的器官與腦,洞見未來的能力並創意整合不同的 AI 技術並切入市場需求。

Seff 的推薦閱讀【聲控未來 Talk to Me】討論了「紀念機器人」的市場。另一本推薦閱讀是【人工智慧在台灣】。

Gary 補充推薦了另一本【亞馬遜 2022:貝佐斯征服全球的策略藍圖】,裡面提到了 Amazon 365 的概念,以及 Amazon 的 AI 布局。

圖片來源 : PM Tone 產品通

Q&A – 如何定義 AI 產品的 product roadmap?

Seff 說定義 AI 的 product roadmap 不能操之過急,要先從「打到最多產業的 AI 技術切入」,才能達到最廣泛的應用,同時蒐集模型,在市場需要時才能一步到位拿出來;同時也需要透過篩選產業、篩選客戶,精準找出產品的可能買家。

Q&A – AI 語音的時代,要如何維護資訊隱私與資料安全?

目前的 AIoT 領域,資安確實未到高度安全,在中國,情侶專用的「暖心 IoT」分手後變成「家暴 IoT」;未來逐漸使用的 blockchain 技術應可以大幅提升資安程度。


再次謝謝 Seff 的分享,也謝謝大家的參與,我們下次見 !

文字來源: Ying @ Taiwan by Jia-Ying Liu

圖片來源: 產品經理菁英會

若有轉貼需求,請來信(service@pmtone.com)討論。 轉貼時禁止修改內容及標題、須保持所有連結、禁止商業使用,並且必須註明原文標題、連結、及作者訊息。

覺得這篇文章好嗎? 請分享給您的朋友吧~

分享在 facebook
Facebook
分享在 twitter
Twitter
分享在 linkedin
LinkedIn
分享在 email
Email
分享在 print
列印

延伸閱讀