連結已複製

拍照外 Google Pixel 8 AI 功能使用真心話:語音辨識 + 自動逐字稿效率大提升,但是⋯⋯

Google Pixel 8 帶來了 Android 14 以及多樣的 AI 智慧功能,如果我們先將目光放在拍照之外的地方,在 AI 相關辨識、內容互動上面,Google 推出了好幾項能夠讓你的生活、工作都更加方便的 Google 助理以及語音辨識功能。搭載了 Google Tesnor 3 最新處理器的技術,究竟這些多出來的 NPU 神經處理單元在忙些什麼呢?台灣能夠用上哪些服務?讓我們往下看!

延伸閱讀:拍照功能請看未提YouTube節目!

 

Google Pixel 8 錄音工具自動聽打逐字稿還上標點符號

手機錄音同時完成文字逐字稿轉錄,還會聰明的幫你上標點符號以及時間軸分段+雲端協作!

體驗過一輪Pixel 8 ,其中最讓我覺得「會想要為了這個功能買它!」的就是「錄音機」!是的,單純的錄音機結合上 Google 的雲端服務以及處理能力,就變成了工作幫助神器。錄音轉字幕已經有很多服務提供,但是 Google Pixel 8 的錄音功能有以下幾個讓我超喜歡的特點:

● 中文語音辨識

● 中文標點符號與分段

● 聲音與逐字的時間軸

● 自動上傳與電腦雲端協作

這些特點,對於製作會議記錄的效率簡直是大幅度進化,如果再把整理好的文字餵進 GPT-4 或是 Bard 等 AI 服務,就能夠快速地從逐字稿轉化成會議記錄,大大的省事,同時還擁有原檔備份。

https://recorder.google.com/  Google 的錄音工具有雲端同步,字幕以及時間軸都能夠對應使用。

檔案可以下載音訊檔案,也可以下載純文字檔案,方便進一步編輯

Google 的能力已經完全可以做到中文的語音辨識加標點符號的初步語意分析,甚至談話穿插日文或是英文也能夠辨識(雖然目前實際用起來效果普通)。至少在台灣,我還沒有找到類似能夠在手機+雲端這樣的服務,最接近的可能是中國的「科大訊飛聽見」,三星手機雖然也有提供錄音轉逐字稿的功能,但是沒有標點符號分段。
 

明明都有中文語音辨識的能力,卻不是什麼地方都能用

支援的語言例如英文,就能夠分段與上標點符號,不支援的語言例如中文,就會單純的文字辨識後一整片貼上來。

在新版的 Android 功能中,在「語音輸入」上有著飛越的進步,請注意圖片中鍵盤上「麥克風」的長相不同,有支援新功能語音輸入的語言,就會有彩色符號以及聽取中的圖示,但沒有支援的語言,則會是一個平面的麥克風圖案。

兩者主要的差別,在於是否支援:

● 語音輸入中同時下語音指令

● 語音輸入加入標點符號

● 語音輸入時同時辨識多種語言

以支援的英文、日文為例,你可以直接說出英文,語音輸入會更加智慧的辨識,來智慧的加上標點符號以及進行分段,同時,你還可以在輸入的時候,說出「Send」、「Clear」等語音指令,來讓手機知道你已經說完了可以傳送,或是刪除上一段。更厲害的是,他還能夠混和辨識,你可以英文說一說,換成說日文,語音輸入會自行切換成對應的語音。

問題來了,這些功能是不是跟剛剛所介紹的錄音轉逐字的功能很接近?是的,雖然錄音轉逐字稿的功能支援繁體中文,但是在語音輸入這裡卻是不支援的。

Why?為什麼,為什麼啊 Google~

 

被切斷思緒的 Google 助理

Google Pixel 8 所帶來的軟硬體整合,在「功能都可以使用」的時候,真的會給人一種未來世界提前到來的感覺。現在,你可以在任意的畫面上叫出 Google 助理,並且讓 Google 助理唸出畫面上的內容,同時,還能夠即時的翻譯、調整語速,還能夠對於處理出來的內容進行進一步的提取大綱、快速瞭解。這就有點像是 Google 智慧鏡頭的深度應用加上 Google 助理的語音互動功能。

讀取螢幕畫面,念出來,翻譯之後念出來,其實在這之前就有非常多的解決方案可以做到,但是 Google 將這些功能整合起來,讓 Google 助理被呼叫出來時,就能夠根據現在的手機畫面,來跳出幾個你可能會想要的功能(例如文字多的內容時會跳出「Read aloud」),使用起來就會輕鬆且無縫。

但不好意思,繁體中文還是沒搞頭,以上說的一切魔幻體驗,到繁體中文這裡就像是思緒突然被切斷一樣。在繁體中文語言時,你叫出 Google 助理他也會在適合的內容頁面跳出「大聲朗讀」的按鈕,但是點下去時他就會回答你「抱歉,我沒聽懂」的功能無效反應。

Google 展示,語音助理還能夠給出畫面上文章的總結與大綱(來源:Google Pixel

Call Screen 功能,能夠幫你接電話後,利用語音助理技術先幫你回覆並知道打電話來的人是誰,並再以語音文字辨識技術用文字顯示打電話來的人說了些什麼。這在很多面向都可以做成一個「防詐騙神器」的功能。

當 Google Pixel 承諾的功能可以用的時候真的很棒,只可惜還有太多的功能都像是一個才華洋溢的新人運動員,有著滿滿的天分,但是卻還不知道什麼時候能夠轉換成球場上的成績。在影像部分,還有許多功能要等待後續的功能完成開放(例如夜景錄影),在 AI 人工智慧部分,甚至有從 Pixel 7 年代就發表的 Call Screen 功能,至今在台灣,或是說繁體中文市場是還沒有開放,就只能痴痴的等了。

再擴大了說,不只 Google Pixel,有許多跨平台雲端協作的 Google 功能都還在一個一個突破當中,例如 Google Bard 對於其他應用的串連(我猜總有一天會跟 Google 助理結合),但這些都還只是美好的未來,在目前的現在,光是兌現的錄音工具,就真的幫助到了我的功能,衷心期待 Google 能夠在不遠的將來,讓 Google Pixel 能夠從「備受期待的新星」變成「帶領球隊奪冠的明星」。

 


哪裡買?

台灣大哥大 / 三創生活1F / 0809-000-852

Lion獅子說書

寫科技玩意,然後到處旅行

留言回應