前天凌晨,蘋果帶來(lái)了近些年最幻滅的一次系統(tǒng)更新。沒(méi)有息屏顯示、沒(méi)有新的UI設(shè)計(jì),沒(méi)有什么驚艷的黑科技,只有大量安卓用戶耳熟能詳?shù)?ldquo;新功能”。難怪網(wǎng)友評(píng)價(jià):比起全新的系統(tǒng)版本,iOS 15更像是iOS 14的優(yōu)化版本,叫做iOS 14.8可能更適合。
不過(guò),雖然iOS 15帶來(lái)的功能更新令人失望,但仍有部分網(wǎng)友毫不猶豫地選擇了嘗鮮Beta版。根據(jù)實(shí)際體驗(yàn),iOS 15 Beta版本BUG不少,唯一能拿得出手的更新內(nèi)容Facetime SharePlay還面臨著無(wú)法使用的窘?jīng)r。現(xiàn)在看來(lái),實(shí)況文本(Live Text)功能,無(wú)疑是這次平平無(wú)奇的iOS 15 Beta版本更新中最實(shí)用的新功能了。
圖像識(shí)別,人人都有
首先介紹一下,所謂的「實(shí)況文本」,其實(shí)就是可以在iOS相機(jī)應(yīng)用中啟動(dòng)的文字識(shí)別功能。無(wú)論是相機(jī)正在拍攝的畫面、已經(jīng)拍好的照片,還是手機(jī)屏幕截圖、網(wǎng)頁(yè)圖片,都可以通過(guò)該功能自動(dòng)識(shí)別并轉(zhuǎn)錄照片中的文字,支持復(fù)制、粘貼、查找及翻譯,實(shí)現(xiàn)照片中的文本提取和快速應(yīng)用。
當(dāng)然,類似的圖像識(shí)別功能早已在眾多安卓品牌的手機(jī)上實(shí)現(xiàn)。無(wú)論是谷歌在四年前推出的Google Lens應(yīng)用,還是各家國(guó)產(chǎn)手機(jī)廠商自帶的“掃一掃”應(yīng)用,基本都能輕松實(shí)現(xiàn)文字提取。借此機(jī)會(huì),小雷今天就來(lái)為讀者們解惑釋疑:蘋果的「實(shí)況文本」,究竟和其他同類功能有何不同?
首先,蘋果的「實(shí)況文本」是整合在相機(jī)里面的,用戶可以打開相機(jī)、打開相冊(cè)或是使用備忘錄里的「來(lái)自相機(jī)的文本」選擇使用該功能。實(shí)測(cè)iPhone可以自動(dòng)識(shí)別出畫面中的文字,點(diǎn)擊按鈕即可提取自己想要的文字,還可以對(duì)提取出來(lái)的文字進(jìn)行查詢、翻譯、拷貝、共享等操作。從結(jié)果來(lái)看,蘋果「實(shí)況文本」對(duì)印刷體的文本識(shí)別率還是很不錯(cuò)的,對(duì)中文手寫體的文本識(shí)別率就不太理想了,需要改進(jìn)。
(印刷體)
(手寫體)
此外,蘋果提取的「實(shí)況文本」還會(huì)自動(dòng)識(shí)別號(hào)碼、網(wǎng)址和地址并生成超鏈接。點(diǎn)擊網(wǎng)址,即可跳轉(zhuǎn)對(duì)應(yīng)網(wǎng)站;點(diǎn)擊地址,就會(huì)打開對(duì)應(yīng)地址的地圖信息;點(diǎn)擊號(hào)碼,則可以選擇發(fā)送短信、添加到聯(lián)系人,用起來(lái)還是挺方便的。
(網(wǎng)址、地址)
(號(hào)碼)
接著,我們來(lái)嘗試一下谷歌原生的Google Lens應(yīng)用。文字識(shí)別方面,用戶直接在取景框點(diǎn)擊對(duì)應(yīng)內(nèi)容,即可提取自己想要的文字。實(shí)際體驗(yàn)下來(lái),Goolgle Lens對(duì)印刷體和手寫體的文本識(shí)別率出人意料地優(yōu)秀,谷歌研究多年的文字識(shí)別技術(shù)確實(shí)不是虛的。
(印刷體)
(手寫體)
此外,Google Lens同樣會(huì)自動(dòng)識(shí)別網(wǎng)址、號(hào)碼等信息。被識(shí)別出來(lái)的網(wǎng)址,可以通過(guò)點(diǎn)擊下方的網(wǎng)頁(yè)選項(xiàng)完成跳轉(zhuǎn);被識(shí)別出來(lái)的號(hào)碼,更是可以直接撥打給對(duì)方。此外,在面對(duì)比較復(fù)雜的大段圖文內(nèi)容時(shí),Google Lens基本也能實(shí)現(xiàn)即拍即取,文本識(shí)別率相當(dāng)不錯(cuò)。
最后,我們來(lái)試試國(guó)產(chǎn)廠商自帶的文本提取功能。以小雷常用的小米10為例,小米相機(jī)、「?jìng)魉烷T」和「掃一掃」里的文檔功能,均可以對(duì)圖片進(jìn)行文本識(shí)別。實(shí)際體驗(yàn)下來(lái),小米相機(jī)對(duì)印刷體和手寫體的文本識(shí)別率都還不錯(cuò),作為文本識(shí)別功能而言絕對(duì)是合格的。
值得注意的是,小米「掃一掃」本身并沒(méi)有識(shí)別網(wǎng)址、號(hào)碼等特殊信息的能力,所有圖片掃出來(lái)都是可以編輯的無(wú)格式文本。用戶當(dāng)然可以自己復(fù)制網(wǎng)址、地址,然后打開對(duì)應(yīng)App進(jìn)行搜索,就是使用起來(lái)比較繁瑣。
經(jīng)過(guò)測(cè)試,我們可以大致看出這三款產(chǎn)品之間的功能差異。文本識(shí)別方面,谷歌的Google Lens識(shí)別率毋庸置疑地排在榜首,小米的三種文本識(shí)別功能雖然各有差異,但是識(shí)別率排在第二還是沒(méi)什么問(wèn)題的,蘋果的「實(shí)況文本」在這方面還可以多加改進(jìn)。操作方面,三款產(chǎn)品均可通過(guò)實(shí)時(shí)拍照進(jìn)行文字提取,操作起來(lái)都很直觀。功能方面,沒(méi)有識(shí)別能力的小米要稍遜一籌,而谷歌的搜索識(shí)別能力要比蘋果顯得更加方便好用。
谷歌能在這方面大獲全勝,自然是有其原因的。早在2010年,谷歌文檔就已經(jīng)加入了OCR文字識(shí)別功能,支持用戶將PDF檔案或圖片檔案中的文字轉(zhuǎn)換為可編輯的文本,而Google Lens在2017年就已經(jīng)與大家見面了,兩者之間的經(jīng)驗(yàn)差距是巨大的,需要時(shí)間去彌補(bǔ)。
什么讓蘋果夠“蘋果”?
作為一個(gè)全新推出的功能,蘋果的「實(shí)況文本」確實(shí)存在諸多不足之處。首先,目前Google Lens支持上百種語(yǔ)言識(shí)別,而蘋果「實(shí)況文本」只支持七種語(yǔ)言,兩者泛用性完全不對(duì)等。其次,「實(shí)況文本」的手寫文字識(shí)別率確實(shí)比較微妙,還有很大的提升空間。
當(dāng)然,該功能也有其優(yōu)勢(shì)所在。首先,谷歌的Google Lens是需要用戶聯(lián)網(wǎng)交換數(shù)據(jù)的,在國(guó)內(nèi)想要使用谷歌服務(wù)可不是一件容易的事。國(guó)內(nèi)廠商的圖像識(shí)別功能倒是可以正常聯(lián)網(wǎng),但是在沒(méi)有網(wǎng)絡(luò)的情況下也就運(yùn)作不了了。作為對(duì)比,「實(shí)況文本」功能是基于采用機(jī)載處理的“深層神經(jīng)網(wǎng)絡(luò)”,而不是基于云計(jì)算的方法。換句話說(shuō),該功能在沒(méi)有聯(lián)網(wǎng)的情況下也可以正常使用。
其次,目前手機(jī)上的文本識(shí)別功能大多都以獨(dú)立應(yīng)用的形式存在著,例如谷歌自研的應(yīng)用Google Lens、三星的圖像識(shí)別軟件Bixby Vision、小米的「掃一掃」、OPPO的「Breeno識(shí)屏」等。和它們不同,蘋果的「實(shí)況文本」功能是內(nèi)建在相機(jī)里面的,而所有的文本都是在用戶拍照時(shí)自動(dòng)捕捉的,用戶不必啟動(dòng)單獨(dú)的應(yīng)用程序就能使用對(duì)應(yīng)功能。
再次,雖然是后來(lái)者,但是蘋果的生態(tài)結(jié)合得更加緊密。在WWDC 2021上,蘋果公布了全新升級(jí)的「聚焦搜索」功能?,F(xiàn)在「聚焦搜索」通過(guò)智能技術(shù),可以根據(jù)定位信息、人物、場(chǎng)景或物品來(lái)搜索圖片,用戶只要下拉菜單欄,輸入關(guān)鍵詞,就可以輕松搜索到所有包含該文字的圖片。
一直以來(lái),安卓廠商最為人詬病的就是生態(tài)割裂。舉個(gè)例子,小雷在小米10上能找到三個(gè)圖像識(shí)別功能,三者之間互不關(guān)聯(lián),和小米自身的全局搜索也沒(méi)有產(chǎn)生任何聯(lián)系,都是獨(dú)立存在的功能。2019年,谷歌曾經(jīng)試過(guò)將Google Lens和Google Photos相結(jié)合,讓使用者可以用文字搜索到想要的照片。問(wèn)題是,市面上很少會(huì)有大廠會(huì)使用谷歌自家的相簿,生態(tài)也就無(wú)從談起。
(Google Photo的圖文搜索)
有的人覺得,蘋果是不是已經(jīng)黔驢技窮了?事實(shí)上,手機(jī)廠商相互「借鑒」不是從現(xiàn)在才開始的,在一個(gè)行業(yè)中學(xué)習(xí)對(duì)手并且取長(zhǎng)補(bǔ)短并不是什么壞事,都是為了更好地服務(wù)用戶。小雷認(rèn)為,好的系統(tǒng)就應(yīng)該積極傾聽用戶的呼聲,及時(shí)推出高效易用的功能。
總的來(lái)說(shuō),「實(shí)況文本」功能還是很實(shí)用的。該功能的推出,讓果粉明白自己手機(jī)上的相機(jī)并不是只能用來(lái)拍照的。利用「實(shí)況文本」功能,蘋果相機(jī)現(xiàn)在可以隨時(shí)隨地呈現(xiàn)信息。用戶只需對(duì)準(zhǔn)相機(jī),就可以獲知身邊環(huán)境的上千萬(wàn)個(gè)單詞、短語(yǔ)、位置和事物,更好地瀏覽周圍的世界。
此外,在「實(shí)況文本」的基礎(chǔ)上,蘋果還加入了全新的「視覺查找」功能。該功能和「實(shí)況文本」相輔相成,可以自動(dòng)識(shí)別照片中的地標(biāo)、自然、書籍以及寵物信息,并進(jìn)行突出顯示,幫助用戶獲得更多相關(guān)的信息。
融洽的生態(tài),為用戶帶來(lái)了更加優(yōu)秀的體驗(yàn)。設(shè)想一下,當(dāng)我們走在國(guó)外陌生的街道上,只要掏出手機(jī)對(duì)著素不相識(shí)的文字,相機(jī)就可以為我們自動(dòng)進(jìn)行翻譯;當(dāng)我們站在某棟地標(biāo)建筑面前,打開相機(jī),就可以了解關(guān)于這個(gè)建筑物的相關(guān)信息。這樣的體驗(yàn),可以給我們帶來(lái)很多便利。
小雷認(rèn)為,在蘋果的啟發(fā)之下,現(xiàn)在已經(jīng)擁有類似功能的安卓廠商也會(huì)開始嘗試將其整合到生態(tài)里面,讓用戶的體驗(yàn)不再割裂。這般增強(qiáng)現(xiàn)實(shí)的體驗(yàn),或許離我們已經(jīng)不遠(yuǎn)了。
雷科技數(shù)碼3C組
編輯丨三明治