AI大模型現(xiàn)在到底發(fā)展到什么程度了?
一年一度的2024百度世界大會(huì)又來(lái)了。會(huì)上,李彥宏發(fā)布了“AI創(chuàng)作新物種”——百度文庫(kù)和百度網(wǎng)盤(pán)聯(lián)合推出的 “自由畫(huà)布”。作為網(wǎng)盤(pán)的重度使用者,非常期待看到AI加持后,能在網(wǎng)盤(pán)上玩出什么新花樣。今天,我也和大家分享一下大會(huì)見(jiàn)聞,看看AI有哪些基于網(wǎng)盤(pán)的深度創(chuàng)新和有趣實(shí)踐。
用網(wǎng)盤(pán)和文庫(kù),造了個(gè)操作系統(tǒng)?
根據(jù)李彥宏的介紹,這既不是簡(jiǎn)單的文庫(kù)更不是網(wǎng)盤(pán),而是一個(gè)“內(nèi)容操作系統(tǒng)”,直接高大上了有沒(méi)有。我仔細(xì)研究了下,確實(shí)有點(diǎn)東西。
首先,它的交互方式有了很大變化。不管是圖片、視頻、文檔還是音頻,鼠標(biāo)一拖一圈,全格式、全模態(tài)文件都能實(shí)現(xiàn)混合理解、生成以及創(chuàng)作。這個(gè)交互有點(diǎn)神似小時(shí)候玩的星際和紅警這些即時(shí)戰(zhàn)略游戲,都是這么一拖一圈,就能不同兵種和單位上去平A,看懂的老伙計(jì)別忘了點(diǎn)贊。
其次在大會(huì)演講中提到,自由畫(huà)布打通了文庫(kù)和網(wǎng)盤(pán)。也就是說(shuō),不論文件來(lái)自于文庫(kù)搜索、AI直接生成,還是原本就保存在網(wǎng)盤(pán)中,都能直接在自由畫(huà)布中使用,而且不受文件的格式限制,可以對(duì)所有格式的文件進(jìn)行大意總結(jié)、框架參考等標(biāo)記處理。相當(dāng)于在一個(gè)空間里就能生成包含圖片、圖表、視頻、文本等多格式、全模態(tài)的內(nèi)容。向外分享方面,在自由畫(huà)布中可以通過(guò)一個(gè)鏈接直接進(jìn)行分享、查看、二次編輯,也可以一鍵存儲(chǔ)到個(gè)人網(wǎng)盤(pán)中。
網(wǎng)盤(pán)與文庫(kù)能力融合后的自由畫(huà)布,基本上整合了我Office全家桶+Canvas的工作流,又避免了跨應(yīng)用跨平臺(tái)的開(kāi)銷,有點(diǎn)香了。
新的網(wǎng)盤(pán),給文件找了個(gè)家
對(duì)于自由畫(huà)布這個(gè)產(chǎn)品的濃厚興趣,促使我也準(zhǔn)時(shí)收看了下午的網(wǎng)盤(pán)文庫(kù)分論壇直播,和群友一起感受了下全新的百度網(wǎng)盤(pán)。我覺(jué)得,這是我第一次這么完整地去了解,我的百度網(wǎng)盤(pán)究竟能為我做什么,像是一份完備的“網(wǎng)盤(pán)使用說(shuō)明書(shū)”。
網(wǎng)盤(pán)產(chǎn)品負(fù)責(zé)人吳天昊提了個(gè)概念,我覺(jué)得非常精準(zhǔn)的描述了網(wǎng)盤(pán)的定位變化:“AI時(shí)代,百度網(wǎng)盤(pán)將成為一站式內(nèi)容存儲(chǔ)、管理和消費(fèi)平臺(tái)。如果用一個(gè)類比,就是從‘倉(cāng)庫(kù)’變成了‘家’ ”。
如果說(shuō)大模型能為個(gè)人文件存儲(chǔ)平臺(tái)帶來(lái)什么變化,我第一反應(yīng)也是從被動(dòng)存儲(chǔ),到主動(dòng)消費(fèi)甚至內(nèi)容生成的變化。
就像把你的倉(cāng)庫(kù)改造成了書(shū)房、工作臺(tái)或者實(shí)驗(yàn)室,你就可以用這個(gè)空間創(chuàng)造更多價(jià)值和可能性,當(dāng)然用起來(lái)也更加舒心、更有歸屬感、更有“人味”。不僅空間變了,里面還有一個(gè)隨時(shí)響應(yīng)的AI來(lái)給你當(dāng)助理,當(dāng)陪練。
相冊(cè)是照片墻,也是承重墻
在生活場(chǎng)景,網(wǎng)盤(pán)重點(diǎn)展示的是相冊(cè)功能,這個(gè)也直擊我的心趴。家里有娃,照片視頻肯定天天一大堆,靠手機(jī)自帶的內(nèi)存是遠(yuǎn)遠(yuǎn)不夠的,只能靠網(wǎng)盤(pán)找補(bǔ)。這樣還有一個(gè)好處,就是每次換手機(jī)從來(lái)不擔(dān)心照片備份的問(wèn)題,只要開(kāi)著實(shí)時(shí)同步,再古早的黑歷史都能瞬間找到。
網(wǎng)盤(pán)的搜索功能非常好用,大家可以拿自己的網(wǎng)盤(pán)試試不同的關(guān)鍵詞,比如“去英國(guó)旅游的風(fēng)景”、“和老婆的合照”、“我家娃的照片”等等。甚至搜“往年今日”,它能自動(dòng)把每年今天的照片給你找出來(lái),非常適合紀(jì)念日臨時(shí)抱佛腳……
有了AI能力的加持,就可以讓這些回憶的瞬間變得更美好。比如借助與文庫(kù)融合后的AI能力,幫助用戶進(jìn)一步進(jìn)行圖片的個(gè)性化加工。
比如找到了旅游的照片,可以通過(guò)多圖成片生成各種不同畫(huà)風(fēng)的漫改內(nèi)容,生成智能的旅行手記,甚至能幫助你寫(xiě)一段朋友圈文案。
美好回憶,和對(duì)于這些回憶的二次創(chuàng)作,一起通過(guò)網(wǎng)盤(pán)存儲(chǔ)下來(lái),一直陪伴我們。此刻虛擬空間中的照片墻變得具象化,成為我們現(xiàn)實(shí)生活中的精神“承重墻”。
一個(gè)書(shū)房,讓學(xué)習(xí)辦公更簡(jiǎn)單
如果說(shuō)相冊(cè)像家里的照片墻,那么網(wǎng)盤(pán)提供的學(xué)習(xí)辦公能力,就像是給用戶構(gòu)建了一個(gè)工具完備的書(shū)房。
其中讓我印象深刻的是他們這次推出的“簡(jiǎn)單系列”,包含“簡(jiǎn)單掃描”、“簡(jiǎn)單聽(tīng)記”和“簡(jiǎn)單打印”。顧名思義,就是讓工作中的臟活累活變的簡(jiǎn)單。
簡(jiǎn)單掃描功能上和全能掃描王比較類似,都是屬于OCR的常規(guī)操作,但值得關(guān)注的地方是可以通過(guò)網(wǎng)盤(pán)將各種資料進(jìn)行數(shù)字化、結(jié)構(gòu)化地存儲(chǔ)和管理。這特別適合整理強(qiáng)迫癥和健忘型用戶,因?yàn)楹A康膫€(gè)人資料如果不進(jìn)行整理,用時(shí)方恨無(wú)覓處,懂的都懂。
第二個(gè)產(chǎn)品簡(jiǎn)單聽(tīng)記,個(gè)人覺(jué)得是妥妥的打工人福音,老板再也不用擔(dān)心的我的會(huì)議紀(jì)要了。它可以將音頻一鍵轉(zhuǎn)文稿,甚至生成不同模板的專業(yè)紀(jì)要。
傳統(tǒng)的聽(tīng)記產(chǎn)品只專注于錄音、或者錄音轉(zhuǎn)文字,但后期仍然需要我們花時(shí)間復(fù)聽(tīng)、復(fù)看。而且這些內(nèi)容對(duì)專業(yè)詞匯的辨識(shí)準(zhǔn)確率還是不行,據(jù)我所知也仍然是行業(yè)一大難點(diǎn)。
我特別體驗(yàn)錄制了一些demo,大家可以感受一下,可以說(shuō)又快又準(zhǔn)。一小時(shí)的音頻大概3分鐘左右可以完成轉(zhuǎn)文稿和生成紀(jì)要,像業(yè)績(jī)電話會(huì)這種投資專業(yè)場(chǎng)景也能很好服務(wù),隨便試了下蘋(píng)果Q3電話會(huì)紀(jì)要,核心經(jīng)營(yíng)數(shù)據(jù)都總結(jié)在紀(jì)要開(kāi)頭了,專業(yè)用詞都很精準(zhǔn)。
為了進(jìn)一步給用戶節(jié)省時(shí)間,簡(jiǎn)單聽(tīng)記也展示了正在測(cè)試的“會(huì)議助理”功能。把線上會(huì)議的鏈接貼給它,它會(huì)幫助你去參會(huì)并帶回來(lái)完整的會(huì)議錄音、逐字稿、AI紀(jì)要,堪稱摸魚(yú)神器,對(duì)于沒(méi)辦法聽(tīng)所有會(huì)的大佬們也很有幫助,盲猜測(cè)會(huì)成為一個(gè)黑馬功能。目前這個(gè)功能已經(jīng)支持zoom會(huì)議和騰訊會(huì)議,等我拿到測(cè)試碼就第一時(shí)間體驗(yàn)分享給大家。
最后一個(gè)產(chǎn)品簡(jiǎn)單打印,可以理解為掃描的反向操作,在網(wǎng)盤(pán)中把大量數(shù)字文件打印成紙質(zhì)時(shí)很適用,可能是和順豐聊了合作,文件可以一鍵順豐到家,比較方便。
這次和文庫(kù)的融合,給網(wǎng)盤(pán)這個(gè)老產(chǎn)品帶來(lái)很多AI創(chuàng)作能力?,F(xiàn)在在百度網(wǎng)盤(pán)中也可以一鍵生成AI PPT,可以通過(guò)AI編輯器直接新建在線文檔,在編輯器中AI將輔助你更好地完成創(chuàng)作,可以根據(jù)主題直接生成,可擴(kuò)寫(xiě),可潤(rùn)色。
更進(jìn)一步,百度網(wǎng)盤(pán)還將一系列AI能力集成到了學(xué)習(xí)場(chǎng)景,當(dāng)用戶在觀看一個(gè)學(xué)習(xí)視頻的時(shí)候,可以查看AI總結(jié),生成AI字幕,提取AI課件,邊看視頻邊記筆記。這個(gè)能力應(yīng)該是借助AI把單一模態(tài)數(shù)據(jù)轉(zhuǎn)化為多模態(tài)數(shù)據(jù),同時(shí)在多模態(tài)數(shù)據(jù)中建立了自然的關(guān)聯(lián)與融合。
還有更多AI繪本、雙語(yǔ)打印的能力就不一一展示了,大家可以去網(wǎng)盤(pán)自己感受一下。能感受到網(wǎng)盤(pán)真的是在革自己的命,畢竟大浪淘沙這么多年,剩下的可靠的個(gè)人網(wǎng)盤(pán)產(chǎn)品,還剩幾個(gè)呢。
一個(gè)人,也可以是一個(gè)攝影工作室
大家可能平時(shí)關(guān)注C端產(chǎn)品居多,新的AI應(yīng)用就已經(jīng)應(yīng)接不暇了。但下面兩個(gè)B端產(chǎn)品也容許我再介紹一下。百度網(wǎng)盤(pán)推出的這個(gè)全新攝影行業(yè)解決方案,以“超能畫(huà)布”和“AI修圖”為核心產(chǎn)品,幫助影樓和攝影工作者一站式實(shí)現(xiàn)“AI創(chuàng)意+存儲(chǔ)備份+AI修圖+一鍵交付”。
怎么理解呢?一個(gè)自由攝影師,全年無(wú)休,拍攝量也得超過(guò)10萬(wàn)張;這么多的照片,如果一張一張的修,等到顧客看到成片,也得1-2周以后了。但通過(guò)AI修圖,幾秒修一張,等顧客卸完妝就可以看成片了。
這套流程解決了單兵作戰(zhàn)的效率和成本難題,攝影師專注在拍攝本身,忙不過(guò)來(lái)的部分都交給AI。
都在用,就是最好的口碑
除上面提到的投資圈和攝影圈都在用之外,大會(huì)上也提到最近有很多明星都開(kāi)始用網(wǎng)盤(pán)。李榮浩、檀健次、范丞丞甚至杜華都下場(chǎng)陸續(xù)用網(wǎng)盤(pán)發(fā)宣傳物料。這之后,仿佛幫他們打開(kāi)了新世界的大門。
過(guò)去,粉絲們需要在一堆繁雜的評(píng)論和信息里找想要的物料,找到了還是帶水印的;而明星和片方發(fā)稍微帶一點(diǎn)商業(yè)就容易被誤夾。
但現(xiàn)在,明星、宣發(fā)甚至大粉,把素材存在網(wǎng)盤(pán)里,你訂閱就能隨時(shí)看,明星和粉絲被重新拉回最初的、更近的位置,構(gòu)建了一種更為親密、雙向奔赴的新型關(guān)系。
這不,大會(huì)現(xiàn)場(chǎng)還請(qǐng)來(lái)了愛(ài)豆李藝彤,她分享了如何用文庫(kù)和網(wǎng)盤(pán)進(jìn)行AI創(chuàng)作,還在現(xiàn)場(chǎng)曬出了工作室網(wǎng)盤(pán)二維碼,與大家分享活動(dòng)照片。
所以,當(dāng)我們講出“我和我愛(ài)豆都用百度網(wǎng)盤(pán)”、“我有我愛(ài)豆的網(wǎng)盤(pán)好友”的時(shí)候,確實(shí)有一種雙向奔赴的感覺(jué)。
士別三日,當(dāng)刮目相待
百度網(wǎng)盤(pán)已經(jīng)不是當(dāng)年的那個(gè)印象里的網(wǎng)盤(pán)了。它并沒(méi)有以競(jìng)爭(zhēng)姿態(tài)去更新迭代產(chǎn)品,它是站在產(chǎn)品形態(tài)和用戶需求之上,自我革新。不僅如此,這些功能迭代也更加接地氣,更加傾聽(tīng)用戶的聲音,什么呼聲高,就做什么。當(dāng)全格式、全場(chǎng)景和全模態(tài)的內(nèi)容輸入、處理和輸出完成打通,將構(gòu)成最接近用戶想象的內(nèi)容操作系統(tǒng),網(wǎng)盤(pán)和文庫(kù)的融合,將能成為下一個(gè)現(xiàn)象級(jí)應(yīng)用。用
AI+百度網(wǎng)盤(pán),厲害得不像網(wǎng)盤(pán)。
(注:本文不代表老石任職單位的觀點(diǎn)。)