加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

思必馳加入AI造芯大潮:明知山有虎偏向虎山行?

2019/01/08
50
閱讀需 39 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

?

AI 橫行的當下,沒有什么高科技能比 AI 更能激起廣大用戶內心的好奇,很多創(chuàng)業(yè)公司都在拿 AI 當噱頭,幾乎所有傳統(tǒng)公司都竭盡全力向 AI 靠近。于是去年智能音箱火了,天貓精靈、小愛音箱、亞馬遜的 Echo 紛紛走入我們的生活,語音控制確實比硬件控制更加便捷,有些設備廠商甚至打出一個口號“能動動嘴解決的事情就不讓用戶動手”。

在智能語音處理領域,思必馳以算法見長。從 2013 年開始,思必馳專注人性化的自然語言交互方案,在 2017 年基于語音技術積淀推出了 DUI 開放平臺,開啟全鏈路對話定制;2018 年,思必馳擠身中國 AI 國際隊,14 篇論文入選 ICASSP,并發(fā)布了會話精靈。從應用市場來看,思必馳 CEO 高始興向與非網記者介紹,“我們打通了全鏈路,實現(xiàn)了規(guī)?;ㄖ疲K端設備激活 8000 多萬臺,開發(fā)者超過 17000 人,打通了 16 葛智能家居平臺。在車聯(lián)網后裝市場、智能音箱、兒童平板、故事機,以及知識機器人等關鍵領域市場占有率位居第一,在汽車前裝、電視、白電、智能客服等重點領域增速第一。”

思必馳聯(lián)合創(chuàng)始人、首席科學家俞凱

獨行者快,眾行者遠,思必馳選擇聯(lián)手強者打造 AI 芯片
思必馳造芯是經過了深思熟慮之后作出的決定,而且選擇適合自己的路,用思必馳聯(lián)合創(chuàng)始人、首席科學家俞凱的話說就是“獨行者快,眾行者遠”,思必馳選擇與中芯國際旗下的中芯聚源合資成立深聰智能公司,從 2017 年初開始醞釀,2018 年 2 月開始定制芯片,2018 年 8 月份實現(xiàn)流片,2018 年 11 月進行驗證。

深聰智能 CTO 朱澄宇介紹 TH1520 是一款聚焦于語音應用場景下的 AI 專用芯片,主要面向智能家居、智能終端、車載、手機、可穿戴設備等各類終端設備。解決方案包含算法+芯片,具有完整語音交互功能,能實現(xiàn)語音處理、語音識別、語音播報等功能,支持離線語音交互。

他強調,“TH1520 進行了算法硬件優(yōu)化,基于雙 DSP 架構,內部集成 codec 編解碼器以及大容量的內置存儲單元,同時,TH1520 采用了 AI 指令集擴展和算法硬件加速的方式,使其相較于傳統(tǒng)通用芯片具有 10X 以上的效率提升。TH1520 在架構上具有算力及存儲資源的靈活性,支持未來算法的升級和擴展?!?/p>

TH1520 兼具低功耗及實用性,采用多級喚醒模式,內置低功耗 IP,使其在 always-on 監(jiān)聽階段的功耗低至毫瓦級,典型工作場景功耗僅需幾十毫瓦,極端場景峰值功耗不超過百毫瓦。該芯片支持單麥、雙麥、線性 4 麥、環(huán)形 4 麥、環(huán)形 6 麥等全系列麥克風陣列,同時支持 USB/SPI/UART/I2S/I2C/GPIO 等應用接口和多種格式的參考音,能在各類 IOT 產品中靈活部署應用。

語音算法是占用內存的大戶,通過軟硬融合思必馳知道如何優(yōu)化,經過團隊的交流,成功將內存放到了片內,片內的內存功耗比片外內存功耗小兩個數(shù)量級,對降低功耗起到決定性作用。

在發(fā)布會現(xiàn)場,朱澄宇并沒有介紹芯片的主頻以及 GOP 數(shù)量,他的解釋是,一是芯片在調試,在正式量產會公布;第二,我們提供的是“芯片+算法”的解決方案,給用戶提供良好的體驗,給開發(fā)者帶來最大的放便是產品的最大亮點。

明知造芯難,為何偏要傾力造?
芯片從業(yè)者都明白,芯片是大坑,不是有豪言壯語就能做成,思必馳卻在這個時候發(fā)布了其 AI 芯片。他們?yōu)槭裁匆爸薮蟮娘L險從算法跨越到硬件?是因為國內的造芯熱潮,還是自身的需要?思必馳 CTO、深聰智能 CEO 周偉達分享了思必馳的造芯之路。

人工智能交互技術對芯片的要求很高,第一是計算量,第二是內存,現(xiàn)在芯片的計算能力和存儲空間不能直接提供給消費者來使用,深度學習最早應用于神經網絡首先是在 PC 上實現(xiàn),在客戶端使用先要進行量化,可以量化到定點的 32 位、16 位、8 位,思必馳目前在客戶端的所有定點都是到 8 位,可能會定位到 4 位、2 位、1bit。神經網絡的基礎模型不是類似于馮諾依曼的 CPU 架構,傳遞的是神經沖動,不是浮點數(shù)據,要真正做到類人腦運算,需要考慮高能效、低功耗的人工智能芯片是否能做到 1bit 運算,到最后的運算就不需要存儲了,而是需要數(shù)字邏輯的與非異或,這樣的技術在思必馳的 PC 仿真中已經驗證了,思必馳的技術未來有希望用到更多終端上。但是也發(fā)現(xiàn)了問題:現(xiàn)在的 CPU 以 1byte 為單位,思必馳算法在 CPU、DSP 上沒有優(yōu)勢。于是開始考慮從哪里開始做?

思必馳做芯片第一是因為神經網絡發(fā)展的需求,第二是更多的市場需求,從成立之初到現(xiàn)在,我們已經對接賦能了上千萬套設備,對接了 ARM、DSP、MIPS、MCU 的芯片,存儲空間從幾兆到幾 G,因此非常清楚客戶的需求和瓶頸。我們如何把 AI 算法提供給客戶,這讓我們看到有大量的市場需求,因此,從技術發(fā)展和市場需求來看,做芯片是一條必經之路。

思必馳從 2016 年開始籌劃做面向深度學習的神經網絡芯片,我們在本質上是軟件公司,我們也在思考自己能不能做硬件?因此,我們決定和行業(yè)專家一起合作研發(fā)芯片。從 2016 年到 2017 年一直在尋找合作伙伴,從芯片行業(yè)的 IP 供應商、芯片制造商、芯片生產商、以及做編譯器、操作系統(tǒng)的公司中篩選,整個過程中發(fā)現(xiàn)三個困難:第一,人工智能算法在未來的 5-10 年會不斷發(fā)展,不斷進化、完善,如何做芯片?芯片公司說,你可以告訴我你需要多少算力,多少帶寬,多少內存,剩下的問題交給我來做。但是我們限制,這款芯片是否能達到毫瓦級?在未來物聯(lián)網應用中達到百微瓦甚至十微瓦?大部分公司無法做。CPU 最小做到幾百毫瓦甚至 1W,這需要我們和芯片設計公司深度融合來進行合作,需要我們公司開放算法,需要芯片公司重新架構 CPU 計算單元,這一步很難邁出;第二,我們對接了很多設備了解了需求,把這些需求提交給芯片公司,他們未必認可。第三,未來數(shù)據存在很大的安全隱患,消費者存在信息泄漏風險,我們想研發(fā)芯片做三層數(shù)據安全的保護:第一層加入芯片密碼,只有驗證了芯片密碼,應用才能啟動;第二層用戶加入聲紋,才能啟動芯片進行錄音,傳輸?shù)皆贫?;第三層,隨著芯片計算能力增加,可以在本地做通用的語音的識別,盡可能少在云端傳數(shù)據,通過研發(fā)芯片達到保護個人信息安全。最后,思必馳決定做芯片,而且要軟硬結合做好 AI 芯片。

?

軟硬結合,剛柔并濟
軟硬結合的第一步是把算法變成匯編語言,然后在軟件開發(fā)環(huán)境下進行分析,分析結果發(fā)現(xiàn)大有可為。比如,算法中的四舍五入,用匯編來看,需要判斷、移位、復制等十個步驟,芯片工程師覺得只要一步指令就可以完成,于是算法工程師和硬件工程師一起定制了一套指令,將效率提高了 10 倍。軟硬件工程師一起交流,碰撞出很多火花,這是我們在較短時間內大幅度提升芯片性能的一個方法,第一步通過算法的工程實現(xiàn)、芯片的配置架構和芯片的物理進行初步融合,就達到了全系列麥克風陣列、AI 關鍵字和指令的識別,以及低功耗喚醒的目標。

第二步,將語音算法和基礎 IP 再融合,在做語音算法時考慮到后面的流程,在最底層考慮到前面,進行深層次的融合,可以把芯片的能力和能效再提升一個數(shù)量級,滿足下一代芯片的需求,本地的語音識別、本地的語義識別、安全特征、聲紋特征。第二代芯片的預研發(fā)已經開始。

第三,人機交互的最高境界是擬人化交流,不光需要語音,還需要視覺、運動、味覺、觸覺,需要更深層次的多模態(tài)整合算法,與存儲工藝封裝等融合和優(yōu)化,會用到新的存儲技術做存儲計算。

將來軟硬結合發(fā)展趨勢是通過算法和實現(xiàn),最終生產深度交流,不斷提高芯片的性能,在摩爾定律走到盡頭的背景下,軟硬結合大有可為,人工智能軟硬結合是芯片性能繼續(xù)提升的一個方向。

AI 時代是一個軟件定義硬件的時代
軟件是以天和周為單位進行版本更新,而半導體芯片從產品設計到流片、驗證、封裝、測試,一般周期是一年半到兩年。清華大學魏少軍教授說過,即將到來的 AI 時代是一個軟件定義硬件的時代,是一個算法定義芯片的時代。深聰智能在思必馳強力算法的支持下,優(yōu)勢就是充分做到“軟件+硬件”的融合以及深度優(yōu)化,這已經反映出軟件定義芯片的時代已經到來。深聰智能的成立滿足了從算法到模塊,到平臺到生態(tài)的遷移,思必馳十年的技術積累,已經從一個算法產品公司邁向一個平臺、一個系統(tǒng)、一個生態(tài),打通了云和端,就是欠缺了芯片。

AI+IoT 是下一個十年是所有半導體公司都關注的點。通用芯片開始是為了滿足最大的出貨量,不管是高通、聯(lián)發(fā)科還是海思、展訊,不管瞄準的是手機、TV,還是盒子、白電,他們想要做到的是一款芯片打遍全世界,英特爾控制了 PC 時代,彼此都有標準化;在移動互聯(lián)網時代,即使是安卓、ARM、高通、聯(lián)發(fā)科、海思等,它們對硬件的要求,對軟件的依附都已經被量化,在 AI 時代,專用 IC 才能滿足物聯(lián)網的碎片化需求,借用專用芯片到定制的架構,我們只是將算法和算法模型從通用型芯片移植到專用芯片上,我們強調功耗和專用芯片是為了針對特定的場景、特定的算法、特定的模型量身定做,而不是通用芯片的“削足適履”。

接下來是從專用芯片邁向專用架構,目前的 CPU、FPGA、GPU 并不符合未來神經網絡深度學習的需求,我們從專用芯片到專用架構,就可以反饋回去修改模型,AI 市場是要透過使用者來定義產品,再由把需求反饋給算法,靠算法實現(xiàn) 。

通用芯片無法和數(shù)據產生連接,無法和市場產生連接,無法和算法產生連接,算法是靈魂,芯片是框架,沒有靈魂的框架是產生不了價值的,必須采用專用芯片才能發(fā)揮算法的潛力。芯片需要老司機,深聰智能擁有算法大牛和芯片設計老鳥,軟件和算法的融合才能作出優(yōu)秀的芯片。思必馳面向的是物聯(lián)網,不做“me too”的產品,而是和眾多的合作伙伴一起共贏,迎接 AI 時代的來臨。

與非網原創(chuàng)內容,未經允許,不得轉載!

思必馳

思必馳

思必馳是國內專業(yè)的對話式人工智能平臺公司,擁有全鏈路的智能語音語言技術,自主研發(fā)了新一代人機交互平臺(DUI),和人工智能芯片(TH1520);為車聯(lián)網、IoT及政務、金融等眾多行業(yè)場景合作伙伴提供自然語言交互解決方案。并擁有中英文綜合語音技術。思必馳語音識別、聲紋識別、口語對話系統(tǒng)等技術曾經多次在美國國家標準局、國際研究機構評測中奪得冠軍。

思必馳是國內專業(yè)的對話式人工智能平臺公司,擁有全鏈路的智能語音語言技術,自主研發(fā)了新一代人機交互平臺(DUI),和人工智能芯片(TH1520);為車聯(lián)網、IoT及政務、金融等眾多行業(yè)場景合作伙伴提供自然語言交互解決方案。并擁有中英文綜合語音技術。思必馳語音識別、聲紋識別、口語對話系統(tǒng)等技術曾經多次在美國國家標準局、國際研究機構評測中奪得冠軍。收起

查看更多

相關推薦

電子產業(yè)圖譜