對于光學領域研究者而言,是蘋果開啟了新一個創業風口的大門。因為 iPhone X,“3D 視覺”開始在商用市場更快速地有了姓名。


去年以來,以阿里為代表的互聯網巨頭開始頻密加碼“刷臉支付”,“刷臉”這個詞也開始進入更多公眾場景中,如酒店,甚至地鐵和高鐵閘機等。


手機則是產業鏈廠商繞不過的另一個巨大市場,但目前囿于成本、應用等問題,要大規模推開還需一定時間。


這也一定程度造就了資本市場對這個領域創業公司的不斷加持。如為 OPPO 提供硬件模組的廠商奧比中光,在 2018 年中旬獲得螞蟻金服領投的 2 億美元 D 輪融資。此后,奧比中光與螞蟻金服成立合資公司螞里奧,開始專攻線下市場的 3D 攝像頭解決方案。


近日,光鑒科技也宣布完成 1500 萬美元 A 輪融資。由雙湖資本和軟銀中國資本(SBCVC)共同領投,信中利跟投,老股東北極光和松禾資本也在加注。據悉,鏡頭模組廠商舜宇光學旗下的舜宇 V 基金也參與了光鑒此前的一輪融資。


對于業內人士而言,近兩年才走向加速爆發的 3D 視覺仍處在較為初級的發展階段。作為正式將 3D 視覺帶向大眾市場的蘋果,在 6 月初的 WWDC 大會上,還宣布正不斷精進用戶體驗。


隨著 5G 商用的開啟,更高精度的信息得以高速傳遞、承載在云端的算力得以低延遲傳輸至智能終端,3D 視覺市場也將借此帶來更大應用空間。


底層技術比拼
3D 視覺的技術包含三種主要落地方式:結構光、TOF(飛行時間)和雙目。其中前二者是廠商主要著力投入的方向,雙目技術則提及較少。


但再往深入分析,從更加底層的物理原理層面,除了蘋果陣營帶領的衍射技術之外,以納米光學為底層原理的技術也帶來新的商用空間。


光鑒科技 CTO 汪博日前接受 21 世紀經濟報道記者專訪時介紹道,從 17 世紀開始,衍射便成為光學的主流研究方向。而目前以蘋果公司為代表主導的 3D 結構光技術正是利用了衍射光斑投射在被測物體上,傳感器根據接收到的形變信息收集數據并在數字世界形成空間深度信息。


而經歷了 50 余年半導體行業的快速發展,電學遵循摩爾定律在器件尺寸上不斷縮小,進入納米尺寸。至此,基于微納米技術的納米光學技術開始興起。


汪博向記者分析,如蘋果用的是極為復雜的衍射光柵和一系列激光器,打出來 3 萬個點作為投射。“投射出的光束越多,對空間的探測也會越精細。”但國內的一些方案多為簡化版,包括投射點數在內的技術指標會比蘋果偏低,比如多為投射出 1.5-1.8 萬個激光點。


“這相當于蘋果一半左右的投射密度,因此精準度會有所缺失。當然也是出于成本考慮。對安卓機本身,消費者能夠接受的價格范圍也相對低。”汪博續稱,以衍射的技術路徑來看,3 萬個點的投射成本實際上不僅是 1.5 萬個透射點的翻倍,在此基礎上還需考慮如此龐大的激光點能同時高效完成既定工作,這是另一個良率方面的工作難點。


“不同的技術原理導致 3D 視覺技術可以采用的光學器件和成本也有所不同。“汪博表示,由于納米光學技術能同時控制投射后的光束,因此投射出 1.5 萬個點和 3 萬個點的成本相對接近。


集邦咨詢(TrendForce) 分析師蔡卓卲則向 21 世紀經濟報道記者分析道,在同樣的方案設計和規格下,Apple 具備技術和專利優勢,尤其是針對行動裝置的應用情境,所以在感測表現上 Apple 會略勝一籌;至于安全性則不止感測部分,還包含了手機內部的軟件與其他芯片的支援,因此無法直接從 3D 感測的方案來做比較。


汪博告訴 21 世紀經濟報道記者,目前 3D 視覺的分辨率、精度仍不夠,圖像噪聲也還較大。“比如能夠恢復物品模型到多細致的程度,探測距離能達到多遠等,是我們在一代一代演進技術的核心邏輯。”不過他也指出,“現在是 3D 視覺非常早期的階段。大家在意的是,誰能做出更好的效果,而不是在一個給定效果下,誰的成本更低。”


5G 打開應用想象
“刷臉”以及背后產生的一系列商用數據,正在快速打開智能世界的大門。


汪博告訴記者,今年可以看到 3D 視覺起量的場景是線下人臉支付,具備 3D 人臉識別功能的智能門鎖場景,以及包括高鐵、地鐵在內的公共通行市場。此外,一些電商平臺也希望通過 3D 商品掃描的方式,提供消費者相對實景的體驗感。AR/VR 則是未來會有起量機會的剛需場景。“我們希望集中精力在消費級市場先做起來,把核心的幾條產品線跑通后,未來在拓展邊界的時候再推向自動駕駛等市場。”


尤其在智能門鎖方面,行業中不斷被曝出的 2D 代替 3D 等安全性問題被愈發關注。汪博指出,“現在還處在早期,隨著市場逐步成長,市場會更加規范化。”


至于在手機端的推進進程,蔡卓卲指出,Apple 陣營會積極往 3D 感測發展,前鏡頭采用結構光技術,用途在刷臉解鎖與支付,搭配 Apple Pay;預估后置 TOF 方案在明年就可以看到,搭配著 Apple 這段時間在軟件上的努力發展,會有更多 AR 應用出現。


但對非蘋陣營來說,商湯、曠視等算法公司在發展適合中低階手機的影像辨識算法,因此部分 AR 穿衣、人臉辨識等功能會由既有的 RGB 相機模塊來感測,但受困于成本難題,3D 感測模塊將難以普及到中低階手機。在高端手機部分,可能要等到 2020 年 Apple 產品搭載后置 TOF 方案后,各家品牌廠商才會轉為積極跟進。


2019 年 5G 商用的正式落地,則是從技術層面又推了一把,從算力和數據傳輸層面帶來更大想象空間。


“5G 其實對 3D 視覺、AR/VR 是鋪平了基礎通訊的架構。簡單來說,5G 為各種移動設備提供了快速且強大的計算平臺,從用戶體驗上感覺到的最大差別,就是有更多炫酷的功能、APP 可以做。”汪博指出,光鑒科技也已有相關研發準備,比如未來云網融合對整體算法架構也會帶來改變。


“整個設計架構會不一樣,我們可以把一部分更復雜的運算內容放到云端完成,這可以幫助我們用同樣的材料做到更好地渲染、傳播。此外,不同的算法如何拆分是需要思考的問題,包括數據在本地做怎樣的預處理,如何改進壓縮、哪些數據上傳云端等。當然,短期內我們還是集中精力做本身跟攝像頭、跟端側相關的事情。”他如此表示。


在算法技術供應商眼里,其想象空間將更加可觀。

 

近日在 21 世紀經濟報道主辦的“觸摸智造——2019 中國制造業價值發現之旅”走訪中,深圳極視角科技劉若水就提到,“我們的預想是,未來用戶希望用到什么樣的計算機視覺算法,就可以直接下載到終端使用。不管是服務器、電腦、手機、攝像頭都可以這樣操作。只要相應的場景或者算力能夠滿足算法需求。而不是像現在做項目過程中,會不斷需要安裝相應攝像頭,這其實對硬件有很大消耗。我們希望未來在計算機視覺市場,可以搭建類似 APP store 的應用平臺,可以直接將相關算法下載到硬件中使用。”


深圳云天勵飛副總裁鄭文先則向 21 世紀經濟報道記者表示,5G 會主要帶來應用場景和多技術融合的兩方面變化。


“5G 時代會令今天很多場景不斷更加被分解、細化,在此過程中,帶來算法的迭代和演進,要配合更多應用去構建更加符合 5G 場景應用的算法。而未來 5G 時代到來會使 AI 和 IoT 有更緊密的結合,5G+AI+IoT 將是未來 5-10 年的主流技術趨勢。”他進而分析道,物聯網(IoT)通過無數傳感器構建 了感知層,獲取到豐富的數據;5G 則是 作為傳輸層,解決數據低延遲、高效傳 輸到云端或邊緣端的問題;AI 在智慧 分析層面,通過算法進行精準的數據 決策和分析。“這打通了層次鮮明的感知 - 傳輸 - 分析三個層面,我相信會帶 來更大場景的應用。”