買(mǎi)房 / 租房人累、經(jīng)紀(jì)人苦、業(yè)主難,傳統(tǒng)看房模式中的沉疴積蓄已久。為從根本上解決消費(fèi)者在看房上的痛點(diǎn),降低消費(fèi)者的時(shí)間成本與交通成本,提高經(jīng)紀(jì)人帶看效率,貝殼找房如視團(tuán)隊(duì)提出了以三維重建技術(shù)為核心的技術(shù)解決方案,并推出了一系列 VR 看房產(chǎn)品。成立近 2 年來(lái),如視團(tuán)隊(duì)完成了從 0 到 1 的蛻變,截至目前,如視 VR 已覆蓋全國(guó) 120 多個(gè)城市,累計(jì)掃描重建 VR 房源超過(guò) 300 萬(wàn)套,用戶(hù)使用 VR 看房累計(jì)超過(guò) 5 億次,成為目前國(guó)內(nèi)最大的空間實(shí)景三維重建服務(wù)商。靚麗的成績(jī)單背后,如視團(tuán)隊(duì)強(qiáng)大的技術(shù)實(shí)力功不可沒(méi)。
大步快跑,如視 VR 從 0-1
在如視成立之前,貝殼技術(shù)副總裁、如視事業(yè)部總經(jīng)理惠新宸就做了詳盡的調(diào)研。當(dāng)時(shí) 3D 建模技術(shù)已發(fā)展相對(duì)成熟,流行的技術(shù)方式主要有全景照片、序列幀、結(jié)構(gòu)光三維重建等。經(jīng)過(guò)調(diào)研對(duì)比后的結(jié)論認(rèn)為:全景照片方式無(wú)法滿(mǎn)足精確測(cè)量的要求;序列幀方式本質(zhì)上還是 2D,難以給 C 端用戶(hù)帶來(lái)沉浸式體驗(yàn),且后續(xù)的數(shù)據(jù)價(jià)值不大。
團(tuán)隊(duì)最終決定采用結(jié)構(gòu)光 VR 方式打造 3D 房源。“我希望不止給用戶(hù)展示 360 度全景照片,更希望為其呈現(xiàn)具有空間感、方位感的 VR 看房,并且更重要的是數(shù)據(jù)價(jià)值,VR 看房只是三維重建產(chǎn)品化的第一層價(jià)值,埋在三維重建后的數(shù)據(jù)價(jià)值才是我認(rèn)為更重要的”,惠新宸表示。
成立近 2 年來(lái),如視團(tuán)隊(duì)一直保持著“大步快跑”的研發(fā)節(jié)奏,陸續(xù)推出了大量面向 B 端的產(chǎn)品,比如黎曼相機(jī)、如視 Lite 等 VR 采集設(shè)備;以及面向 C 端的產(chǎn)品,比如 VR 看房、VR 講房、VR 帶看、貝殼未來(lái)家等。
官方提供的數(shù)據(jù)顯示,通過(guò) VR 看房,用戶(hù)人均停留時(shí)長(zhǎng)增加了 210%,房源約看量增加了 138%,經(jīng)紀(jì)人帶看效率增加了 13%。
領(lǐng)先源于每一步都走得扎實(shí)
在研發(fā)力量保障上,如視團(tuán)隊(duì)匯集了一大批頂級(jí)技術(shù)專(zhuān)家,占比近如視總?cè)藬?shù)七成;菪洛废 InfoQ 表示,如視的三維重建技術(shù)在業(yè)內(nèi)的優(yōu)勢(shì)經(jīng)過(guò)了大規(guī)模工程落地的驗(yàn)證。如視的 VR 掃描設(shè)備穩(wěn)定性強(qiáng),在過(guò)去一年多時(shí)間里采集了 300 多萬(wàn)套 VR 數(shù)據(jù),并以每天近 1 萬(wàn)套的速度持續(xù)增長(zhǎng),在海量的數(shù)據(jù)基礎(chǔ)上疊加了眾多技術(shù)創(chuàng)新,自動(dòng)化程度較高。
自深度學(xué)習(xí)出現(xiàn)之后,基于數(shù)據(jù)驅(qū)動(dòng)方式對(duì)圖像做三維重建在學(xué)界和工業(yè)界流行開(kāi)來(lái)。如視算法架構(gòu)師潘慈輝介紹,在海量房源空間數(shù)據(jù)集的基礎(chǔ)上,如視利用深度學(xué)習(xí)代替人工,通過(guò)設(shè)計(jì)合適的神經(jīng)網(wǎng)絡(luò),充分利用全景圖區(qū)別于普通圖片的特點(diǎn),用神經(jīng)網(wǎng)絡(luò)結(jié)合傳統(tǒng)方法求解深度值的近似解,從而實(shí)現(xiàn)了良好的三維重建效果。在房屋的三維模型上,主要運(yùn)用到了傳統(tǒng)計(jì)算機(jī)視覺(jué)及深度學(xué)習(xí)中的多視幾何和識(shí)別分割檢測(cè)等技術(shù)。
如視三維重建
此外如視在戶(hù)型圖自動(dòng)生成方面也大量運(yùn)用到了 AI 技術(shù),包括深度學(xué)習(xí)網(wǎng)絡(luò)、GAN、數(shù)據(jù)標(biāo)注、圖像分割、圖像識(shí)別等。圖像識(shí)別技術(shù)的應(yīng)用具體包括對(duì)房屋內(nèi)標(biāo)志性物品的識(shí)別,房間結(jié)構(gòu)俯視圖的識(shí)別等。據(jù)潘慈輝介紹,如視自動(dòng)戶(hù)型圖的研發(fā)過(guò)程前后歷經(jīng)四個(gè)版本,每個(gè)版本并非單純?cè)谇耙粋(gè)版本基礎(chǔ)上迭代,而是會(huì)嘗試新的創(chuàng)意和想法,包括通過(guò)深度學(xué)習(xí)實(shí)現(xiàn)房間與房間之間的區(qū)分,利用對(duì)抗神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)端到端的戶(hù)型圖生成,用單張全景圖端到端生成單一房間的戶(hù)型結(jié)構(gòu)等等,最終,他的團(tuán)隊(duì)采用了多種方法融合的方式呈現(xiàn)自動(dòng)戶(hù)型圖。
300 萬(wàn)套 VR 房源數(shù)據(jù)是保持優(yōu)勢(shì)的“護(hù)城河”
目前如視團(tuán)隊(duì)的技術(shù)和產(chǎn)品實(shí)力很大程度上集成于如視 Lite 這款新品上。如視 Lite 自今年 11 月正式發(fā)布,是加速房源 3D 化的又一利器。
據(jù)悉,如視 Lite 基于對(duì) 300 多萬(wàn)套 VR 房源數(shù)據(jù)的深度學(xué)習(xí),利用單目圖像深度估算技術(shù),將二維的房屋圖片賦予三維的“深度”,實(shí)現(xiàn)對(duì)距離遠(yuǎn)近和方位的感知。
潘慈輝表示,目前在市面上還沒(méi)有出現(xiàn)一款跟如視 Lite 類(lèi)似的產(chǎn)品,它舍棄了深度測(cè)量,卻又能提供一個(gè)真正三維的模型。上述功能的實(shí)現(xiàn)正是基于如視的算法和數(shù)據(jù)壁壘。
數(shù)據(jù)是如視領(lǐng)先于競(jìng)品和保持行業(yè)頭部?jī)?yōu)勢(shì)的重要“護(hù)城河”。
如視算法架構(gòu)師顧曉東認(rèn)為,這 300 多萬(wàn) VR 數(shù)據(jù)為如視 Lite 的三維建模打下了堅(jiān)實(shí)基礎(chǔ)。結(jié)合最新的 AI 技術(shù),利用這些海量數(shù)據(jù)來(lái)增強(qiáng)對(duì)二維、三維目標(biāo)的檢測(cè)識(shí)別和分割,增強(qiáng)在房屋結(jié)構(gòu)理解、戶(hù)型圖自動(dòng)生成、房屋三維模型優(yōu)化等方面的能力。反過(guò)來(lái),這些能力的增強(qiáng)也會(huì)令數(shù)據(jù)采集的過(guò)程更方便、快捷。
數(shù)據(jù)是重要的財(cái)富,深度學(xué)習(xí)尤其依賴(lài)大數(shù)據(jù)!叭绻麤](méi)有數(shù)據(jù),拿不出有效的模型,那嚴(yán)格來(lái)說(shuō),算不上對(duì)一項(xiàng)技術(shù)做到真正掌握。深入到應(yīng)用之后,你便會(huì)發(fā)現(xiàn)這個(gè)環(huán)節(jié)是非常依賴(lài)數(shù)據(jù)的”,顧曉東表示。
在落地應(yīng)用的“戰(zhàn)場(chǎng)”上能否站穩(wěn)腳跟取決于前期的數(shù)據(jù)積累,必備的“功課”不能落下。在 VR 看房賽道上,尚有許多玩家缺乏同如視一樣多維且全面的 VR 數(shù)據(jù)積累。
單目圖像深度估計(jì)帶來(lái)的技術(shù)領(lǐng)先
由于缺乏數(shù)據(jù)根基,現(xiàn)在市面上的一些 VR 看房產(chǎn)品存在“濫竽充數(shù)”現(xiàn)象,一些商家利用人視覺(jué)的上的“腦補(bǔ)”功能,通過(guò)提供 2.5D 模型,也即室內(nèi)只有墻體是立體的,其他物品是用全景圖片模擬,創(chuàng)造出了一種“偽 3D”的錯(cuò)覺(jué)。消費(fèi)者從某一角度乍看上去這些物體是正常形態(tài),但從其他角度看就會(huì)變形,并不立體。
惠新宸認(rèn)為,這些取巧的做法并不是真正的 3D,更不能稱(chēng)之為“三維重建”。更明顯的短板是,數(shù)據(jù)價(jià)值不足以支撐后續(xù)的技術(shù)延展。
在如視 VR 看房界面,每切換到一個(gè)場(chǎng)景,所有的室內(nèi)物品均以三維模型形式呈現(xiàn),且具備長(zhǎng)寬高等深度數(shù)據(jù)。單目圖像深度估計(jì)技術(shù)是如視 Lite 產(chǎn)品達(dá)到“深度”的關(guān)鍵。據(jù)了解,這是如視在 VR 看房領(lǐng)域的優(yōu)勢(shì)技術(shù)。
所謂單目圖像深度估計(jì),就是從單張圖片出發(fā),估計(jì)深度值的算法。潘慈輝介紹,這是一個(gè)病態(tài)問(wèn)題,沒(méi)有確切解。例如,當(dāng)靠近了拍汽車(chē)模型和離遠(yuǎn)了拍真實(shí)的汽車(chē)能得到完全相同的圖片。但某些特定的場(chǎng)景下,是可以求得不同程度的近似解的。潘慈輝進(jìn)一步介紹,針對(duì)室內(nèi)場(chǎng)景的全景圖片,人類(lèi)可以一定程度上求近似解。利用估計(jì)消失點(diǎn),并結(jié)合全景圖片的拍攝高度可以人工估計(jì)房間中線(xiàn)段的長(zhǎng)度,從而獲取房屋結(jié)構(gòu)即墻、天花板和地面的尺寸和深度;結(jié)合人類(lèi)對(duì)家具、小物品的先驗(yàn)知識(shí),可以估計(jì)圖片中各類(lèi)物體的尺寸和深度。然而這整個(gè)人工流程全部發(fā)生在人的大腦和手工演算中;如視基于海量的數(shù)據(jù)積累,可以自然地越過(guò)這個(gè)流程,讓深度神經(jīng)網(wǎng)絡(luò)仿照上述人腦的方式,自動(dòng)地得到和人類(lèi)經(jīng)驗(yàn)相近甚至更優(yōu)的解。
如果說(shuō)數(shù)據(jù)積累是實(shí)現(xiàn)“真 VR”的第一步,那么數(shù)據(jù)單目深度估算技術(shù)便是第二步,前面兩步走扎實(shí)了,才有了如視 Lite 輕量化的自若。這有點(diǎn)兒像蓋房子,要先打好地基。
在最初技術(shù)路徑選擇的時(shí)候,數(shù)據(jù)價(jià)值就被如視團(tuán)隊(duì)列入了首要衡量指標(biāo),F(xiàn)在再回過(guò)頭來(lái)看,這個(gè)選擇無(wú)疑是正確的。盡管后來(lái)追隨者和模仿者蜂擁出現(xiàn),但幾無(wú)超越者。
海量落地場(chǎng)景形成閉環(huán)
在技術(shù)硬實(shí)力之外,場(chǎng)景化落地是如視的另一大優(yōu)勢(shì)。
剛推出不到半月的如視 Lite,率先落地到天津后,截止 11 月 26 日,累計(jì)拍攝量為 4373,外網(wǎng)展示量 1927,外網(wǎng)覆蓋率 9%。如視 Lite 的租賃業(yè)務(wù)現(xiàn)已全國(guó)開(kāi)放拍攝,試點(diǎn)區(qū)域的商機(jī)高于房源滲透 13%,由商機(jī)到成交,高于普通房源 30%。
貝殼 VR 看房
值得一提的是,在應(yīng)用落地上,如視采用了“軟硬件一體化”的差異化打法。
如視的一系列 VR 掃描設(shè)備均系自主研發(fā),而非采用外部的 VR 設(shè)備。如視硬件渠道部負(fù)責(zé)人施文博表示,之所以選擇自研硬件,一方面希望能采集到更多維的數(shù)據(jù),更好的滿(mǎn)足用戶(hù)體驗(yàn),另一方面是出于規(guī);慨a(chǎn)的需要。從黎曼相機(jī)到如視 Lite,如視團(tuán)隊(duì)還在探索擴(kuò)寬數(shù)據(jù)采集的方式和種類(lèi),找到多種異質(zhì)化和定制化的數(shù)據(jù)采集方式,以滿(mǎn)足不同的需求和應(yīng)用場(chǎng)景。施文博透露,新一代激光掃描設(shè)備將于 2020 年量產(chǎn),該設(shè)備除了精度更高、采集距離更遠(yuǎn),同時(shí)將采集空間中各物體在 905nm 波段紅外光的反射率信息,對(duì)于物品識(shí)別、物體分割等有較大幫助。
如視 Lite 能力升級(jí)的同時(shí),在“降成本“上表現(xiàn)出色。相對(duì)黎曼相機(jī),如視 Lite 主打輕量化 VR 采集,用普通的相機(jī)即可拍出 VR 房源。如視 Lite 成本更低、操作更簡(jiǎn)單、基本不需人工的干預(yù),還支持接入各種硬件平臺(tái)。在應(yīng)用場(chǎng)景上也更加多元,成本更低的如視 Lite 將運(yùn)用在酒店、租賃等細(xì)分場(chǎng)景。
貝殼找房在房地產(chǎn)領(lǐng)域十幾年沉淀積累下的場(chǎng)景優(yōu)勢(shì),是如視 VR 產(chǎn)品快速落地的關(guān)鍵。也正是這種基因,這支年輕的技術(shù)團(tuán)隊(duì)格外關(guān)注如何把技術(shù)真正落地到場(chǎng)景中去。
核心算法怎么能與工程落地更好結(jié)合?這是如視研發(fā)人員每天都在思考的問(wèn)題。潘慈輝認(rèn)為,一段核心算法,可能在某些特定約束條件下已經(jīng)達(dá)到了非常出色的效果,但要實(shí)現(xiàn)落地轉(zhuǎn)化、達(dá)到穩(wěn)定可用,還需要在工程上做很多嘗試與調(diào)優(yōu),甚至需要結(jié)合新的算法以達(dá)到整體效果的提升。
最近兩年,AI 熱潮漸趨冷靜后迎來(lái)了價(jià)值驗(yàn)證期,而價(jià)值驗(yàn)證的核心標(biāo)準(zhǔn)在于落地;菪洛穼(duì)此深有感觸,他談到,自己接觸到的一些 AI 創(chuàng)業(yè)者直呼‘創(chuàng)業(yè)太難了’,因?yàn)檎也坏綀?chǎng)景。“有場(chǎng)景是很重要的點(diǎn),當(dāng)技術(shù)和產(chǎn)品實(shí)際運(yùn)用到場(chǎng)景里,才標(biāo)志著它是能帶來(lái)價(jià)值的,而不僅僅是噱頭”。
硬件、技術(shù)、場(chǎng)景是相輔相成的。接下來(lái),如視在深耕上下游產(chǎn)業(yè)鏈的同時(shí),還將加速布局生態(tài)鏈,將其積淀的技術(shù)能力向全行業(yè)開(kāi)放賦能。
嘉賓介紹
惠新宸(鳥(niǎo)哥),國(guó)內(nèi)最有影響力的 PHP 技術(shù)專(zhuān)家,PHP 開(kāi)發(fā)組核心成員,現(xiàn)任貝殼找房技術(shù)副總裁、如視事業(yè)部總經(jīng)理,負(fù)責(zé)貝殼·如視 VR 看房、AI 講房、貝殼未來(lái)家等產(chǎn)品的研發(fā)和落地,以技術(shù)探索推動(dòng)居住服務(wù)行業(yè)進(jìn)步的更多可能性。
潘慈輝,如視算法架構(gòu)師,法國(guó)國(guó)立信息與自動(dòng)化研究所博士后。曾在大疆、優(yōu)必選從事算法研發(fā)工作,熱衷技術(shù)研究,對(duì)三維視覺(jué)、機(jī)器人定位建圖、工程實(shí)際落地有豐富經(jīng)驗(yàn)。
施文博,如視硬件渠道部負(fù)責(zé)人,原 Auto3D 創(chuàng)始人。后加入如視,致力于使用軟硬件一體的解決方案解決行業(yè)痛點(diǎn)、提升行業(yè)效率。
顧曉東,如視算法架構(gòu)師,中國(guó)科技大學(xué)本碩博連讀,曾先后任職于微軟亞洲研究院和 Technicolor 北京研究院。致力于深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)方向的學(xué)習(xí)和研發(fā)工作。