Waymo破天荒公開數據集,發福利還是做生意?

  • 發表于: 2019/06/17 19:19:00 來源:車云網

對于學術界而言,這60萬幀的數據量無異于稀世珍寶。

對自家技術一貫守口如瓶的Waymo,今年突然對“外部力量”張開了懷抱。

在全球最大的計算機視覺會議CVPR 2019現場,Waymo首席科學家Drago Anguelov公開了自家的自動駕駛數據集Waymo Open Dataset。作為公司研究院老大,Drago Anguelov同時預告了幾個關鍵數字:3000段駕駛記錄、時長共16.7小時、平均每段長度約為20秒;60萬幀、共有大約2500萬3D邊界框、2200萬2D邊界框,以及多樣化的自動駕駛場景。

事實上,在Waymo Open Dataset之前,自動駕駛領域中已經存在幾個比較知名的數據集。其中,KITTI被公認為使用最廣泛的數據集之一,Cityscapes的專長是城市街景的語義理解,ApolloScape則以標注的精細程度著稱,還有UC Berkley最新發布的BDD100K等等。

自動駕駛公開數據集對比自動駕駛公開數據集對比

然而,這些優勢在Waymo眼里似乎都不值一提。Drago Anguelov在演講中列了一個表格,條分縷析地將Waymo Open Dataset與KITTI、NuScenes等數據集直接進行對標:

數據集對比,圖片來自“機器之心”數據集對比,圖片來自“機器之心”

直觀地說,主流數據集提供的數據量已經遠遠不夠用了。因此,Drago Anguelov稱,Waymo 將在7月份發布1K數據集,且將在近期公布數據集基準并組織競賽。

目前為止,Waymo Open Dataset的細節內容尚未公開。單從數據量的對比來看,該數據集就已經比現有的公開三維標注數據集領先了好幾個身位,基本是兩位數與個位數的差距。當然,Waymo自己的全量數據應該已經到達近億級別。

對于學術界而言,這60萬幀的數據量無異于稀世珍寶。受限于數據與傳感器兼容的問題,學校實驗室大概率會在Waymo的傳感器配置基礎上展開科研工作,也不排除其最終找到適用于其他類似傳感器搭配的方案。

但最重要的是,一旦這些科研成果能夠形成一個影響力廣泛的數據集,其上的研究成果全部都適用于Waymo自家傳感器配置,這家科技大牛完全可以輕松吸收最新的無人駕駛技術。更何況,這某種程度上也能夠推動無人駕駛方向的人才培養,甚至可以造福整個行業。

可換個角度看,這件事的意義卻并沒有這么樂觀。Waymo對于傳感器設置的嚴格把控,意味著如果其賦予一些超特殊的、難以復現的屬性,那么其他無人車公司從這些基于Waymo數據的科研成果中得不到半點好處。此外,Waymo Open Dataset的數據分布大概率位于美國地區,那么受法律法規限制,此上訓練出的深度學習模型也不見得能夠適用于其他國家地區。

最根本的一點是,現階段Waymo公布出的數據量級仍舊滿足不了工業界的胃口。雖然其多少能夠緩解初創公司在數據標注層面的時間和經濟壓力,但僅僅16個小時的資源也無法支持一個年輕的團隊從0做出一個可以上路的無人車Demo,更別提試圖以此博取資本市場的青睞。

因此對于汽車工業而言,仍舊需要依靠從業者長期的數據積累,Waymo Open Dataset現階段的數據量不足以說明問題。而且對于當下最稀缺的3D激光點云標注數據,Waymo目前的貢獻值幾乎是寥寥無幾。

除了發布數據集,Waymo也同時曝光了無人車傳感器配置,包括視覺系統、激光雷達系統和雷達系統。而Waymo Open Dataset也將同步涉及到來自5個激光雷達、5個攝像頭,激光雷達和攝像頭的數據。

換句話說,隨著本次數據集的公開,Waymo自家傳感器的所有性能將一覽無遺。友商甚至可以直接進行評測:噪點多不多、遠處物體距離準不準、除了距離和信號強度外還有沒有其它信息……

那么,如果Waymo后續將延用“對外出售激光雷達”的策略,打算繼續拿其他傳感器部件掙錢,Waymo Open Dataset的開放便會揭開Waymo無人車上最大一塊“遮羞布”。

相關標簽:
自動駕駛
  • 車云星
  • 空間站
  • 福特星球
  • 蟲洞

加料 /

人評論 | 人參與 登錄
查看更多評論
天津快乐十分软件