4月23日,第二十一屆上海國際汽車工業展覽會開幕,AI成為今年本屆上海車展的關鍵詞之一。車展前夕,騰訊推出座艙端側大模型,基于混元2B(B為十億)小參數模型;英特爾首次參加車展并與面壁智能共同研發端側原生智能座艙;寶馬則在車展期間宣布DeepSeek年內將搭載于多款在售新車。
今年年初,面壁智能CEO李大海就告訴第一財經記者,比較主要的終端設備中,汽車和手機是今年AI落地最好的場景。記者了解到,近期大模型廠商對于智能座艙AI落地的考慮更具象化了。
騰訊智慧出行副總裁鐘學丹告訴記者,騰訊的端側模型和Agent(智能體)已在跟多家車企合作,車的量產還需要一段時間。端側模型在本地推理,可分析用戶當下需求,提供駕駛行為建議、車輛操作指導等,并在遇到復雜問題時尋求云端模型支持。
具體而言,騰訊在智能座艙場景將Agent等大模型能力與社交、娛樂生態結合。“駕駛中語音指令‘點一杯大杯拿鐵’,Agent就知道用戶喜歡的咖啡店和咖啡種類,并調用咖啡品牌的車載微信小程序,選擇最近的咖啡店,用戶順路取餐。” 騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生舉例稱。
值得注意的是,汽車座艙端側模型也有能力邊界。鐘學丹表示,2B模型很難具備很強的推理能力,推理能力是通過云端其他模型引入。問答對話在車上本就不是一個很好的應用場景,端側模型會更多聚焦用戶行為、意圖的識別和判斷,而不是聚焦于問答。
大模型廠商還需要應對AI幻覺問題。鐘學丹告訴記者,大模型運行的本質是預測下一個token(詞元),無法做到100%精準,要減少端側模型的幻覺問題,一方面要將行業相關數據加入模型訓練,此外則是增強知識理解能力,以提升端側模型的精準度。
此外,端側模型落地汽車座艙,算力也需要具備足夠的條件。鐘學丹告訴記者,落地車端的節奏取決于兩個因素,一是車端算力,二是端側模型與應用結合的進展。即便是小參數模型,也對車端算力提出要求。2B小參數模型未經極限測試,搭載于車上不僅需要考慮算力支撐情況,也要考慮車內應用和系統資源消耗的情況,預計運行在類似高通8295這樣的芯片上體驗較好,在算力較低的車上還很難有較好體驗。
高通8295芯片的NPU算力為30TOPS。記者了解到,考慮到本地運行需求,智能座艙、手機搭載的大模型參數量較小,多為幾十億參數。這既與芯片的算力限制有關,也與功耗相關,如果模型過大會加快電量消耗。
不僅智能座艙引入端側模型對車端算力提出要求,一些業內人士近期也注意到,端到端模型在智能駕駛領域的推廣也帶來了算力消耗增加。
“業界普遍預測,模塊化的端到端(模型)將在年內量產上車,而one-model(一個統一模型)端到端模型也預計在2026或2027年量產。智能駕駛從原有的規則驅動走向了數據驅動范式。”鐘學丹稱。湯道生稱,端到端模型處理的數據量將是過去的10倍以上。
元戎啟行CEO周光則將智能駕駛技術與大語言模型做類比。他表示,ChatGPT面世前的語言模型是弱專家系統,ChatGPT面世后大模型明顯提升了通才能力,近期大模型則走向垂直領域,變成強專家系統,例如在數學、物理等領域達到博士水平。
“今天的智能駕駛技術還在弱專家系統階段,下一步將進入通才階段,通用化是走向強專家系統的必經之路。自動駕駛廠商希望達到的L5級自動駕駛,對應的是強專家系統。”周光表示,機器人和自動駕駛落后大語言模型一到兩年時間,現在即將進入通才階段,這個階段的智能駕駛神經網絡是典型的VLA(視覺語言動作模型)架構,具備思維鏈能力,未來對算力的要求將會增長。
幫企客致力于為您提供最新最全的財經資訊,想了解更多行業動態,歡迎關注本站。鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。