• 視聽(tīng)號(hào)

  • 我在現(xiàn)場(chǎng)

  • 微視頻

  • 視聽(tīng)E刊

  • 積分商城

  • 登陸/注冊(cè)
  • 首頁(yè)
  • 資訊
  • 產(chǎn)品
  • 企業(yè)
  • 訪談
  • 會(huì)議
  • 展會(huì)
  • 招標(biāo)
  • 案例
  • 人才
  • 技術(shù)
  • 商情
  • 專(zhuān)題
  • 論壇
  • 視聽(tīng)●時(shí)尚
  • 耳機(jī)
  •  
  • 直播
  •  
  • 智能音響
  • VR眼鏡
  •  
  •  
  • 投影機(jī)器人
  • 藍(lán)牙音箱
  •  
  • 微投
  •  
  • 播放器
  • 視聽(tīng)●發(fā)燒
    視聽(tīng)●家庭
    視聽(tīng)●商用
    視聽(tīng)●工程
    視聽(tīng)●集成
    中國(guó)視聽(tīng)網(wǎng)(chennai-servicecenter.com) > 行業(yè)資訊 > 視聽(tīng)信息(LED大屏) > 數(shù)碼視訊AI感知多模態(tài) 讓機(jī)器人擁有“看懂”世界的眼睛
    數(shù)碼視訊AI感知多模態(tài) 讓機(jī)器人擁有“看懂”世界的眼睛
    更新:2025-12-3 15:17:16 稿件:數(shù)碼視訊 調(diào)整大小:【


    長(zhǎng)期以來(lái),機(jī)器人視覺(jué)主要依賴(lài)單一攝像頭或簡(jiǎn)單圖像識(shí)別算法,在光線變化劇烈、遮擋復(fù)雜、目標(biāo)多樣的真實(shí)場(chǎng)景中,往往“力不從心”。面臨識(shí)別不穩(wěn)定、誤報(bào)率高、難以理解語(yǔ)義意圖等問(wèn)題。在機(jī)器人、智能制造和智慧城市加速發(fā)展的今天,視覺(jué)能力已經(jīng)成為機(jī)器人“智慧程度”的關(guān)鍵衡量指標(biāo)之一。

    構(gòu)建“感知+理解+決策”的綜合處理能力

    數(shù)碼視訊(股票代碼:300079)依托多年視頻與AI技術(shù)沉淀,積極推進(jìn)“AI感知多模態(tài)”機(jī)器人視覺(jué)解決方案,為各類(lèi)機(jī)器人提供從“看得見(jiàn)”到“看得懂”的新一代感知底座。公司研發(fā)中的AI感知多模態(tài)方案,通過(guò)融合視覺(jué)、語(yǔ)音、深度信息以及各類(lèi)環(huán)境傳感器數(shù)據(jù),讓機(jī)器人不再只依賴(lài)“單一畫(huà)面”,而是擁有一套更接近人類(lèi)的“感知+理解+決策”的綜合處理能力。

    從感知層上,方案支持多類(lèi)型攝像頭、相機(jī)、麥克風(fēng)陣列、雷達(dá)等多種傳感器接入,實(shí)現(xiàn)圖像、語(yǔ)音、距離、運(yùn)動(dòng)狀態(tài)等多源數(shù)據(jù)采集;在理解層,基于多模態(tài)融合模型,將視覺(jué)、語(yǔ)音指令和場(chǎng)景語(yǔ)義進(jìn)行統(tǒng)一特征對(duì)齊與融合,完成目標(biāo)識(shí)別、場(chǎng)景解析、行為理解等任務(wù),為上層業(yè)務(wù)提供結(jié)構(gòu)化感知結(jié)果;在決策層,結(jié)合機(jī)器人運(yùn)動(dòng)控制與業(yè)務(wù)邏輯,對(duì)路徑規(guī)劃、抓取動(dòng)作、人機(jī)交互策略進(jìn)行智能決策,使機(jī)器人在復(fù)雜環(huán)境中保持穩(wěn)定、可靠的執(zhí)行能力。


    (數(shù)碼視訊AI感知多模態(tài)應(yīng)用解決方案)

    推動(dòng)多場(chǎng)景落地,助力機(jī)器人成為真正的“伙伴”

    依托數(shù)碼視訊在邊緣計(jì)算和視頻AI算法上的深厚積累,該方案可靈活部署于多類(lèi)型終端或平臺(tái),在保障實(shí)時(shí)性的同時(shí),兼顧功耗與成本,在眾多應(yīng)用場(chǎng)景中都具備發(fā)展?jié)摿Α?/p>

    服務(wù)與陪護(hù)機(jī)器人:融合視覺(jué)與語(yǔ)音識(shí)別,實(shí)現(xiàn)對(duì)用戶(hù)身份、表情和語(yǔ)言指令的綜合理解。機(jī)器人可以根據(jù)場(chǎng)景(如家庭、養(yǎng)老機(jī)構(gòu)、商場(chǎng))自動(dòng)調(diào)整交互策略,提供更自然、更人性化的服務(wù)體驗(yàn)。

    安防與巡檢機(jī)器人:在弱光、雨霧、逆光等場(chǎng)景下,通過(guò)多模態(tài)融合進(jìn)行目標(biāo)識(shí)別與行為分析,并結(jié)合傳感器數(shù)據(jù)實(shí)現(xiàn)溫度異常檢測(cè)、設(shè)備狀態(tài)監(jiān)測(cè)等,為園區(qū)、廠區(qū)、交通樞紐提供全天候智能巡檢能力。

    工業(yè)與倉(cāng)儲(chǔ)機(jī)器人:在復(fù)雜工位和混合貨物環(huán)境中,通過(guò)多模態(tài)感知實(shí)現(xiàn)精準(zhǔn)定位、智能抓取與動(dòng)態(tài)避障,顯著降低人工干預(yù)頻次,提升作業(yè)效率與安全性。

    特種與戶(hù)外機(jī)器人:在戶(hù)外復(fù)雜地形、無(wú)GPS或弱信號(hào)環(huán)境中,利用視覺(jué)、深度和環(huán)境傳感數(shù)據(jù)的融合,提高對(duì)地形、障礙物的辨別能力,為應(yīng)急救援、危險(xiǎn)環(huán)境作業(yè)提供更高的安全保障。

    此外,數(shù)碼視訊的AI感知多模態(tài)機(jī)器人視覺(jué)解決方案,可為機(jī)器人廠商、系統(tǒng)集成商等提供標(biāo)準(zhǔn)化接口與定制化算法服務(wù),實(shí)現(xiàn)降低自研多模態(tài)算法與系統(tǒng)集成的門(mén)檻和成本、幫助合作伙伴快速構(gòu)建差異化產(chǎn)品,縮短從方案設(shè)計(jì)到量產(chǎn)落地的周期等積極效果。未來(lái),公司還將持續(xù)推進(jìn)多模態(tài)感知與具身智能、端云協(xié)同大模型的深度結(jié)合,攜手生態(tài)伙伴共同打造新一代機(jī)器人智能感知平臺(tái),讓機(jī)器人真正成為人類(lèi)在生產(chǎn)生活中的“智慧伙伴”,為智能制造、智慧城市等行業(yè)注入新的發(fā)展動(dòng)力。

     網(wǎng)友評(píng)論
     編輯推薦
    • 引領(lǐng)開(kāi)創(chuàng)數(shù)字新未來(lái)——北京 InfoComm China 2023展會(huì)專(zhuān)題報(bào)道
    • 2022視聽(tīng)行業(yè)高峰論壇 視聽(tīng)行業(yè)金孔雀“開(kāi)屏”揭榜了
    • 2021 SIAV上海國(guó)際高級(jí)HiFi演示會(huì)展會(huì)_聯(lián)合HiFi專(zhuān)題
    • 2019年視聽(tīng)行業(yè)大型活動(dòng)之走進(jìn)企業(yè)(西安)
    • SHARP/NEC工程機(jī)新品尊享會(huì)在京舉辦,共襄光影盛宴
    • 聚力同行 共譜新篇|2024年SHARP/NEC渠道大會(huì)圓滿(mǎn)召開(kāi)
    • 2022視聽(tīng)行業(yè)高峰論壇 視聽(tīng)行業(yè)金孔雀“開(kāi)屏”揭榜了
    • 聲名遠(yuǎn)揚(yáng)——森海塞爾EW-DX新品發(fā)布會(huì)