IDEA研究院與騰訊合作,在深圳福田河套深港科技創(chuàng)新合作區(qū)落地建設(shè)福田實驗室,聚焦人居環(huán)境具身智能技術(shù)。(香港文匯網(wǎng)記者郭若溪攝)

(香港文匯網(wǎng)記者郭若溪)11月22日,由粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院(簡稱「IDEA 研究院」)主辦的2024年 IDEA大會在深圳舉行,首發(fā) IDEA 創(chuàng)新成果,覆蓋低空經(jīng)濟、金融科技、計算機視覺、基礎(chǔ)軟件等世界前沿研究領(lǐng)域,在全球視野下探討科研發(fā)展新路徑,洞悉產(chǎn)業(yè)落地新機遇。IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋指出,在技術(shù)大爆發(fā)時期開展創(chuàng)新,對技術(shù)的深度理解尤為重要。隨著AI的各項能力逼近、甚至超越人類,AI治理已成亟待全球共同面對的議題。

IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋。(香港文匯網(wǎng)記者郭若溪攝)

IDEA 大會於 2021 年首度亮相,由美國國家工程院外籍院士沈向洋發(fā)起,致力在粵港澳大灣區(qū)搭建一個分享人工智能技術(shù)和凝聚數(shù)字產(chǎn)業(yè)力量的國際化交流平臺,是粵港澳大灣區(qū)最具影響力的科技盛會之一。本次大會,IDEA公布一系列前沿研究與產(chǎn)業(yè)落地成果。

從通用視覺感知到具身智能

自2022年起,IDEA團隊從目標檢測出發(fā),打造精準度、通用性、泛化能力兼優(yōu)的DINO系列視覺大模型。大會發(fā)布了該系列最新的DINO-X通用視覺大模型,擁有真正的物體級別理解能力,實現(xiàn)開放世界目標檢測。無需用戶提示,直接檢測萬物。

與此同時,IDEA團隊還推出行業(yè)平臺架構(gòu),通過一個大模型基座,結(jié)合通用識別技術(shù)結(jié)合,讓模型不需重新訓練,就可邊用邊學,支撐多種多樣的B端應(yīng)用需求。視覺感知是機器與物理世界交互的基礎(chǔ)。全場景視覺感知能力的提升,自然為技術(shù)落地拓寬了空間。

IDEA研究院與美團合作,探索無人機視覺智能技術(shù)。(香港文匯網(wǎng)記者郭若溪攝)

在具身智能領(lǐng)域,IDEA研究院宣布與騰訊合作,在深圳福田區(qū)、河套深港科技創(chuàng)新合作區(qū)落地建設(shè)福田實驗室,聚焦人居環(huán)境具身智能技術(shù);與美團合作,探索無人機視覺智能技術(shù);與比亞迪合作,拓展工業(yè)化機器人智能應(yīng)用。IDEA團隊還分享了正在進行的AI助盲應(yīng)用研究。

從合成數(shù)據(jù)到大模型價值創(chuàng)造

大模型能力的湧現(xiàn),離不開互聯(lián)網(wǎng)時代的海量數(shù)據(jù)養(yǎng)料積累。IDEA團隊自研了語境圖譜技術(shù),解決過往文本數(shù)據(jù)合成方案的多樣性匱乏等問題。該技術(shù)為合成數(shù)據(jù)引入「指導手冊」,以圖譜為綱,指導用於合成的語境採樣。

實驗結(jié)果顯示,IDEA團隊的方案能持續(xù)為大模型帶來能力提升,表現(xiàn)超過目前的最佳實踐(SOTA);從token消耗來看,平均節(jié)約成本85.7%。目前,該技術(shù)內(nèi)測平臺已開放,通過API提供服務(wù)。

在拓展新前沿的同時,大模型價值創(chuàng)造也在進行時。大會上,IDEA秀出多個垂類行業(yè)應(yīng)用落地進展,包括:學術(shù)大模型和AI科研神器ReadPaper、營銷創(chuàng)作大模型,以及面向經(jīng)濟與金融領(lǐng)域的經(jīng)濟大模型、運籌決策大模型、投資大模型。

責任編輯: 文劼