近日,由中國科學(xué)院自動化研究所聯(lián)合武漢人工智能研究院研發(fā)的紫東太初4.0多模態(tài)推理大模型發(fā)布。自2021年首次推出以來,紫東太初已完成4次迭代,實(shí)現(xiàn)了從“純文本思考”“簡單操作帶圖思考”到“細(xì)粒度多模態(tài)語義思考”的躍遷,邁向多模態(tài)深度推理的新階段。
中國科學(xué)院自動化研究所研究員、武漢人工智能研究院院長王金橋介紹,“細(xì)粒度多模態(tài)語義思考”是指大模型能像人一樣主動深度思考,不僅能動態(tài)適應(yīng)和處理更復(fù)雜的任務(wù),還能在視覺語義層面展現(xiàn)出清晰且可解釋的推理過程,實(shí)現(xiàn)“邊看、邊識、邊思”。
“比如在音頻理解中,用戶對紫東太初說‘我想掛一個(gè)呼吸科的號’,它能自動操作APP并根據(jù)癥狀選擇門診;在視頻理解中,它能對180分鐘的長視頻進(jìn)行片段精準(zhǔn)定位和內(nèi)容總結(jié)。”王金橋說,此外,它還能在真實(shí)場景中通過汽車、機(jī)器人等“動手操作”。
據(jù)了解,紫東太初已在具身智能、低空經(jīng)濟(jì)、智慧醫(yī)療等多個(gè)產(chǎn)業(yè)中實(shí)現(xiàn)布局,為城市基礎(chǔ)設(shè)施與行業(yè)需求提供定制化解決方案。
·凡注明來源為“??诰W(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計(jì)等作品,版權(quán)均屬??诰W(wǎng)所有。未經(jīng)本網(wǎng)書面授權(quán),不得進(jìn)行一切形式的下載、轉(zhuǎn)載或建立鏡像。
·凡注明為其它來源的信息,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
網(wǎng)絡(luò)內(nèi)容從業(yè)人員違法違規(guī)行為舉報(bào)郵箱:jb66822333@126.com