題 目:可控視覺(jué)內(nèi)容生成與編輯
時(shí) 間:2026年3月13日(星期五)10:20
主講人:李冠彬
地 點(diǎn):博學(xué)樓(第42教學(xué)樓)320
主辦單位:電子信息工程學(xué)院
主講人簡(jiǎn)介:李冠彬,中山大學(xué)計(jì)算機(jī)學(xué)院教授,博士生導(dǎo)師。主要研究領(lǐng)域?yàn)槿斯ぶ悄茴I(lǐng)域的圖像視頻內(nèi)容理解與生成。任廣東省大數(shù)據(jù)分析與處理重點(diǎn)實(shí)驗(yàn)室副主任、廣東省圖象圖形學(xué)會(huì)計(jì)算機(jī)視覺(jué)專(zhuān)委會(huì)主任、中國(guó)圖象圖形學(xué)學(xué)會(huì)青工委副秘書(shū)長(zhǎng)、中國(guó)計(jì)算機(jī)學(xué)會(huì)青年科技論壇廣州主席等,擔(dān)任人工智能領(lǐng)域頂級(jí)會(huì)議CVPR、ECCV、AAAI等領(lǐng)域主席,研究成果應(yīng)用于智能交通分析、智慧醫(yī)療診斷、數(shù)字人驅(qū)動(dòng)的智慧教育等。
講座簡(jiǎn)介:
近年來(lái),以擴(kuò)散生成模型為代表的生成式AI模型能力日新月異,展現(xiàn)出令人矚目的效果。在視覺(jué)內(nèi)容生成及編輯領(lǐng)域,更符合用戶(hù)意圖及更具可控性與個(gè)性化的跨模態(tài)生成方法受到了學(xué)術(shù)界及產(chǎn)業(yè)界的廣泛關(guān)注。已有的跨模態(tài)視覺(jué)生成方法在圖像生成質(zhì)量、美學(xué)感染力、跨模態(tài)結(jié)構(gòu)及語(yǔ)義對(duì)齊、個(gè)性化生成、跨幀及多視角一致性等方面仍然存在諸多挑戰(zhàn)。本次報(bào)告將圍繞多模式條件驅(qū)動(dòng)的可控視覺(jué)內(nèi)容生成與編輯問(wèn)題,介紹研究組從感知反饋學(xué)習(xí)、視頻自監(jiān)督一致性約束、跨模態(tài)調(diào)制與適配、蒸餾采樣一致性等角度實(shí)現(xiàn)用戶(hù)意圖一致的個(gè)性化圖像生成、圖層化編輯、視頻虛擬試穿、圖文提示引導(dǎo)的3D場(chǎng)景編輯以及多模式控制的數(shù)字人生成等方面的研究成果及相關(guān)應(yīng)用。