主講人簡(jiǎn)介：李冠彬，中山大學(xué)計(jì)算機(jī)學(xué)院教授，博士生導(dǎo)師。主要研究領(lǐng)域?yàn)槿斯ぶ悄茴I(lǐng)域的圖像視頻內(nèi)容理解與生成。任廣東省大數(shù)據(jù)分析與處理重點(diǎn)實(shí)驗(yàn)室副主任、廣東省圖象圖形學(xué)會(huì)計(jì)算機(jī)視覺(jué)專(zhuān)委會(huì)主任、中國(guó)圖象圖形學(xué)學(xué)會(huì)青工委副秘書(shū)長(zhǎng)、中國(guó)計(jì)算機(jī)學(xué)會(huì)青年科技論壇廣州主席等，擔(dān)任人工智能領(lǐng)域頂級(jí)會(huì)議CVPR、ECCV、AAAI等領(lǐng)域主席，研究成果應(yīng)用于智能交通分析、智慧醫(yī)療診斷、數(shù)字人驅(qū)動(dòng)的智慧教育等。

講座簡(jiǎn)介：

近年來(lái)，以擴(kuò)散生成模型為代表的生成式AI模型能力日新月異，展現(xiàn)出令人矚目的效果。在視覺(jué)內(nèi)容生成及編輯領(lǐng)域，更符合用戶(hù)意圖及更具可控性與個(gè)性化的跨模態(tài)生成方法受到了學(xué)術(shù)界及產(chǎn)業(yè)界的廣泛關(guān)注。已有的跨模態(tài)視覺(jué)生成方法在圖像生成質(zhì)量、美學(xué)感染力、跨模態(tài)結(jié)構(gòu)及語(yǔ)義對(duì)齊、個(gè)性化生成、跨幀及多視角一致性等方面仍然存在諸多挑戰(zhàn)。本次報(bào)告將圍繞多模式條件驅(qū)動(dòng)的可控視覺(jué)內(nèi)容生成與編輯問(wèn)題，介紹研究組從感知反饋學(xué)習(xí)、視頻自監(jiān)督一致性約束、跨模態(tài)調(diào)制與適配、蒸餾采樣一致性等角度實(shí)現(xiàn)用戶(hù)意圖一致的個(gè)性化圖像生成、圖層化編輯、視頻虛擬試穿、圖文提示引導(dǎo)的3D場(chǎng)景編輯以及多模式控制的數(shù)字人生成等方面的研究成果及相關(guān)應(yīng)用。

返回列表

圖書(shū)館
教學(xué)日歷
辦事大廳
登錄外網(wǎng)
網(wǎng)絡(luò)服務(wù)
后勤服務(wù)
電子郵箱

北碚校區(qū)：重慶市北碚區(qū)天生路2號(hào)　郵編：400715

榮昌校區(qū)：重慶市榮昌區(qū)學(xué)院路160號(hào)郵編：402460

皇冠网络技术骗子-皇冠网足彩500万软件-皇冠网vip小说

可控視覺(jué)內(nèi)容生成與編輯