• 首   頁|
  • 聯系我們|
  • 快速導航

實訓項目

2021級實訓項目——Text-to-Image: 文本驅動的精準圖像生成

來 源:   發布時間: 2024-09-03 15:19:35   點擊次數: 0


項目成員:戴钰俊 萬振民

項目簡介:當前文本到圖像生成技術備受矚目,但市面上的文生圖模型均由單一提示直接生成圖像,難以精細調整空間布局,缺乏基于原始圖像在特定位置進行處理的能力。我們的項目通過将Grounding DINO的精确目标檢測與GLIGEN的邊界框控制結合,讓用戶僅憑簡潔文本指令,就能在特定圖像區域内精準生成物體,解決了文本驅動圖像生成中空間控制的難題,結合lora技術實現良好的局部編輯效果,讓創意直觀呈現在預期位置。



Baidu
sogou