• <li id="yeaqi"><button id="yeaqi"></button></li>
  • <fieldset id="yeaqi"></fieldset>
    <fieldset id="yeaqi"><table id="yeaqi"></table></fieldset>

    •  

      鵝廠程序員親測AI寫真通用版,女友直呼“真妙呀”!
      發布時間:2023-08-29 21:59:48 文章來源:程序員客棧
      #關注并星標騰訊云開發者#每周4|鵝廠一線程序員,為你“試毒”新技術#
      # 關注并星標騰訊云開發者 # 每周4 | 鵝廠一線程序員,為你“試毒”新技術 #第4期|騰訊霍然:鵝廠大牛手把手教學,讓自己實現數字分身?


      時下流行的 AI 寫真工具,為用戶提供了用現成的照片遨游于廣袤素材與想象中的可能性,也啟發 AI 從業者對于大眾消費產品的構想。對于個人來說,是否可以上手 AI 技術,做出自己的“數字分身”呢?本文將介紹一種高效率、易上手、低成本、高安全的“數字分身”制作方式??赐瓯疚?,你也會用一張圖片“穿越古今”,做出自己的 N 個“數字分身”。



      【資料圖】

      圖1,作者使用 StableDiffusion制作的美女“數字分身”集


      隨著網絡某相機小程序的火爆,關于 AIGC 智能應用的討論又一次點燃移動互聯網。9.9 元即可制作不同背景、造型下的“數字分身”照片,出圖效果幾可比擬專業照相館,引發了受眾的追捧。


      而質疑者,認為 9.9 元的體驗成本過高,也覺得產品高峰期的數十小時的等待時長過于熬人??鄲烙跓o法對生產的照片任意加工,更為 AI 應用的數據安全性憂心忡忡。


      這些想法也反映了廣大用戶對于 AI 應用的需求和渴望。對于 AI 工具,用戶希望既可以降低使用成本,又可以保證生產效果。如果還能簡化生產流程、縮短生產時長、提供便于交互的服務,同時保證數據安全性,當然更佳。


      那么,所謂的 AI“數字分身”領域,或是“AI 寫真”領域為例,是否有一個滿足以上所有要求的方案呢?


      制作個人的 LoRA 模型是一種生成“數字分身”的方式,也被一些用戶猜測為“AI 寫真小程序”的技術方案。


      這種方法可以生成較為穩定的、多角度的人像,但是其需要輸入的照片較多,技術實現的步驟也稍復雜,對于新手的使用門檻較高,文中不做介紹。


      本文將由淺入深地介紹一種小白可以輕松上手的簡易“數字分身”制作方式,基本滿足用戶對 AI 應用的要求。


      本文介紹的“數字分身”制作方法可以通過 AI 技術隨意更換照片中人物的服裝、造型、背景,用一張人像照片“穿越古今”。讀者可以拿 9.9 元買一杯蜜雪冰城,在家里“一鍵出圖”。


      整個產圖流程可以在個人計算機的服務器完成,不需要把照片上傳到外部服務器,極大地保障數據的安全性。同時,千變萬化的服裝、背景、造型更是令人眼花繚亂,AI 的創意指數拉滿,令人拍案叫絕。


      圖2,作者使用 StableDiffusion制作風格各異的美女“數字分身”


      制作“數字分身”的過程需要解決 3 個問題:

      畫什么?用什么?參考什么?


      針對這 3 個問題,產生了 3 個步驟:

      畫什么:填寫描述詞;

      用什么:上傳圖片并選擇重繪區域;

      參考什么:提供參考的人物姿態。


      下面將按照這 3 點依次介紹。下文用到的工具為 Stable Diffusion WebUI,以及 ControlNet 插件。為了簡化內容,本文介紹便捷有效的實操步驟,Stable Diffusion 的安裝和精細化調參技能點請讀者自行學習,文末附有參考材料。


      圖3,文章核心步驟的示意圖


      “畫什么”的問題在用文字形式模擬用戶腦海中的想象。


      小時候,男生幻想自己穿著俠客的青衫,仗劍走天涯;女生幻想自己穿著飄逸的襦裙,沐浴唐風漢韻。如今的 AI 技術可以借助語言描述,讓我們在風格各異的場景中塑造個人形象。建立這一形象,首先需要用語言描述人物的服裝、發型、背景,描述語言稱為提示詞。


      提示詞分為正向提示詞(希望畫面出現的內容)和負向提示詞(不希望畫面出現的內容)。繪圖用的 Stable Diffusion 為國際化工具,提示詞要用英語。


      比如生成一個穿著古裝漢服的女孩,女孩佩戴精美發簪,以傳統的中式宮殿為背景;同時,希望圖片高質量、高清晰,不要出現模糊、丑陋、動畫等元素。將正向提示詞寫為“1girl, wearing song hanfu, wearing delicate traditional chinese hairpins, chinese palace background, materpiece, best quality, ultra-detailed”。負向提示詞寫為“blurry, ugly, bad quality, cartoon, anime, NSFW, nude”。


      圖4,StableDiffusionWebUI 的提示詞輸入界面


      “用什么”在追問圖片生產過程中的主要原料是什么。


      本文介紹簡易的“數字分身”制作過程,用現成的照片換掉照片中的造型、服飾、背景,達到“一鍵穿越”的效果。在此過程中,用到的原料是現有的照片,應用的技術為 Stable Diffusion 的圖生圖局部重繪(img2img inpaint)功能。涉及到的操作為上傳圖片并手動選擇重繪區域。選擇照片時,建議選擇上半身,面部輪廓清晰的正面照。比如,以一張年輕女性的正面半身照作為輸入。


      圖5,上傳的照片示例


      上傳圖片后,我們把“換造型,換服裝”的需求轉換為技術語言“重繪除了臉部之外的所有區域”。那么,AI 工具如何知道照片中哪里是面部區域呢?在使用時,先上傳圖片,再用黑色的筆刷手動涂抹面部區域,就能精準地標識面部區域,如圖 6 所示。


      圖6,涂抹上傳照片的功能示例


      此外,還需要選擇對非涂抹區域進行重繪的選項(inpaint not masked),也就是對于除面部外的區域進行新的創作,如圖 7 所示。


      圖7,選擇“繪制非蒙版內容”操作示例


      “參考什么”則是結合什么輔助信息,讓圖片生產的效果更穩定。


      既然是參考,則非必需,但是有利于提升圖片生產的質量。上面的兩個步驟為 AI 描繪了繪圖內容,也提供了人像的臉部特征。此時若是讓 AI 工具“信馬由韁”地發揮,容易出現人體比例失調,動作不自然等問題。為 AI 工具提供“參考答案”雖然會減少創意空間,但是能讓 AI 工具學習原照片的動作姿態,生成更加自然的圖片。如何學習人物姿態呢?學習人物姿態需要用到 ControlNet 插件,一款對圖片進行預加工的工具,把預加工的結果像積木塊一樣拼插到生成圖片的流程中。


      輸入和上一步相同的正面半身照,用 ControlNet 插件中的 openpose 預處理器學習圖中人物姿態,比如頭和身體位置關系,手臂的動作。按照圖 8 的方式選擇啟用 ControlNet 插件,并選擇 openpose 預處理模式和模型。


      圖8,ControlNet 插件的使用示例


      進行上述操作后,就可以得到圖 9 的多款古裝美女“數字分身”。


      圖9,通過 StableDiffusionWebUI 制作的古裝美女“數字分身”


      那么如果想制作更多的分身,讀者應該修改前文介紹的哪些步驟呢?


      讀者可以回顧,思考一下本文介紹的方法。前面介紹的 3 個步驟中,“畫什么”的步驟決定圖片內容,“用什么”的步驟決定核心素材,“參考什么”的步驟決定額外的素材。


      回顧后發現,當我們想對畫面元素做修改時,只需要修改“畫什么”步驟中的提示詞。比如想要生成現代裝校園風圖片,只需要重寫正向提示詞中涉及服裝,造型,背景的提示詞,將正向提示詞改寫為“1girl, wearing school uniform, ponytail, campus background, materpiece, best quality, ultra-detailed”。負向提示詞仍然寫為“blurry, ugly, bad quality, cartoon, anime, NSFW, nude”,如圖 10所示。


      圖10,更新 StableDiffusionWebUI 的提示詞示例


      除了修改正向提示詞外,其他步驟均保持不變。點擊“生成”按鈕,就能得到圖 11 的“校園女孩分身”。


      得到“數字分身”后,如果讀者希望進一步修改圖片細節,比如重新生成背景中的建筑物,可以用局部重繪功能涂抹待修改的細節,仿照上面的指引,用提示詞來牽引重繪方向,具體操作交給讀者探索。


      圖11,通過 StableDiffusionWebUI 制作的校園美女“數字分身”


      按照這種方式不斷解鎖校園風、古代風、未來感、中式旗袍、日常風的造型,就得到了文章開頭異彩紛呈的“數字分身集”。


      圖12,作者使用 StableDiffusion制作的美女“數字分身”集


      寫到最后,對比一下本文通過 Stable Diffusion WebUI 制作“數字分身”的方案和 AI 寫真小程序在用戶體驗方面的異同。


      兩種方法的相同點為:以人像照片為輸入,通過技術手段獲得不同場景、造型的人像寫真圖。


      除此之外,兩者在使用體驗方面有較大的差異。在成本方面,AI 寫真小程序需要更多“有形投資”,比如更多的照片數量,更高的費用;而本文的方法有更多的“無形投資”,比如部署和使用 Stable Diffusion 的能力。


      在收益方面,AI 寫真小程序在生成圖片的角度和顏值上有優勢,畫面自然感更高;而本文的方法在生成圖片的造型、背景豐富度以及再加工能力上更勝一籌。


      期待大家可以用 AI 技術拓展生活的疆域。


      如果讀者朋友們想進一步學習如何部署 Stable Diffusion 以及如何精細化調參,可以參考騰訊云開發者的這篇文章《給想玩AI的新手|Stable Diffusion 保姆級入門手冊》。
      有了自制的 AI 寫真工具,你最想生成哪些照片?或者想在工具里面加入哪些功能?歡迎留言。我們將挑選一則最有趣的答案,為其留言者送出騰訊定制T恤。8月31日中午12點開獎。

      歡迎加入騰訊云開發者社群,社群專享券、大咖交流圈、第一手活動通知、限量鵝廠周邊能你來~


      (長按圖片立即掃碼)



      關注并星標騰訊云開發者

      每周4看鵝廠程序員測評新技術


      關鍵詞:

      樂活HOT

      娛樂LOVE