AI 創藝學苑 -- 機智的AI 生活, 新課課務更新報告 0710

 跟同學做課務進度報告, 我在「AI 創藝學苑」平台上線的新課, 目前已有58+支影片上線了,即將上線的部份剩下個位數, 這幾週的更新包含:

■ 每個AI助理中, 都有影片介紹, 包含了設計的想法及操作示範, 並且是以較活潑的雙人 Podcast 來講解配音。

■ 新增了攝影專用的 AI Web App, 預計未來還會再提供一些新工具(第11章)。

■ 新增了 MJ7 、Veo3 影音協力工具 , 也支援了目前流行的穿越時空直播腳本產生, 以及新增皮克斯風格故事小編(第8章)。

■ 新增了「從限流到百萬瀏覽,攝影師的社群挑戰」的一些經驗分享及數據揭露(第3章)。


我預計這個月就會將課程收尾的部份完成, 但今年還會持續新增一些東西進來, 讓這個課更加的完整、超值, 感謝大家的支持, 隨著課程的製作近尾聲, 早鳥的優惠也即將結束了, 對課程有興趣的朋友, 請參考:

https://aiart.kaik.io/courses/smartai

有任何的問題, 可以私訊我!

Posted by 賀伯老師 Herb Hou, On 晚上10:05

鏡頭的壓縮感/透視感,網路及AI的解答正確嗎?

外拍/ AI

鏡頭的壓縮感/透視感,網路及AI的解答正確嗎? 索尼社團上昨天有個有趣的問題,是問鏡頭焦段跟壓縮感/透視感的關係。

這是個老生常談,又讓新手困擾的問題,但裡面的問答,點出了幾個問題,其中兩點:

1) 在網路上搜尋,結果,他的答案有誤,認為焦段是壓縮感/透視感的最重要關鍵。

2) 問AI,結果AI的答案有誤,也認為焦段是壓縮感/透視感的最重要關鍵。 

解決 1的問題,需要好的網路搜尋比對源,以及辯證的能力。 

解決 2的問題,需要好的AI應用力,以及辯證的能力。 

先看看下列的解答說明: 透視感(Perspective),簡單來說,影響透視感最關鍵的因素是「拍攝距離」,也就是您與被攝主體之間的距離。

而「鏡頭焦距」則是決定了我們在特定拍攝距離下,能夠將多少景物納入畫面中。

讓我用一個簡單的例子來說明: 

■使用廣角鏡頭(例如 24mm):為了讓主體在畫面中有足夠的大小,您需要靠近主體拍攝。這時,由於拍攝距離很近,近處的物體會顯得特別大,而遠處的背景則會被壓縮得比較小,產生強烈的「近大遠小」透視效果。 
■使用長焦鏡頭(例如 200mm):為了讓主體在畫面中有相同的大小,您需要遠離主體拍攝。這時,由於拍攝距離很遠,遠處的背景會被「拉近」,看起來與主體的距離沒有那麼遙遠,透視感就會變得比較平緩,也就是所謂的「壓縮感」。 

所以,您可以這樣理解: 

■拍攝距離 -> 決定了透視感的強弱。
■鏡頭焦距 -> 決定了在該拍攝距離下的構圖範圍。

---

是不是講的簡單、明瞭又清楚!

但是,這個文卻是我做的一個AI助理寫的!沒想到,跟我之前寫的文相比,又簡明了許多。

簡單來講,不管是網路搜尋,還是AI問答,都要提供交叉比對、辯證核實的步驟。

就像以前只有圖書的時代,所謂盡信書、不如無書。不是都不要看書的意思,而是同樣要交叉比對、辯證核實。否則,看錯誤的資訊,不如不看。

---

AI可能會出錯,但也可能有傑出的回答,這個關鍵在於如何問、如何讓它比對資料、辯證核實。 問錯了問題,給錯了方向,它又順著你的意,結果就很可能有問題! 我覺得回到根本,這就是AI提示詞工程的內涵。

提示詞工程就是AI 領域,像是「基礎攝影」一樣的東西!

--- 

早期的LLM,是從網路上抓資料、學東西。蒐集整合網路的資料,它是有機會給出似是而非的答案的。 但現在的LLM,在面對問題時,是可以交叉比對的,並不是純粹的接受資料。 當然,人才是最終的把關者,所以,「評估」是提示詞工程的必要環節。

圖說:在相同距離下,Zoom In, Zoom Out,改變的只是焦段,不會影響透視。

Posted by 賀伯老師 Herb Hou, On 上午9:33

Google Gemini的TTS測試

AI/ Podcast

 Google Gemini的TTS究竟表現如何?

這邊有些範例及心得可以跟大家分享: 基本上,它可以將台灣習慣的腔調表現的還不錯,透過雙人的Podcast對談時,也可以相當的活潑、自然。我覺得很適合用在包含:影片的配音、短影音的配音以及Podcast中。 尤其是在教學影片的配音,因為更易於用活潑的形式跟同學強調學習重點,我覺得學習的效果會比單人講述的形式更好些!

當然,目前也有些問題要克服,包含更好的IP語調一致性,以及是否可以直接產出字幕檔。目前我已用這個工具,幫大約40幾支的影片做過配音,對於話速、特定單字發音、語氣控制等,也累積許多的心得。

以下是可以提供的範例, 範例參考一,
影片配音: https://herb.pse.is/7utnr8

範例參考二,
Podcast應用:https://herb.pse.is/7utnxl

Posted by 賀伯老師 Herb Hou, On 下午6:41

AI 創藝學苑 | 「機智的AI生活」專屬的 Podcast 頻道正式推出

AI/ Podcast

 各位同學好,因為AI 工具的演進、生產力的提升,現在,我們終於也可以有餘力推出 Podcast 頻道了,「機智的AI生活」專屬的 Podcast 頻道,在今天正式推出,將會跟大家摘錄探討許多內容。針對攝影人、影像小編,影像工作者,不僅是生圖的技術,重點在探索以AI讓自己更高效的成長、工作術,頻道可以參考:

https://herb.pse.is/7utnxl

Posted by 賀伯老師 Herb Hou, On 下午5:41

AI 創藝學苑 | 日系人像封面生成器

AI/ Bot/ Canvas

 我們在Gemini中也可以直接呼叫開源免費的Flux服務,使用Flux來生圖,不限於運用Gemini本身的生圖。

這個介面,便是我以Gemini的Canvas實作的結果,它會以Gemini AI先優化輸入的提示詞,然後將英文提示詞傳給 Flux 生圖。

這樣便多了許多的彈性選擇及趣味性。

我預計本週會將這個應用,上傳到「機智的AI生活--攝影人高效成長工作術」給同學,感謝大家的支持!

https://aiart.kaik.io/courses/smartai




Posted by 賀伯老師 Herb Hou, On 晚上8:43

AI 創藝學苑 | Midjourney 7影片腳本及提詞構思達人Bot

AI/ Bot/ Midjourney

(「機智的AI生活」一課中,也會包含這個AI助理,此為獨立銷售版本,適用未購課同學)

 

Midjourney在2025/6/19發佈了Midjourney正式發佈V1 Video模型,可以生成並延長影片。

這個Bot助理便可以支援Midjourney的新功能,進行影片生成及延長的腳本及提示詞產生。你只要輸入一個概念,例如「日式女僕咖啡館裡面,一位漂亮的女僕」然後按「提交」鈕即可以,不用輸入其它的提示詞。

它就會自動產生六段提示詞,第一段提示詞是用來做「文生圖」,產生高品質的影像結果,而第二段至第六段,是用來生成及延伸影片的提示詞(MJ7的影片,最長為5+4+4+4+4=21秒)。

基於第一段的提示詞情節,它會發想總共五段,動作可以連貫的提示詞,讓你逐步生成、延長影片。 每一段的提示詞,都會有英文Prompt及中文的對照翻譯! 透過這個Bot助理,你便可以快速的在Midjourney中進行作業!

詳細資訊:
https://aiart.kaik.io/digital-downloads/mj7-video-ai-bot

Posted by 賀伯老師 Herb Hou, On 下午4:25

AI 創藝學苑 | 機智的AI生活---攝影人高效成長工作術 介紹

講座/ AI/ Portrait

新課上線,限時限量優惠碼 SmartLife300 (限時限量,早鳥折NT$300-):
■ 你也可以進入「愛攝影粉專的專區」觀看最新AIGC資訊。

這是一堂針對攝影人、影像小編的課,不僅是生圖,重點在探索以AI讓自己更高效的成長、工作術,提供了超過40個完整的工具Bot機器人,可用於新一代的Gemini、GPT,產生的內容,可用於社群經營的自然流量傳播;也包含了生圖提示詞自動產生的探討,產生的高品質提詞,可用於目前所有的生圖平台及工具(包含ComfyUI、GPT 4o、Midjourney...等)。

以好學、易用的形式來導引同學。 我目前經營多個粉專,不僅是要攝影,也需生圖、產文、製作影音,便是仰賴這套好用的獨家工具及流程來協力! 

課程總共有九大主題領域的探討及工具Bot提供、Knowhow、實戰及觀念:
■ 好的提示詞工程技巧讓你變 AI 專家 
■ 攝影復盤成長術(6 Bot) 
■ 社群經營加速器(12 Bot) 
■ 攝影創意、拍攝規劃及旅行(6 Bot) 
■ 後期修圖風格優化(3 Bot) 
■ 人際經營(3 Bot) 
■ 提詞大師(8 Bot) 
■ 分鏡、故事及影音(6 Bot)  
■ AI Agent 一鍵完成工作

Posted by 賀伯老師 Herb Hou, On 中午12:13