機智 AI 生活雜記 - 輕鬆抓色碼
| | 1 | |
進入 AI 紀元,就學著怎麼用 AI 節省繁瑣手工,輕鬆搞定日常瑣事吧~
ChatGPT 從 4o 開始主打多模態(Multimodal),讓大型語言模型(LLM)不只能處理文字,並且能理影像、聲音,生成影像 (延伸閱讀:OpenAI API 傳送圖檔給 GPT-4o 分析)。在競爭白熱化之下,理解及生成影像已成 LLM 標配,這年頭不能處理影像都都不敢說自己是 LLM 了。
各家模型殺得你死我活,身為使用者漁翁得利,AI 看得懂圖片,一些以前得費點手腳的雜事,瞬間變得超簡單。最近剛好有個實例,讓我體驗到多模態 LLM 的方便。
在書上看到圖表的配色我很是喜歡,想偷它的顏色來用。這工作說難不難,可以拍張照片,用繪圖軟體的取色工具採樣,把色碼記下來,但同樣動作要做九次,說起來也是有點小煩。
在多模態 LLM 時代,我們可以這麼做:上傳照片給語言模型,寫一段 Prompt。
識別照片中圖表用到的圖塊色碼,產生 HTML 由深到淺以色塊展示這些顏色並標明色碼
不用一分鐘,一個展示色碼的 HTML 就做好了~ 線上展示
Google 問市後,懂得下關鍵字活用搜索引擎查資料的人,在競爭中逐漸佔據上風。
而在 AI 時代,應該會是善用 AI 快速完成工作的人把對手壓在地上摩擦。一場新的賽跑已經開始,而我快學不動了,哈!
Comments
# by ChrisTorng
剛好前陣子記得是請 Claude 寫了個中文字體顏色與中文字意不同的網頁: https://christorng.github.io/AI-Tools/ColorWordGrid/24614_0.html ,原始碼在 https://github.com/ChrisTorng/AI-Tools/blob/main/ColorWordGrid/24614_0.html 想讓人可以比較左側「字意與字色不同」、中間「字色顏色方塊」與右邊「字意顏色方塊」的難易度差別。不過 LLM 辨識顏色就我這次試還是不行,不過我沒檢驗是否像人一樣辨識顏色會受字意干擾的問題。 當初記得有用 ChatGPT/Claude 辨識圖片結果都很差。一開始它都是辨識出色碼,請它辨識為顏色名字也是亂七八糟,目前 HTML 我還手工整理過,不過最後沒有肉眼比對與顏色正確一致。