閒聊 - 老鳥的 Github Copilot 危機？

2024-04-27 11:42 AM

8,799

最近，愈來愈習慣用 Github Copilot 寫程式，依賴程度高到自己心驚。現在寫程式遇到跑迴圈拆解 CSV 對映物件屬性、fetch 某 API 取回結果之類的情節，別說少打字，我甚至來不及動腦細想邏輯，Copilot 已經把程式生好，眼睛看過檢查一遍(通常沒問題)，這段程式就算寫完了。...

Edge/Chrome 出現「xxx.pdf 無法安全下載」/「已封鎖不安全的下載內容」

2024-04-24 09:01 PM

14,044

使用者反應：網站忽然沒法下載 PDF 檔，出現「xxx.pdf 無法安全下載」提示：嚴格來說，這是 Chrome/ Edge 基於安全考量對有風險檔案請你下載前三思，只要意志堅定勇於嘗試，應會找到【...】、【保留】、【仍要保留】這條祕徑進入隱藏關卡，叫出原本的下載介面：很顯然，這個關卡...

打造支援 OpenAPI 標準的 Minimal API

2024-04-22 10:55 PM

4,585

OpenAPI 已成 Web API 的業界標準，背後有強大的生態體系，豐富的文件/程式碼產生器以測試工具，這些好處過去我已有所體會。(參考：再探 WebAPI 客戶端自動產生器 - AutoRest、NSwag 與 .NET 3.5 支援問題) 而隨著我的專案大多改用 ASP.NET Core M...

網頁排版與可讀性 - 字型大小與行高

2024-04-21 09:59 PM

2,325

朋友分享了一篇網路文章，題材我有興趣，但讀來帶有痛苦感，像是馬拉松最後階段，得靠意志力才能撐下去不棄賽，但我明明是在讀第一段呀。做了民調，原來不只我有這種感覺。嚴格來說，文章用字還算淺白通順，到底什麼原因讓它散發著「別讀了，快放棄吧，這些文字不是你能駕御的」的暗示？ (以上非原文章，是用廢文產生...

Python 練習：CSV 繪製樞鈕分析圖表

2024-04-20 10:44 AM

2,686

不時有需要將測試結果轉成樞鈕分析圖表的場合，過去遇上這類需求，我的 SOP 都是輸出 CSV 匯入 Excel，再拖拉操作一番交差。說來不難，但需要一堆點選操作，沒法整成自動化流程。上回體驗過用 Python 算平均、標準差、95 百分位數畫成圖表的流暢體驗，決定也來練習用 Python 產生樞鈕...

在 React.js 網頁模擬文字輸入及滑鼠點擊

2024-04-19 11:43 PM

2,891

如果有人問你，要怎麼寫 JavaScript 在以下網頁的 textarea 欄位塞值並按下送出鈕，你可能會像我噗哧一笑，想說這是什麼白痴問題？然後用肌肉記憶生出兩行程式碼： document.querySelector('textarea.ant-input').value = 'summar...

包山包海的殺手級 LLM 整合平台 - Anything LLM

2024-04-16 10:56 PM

40,562

之前試過用 Chatty GPT 打造個人專屬 ChatGPT 聊天室，但受限只能在本機桌面跑，無法多人使用。後來試了自架 Chatbot UI 伺服器因綁了 Supabase 太笨重，想等作者改 SQLite 版再用。現在看來不用等 Chatbot UI 了! 有個包山包海的殺手級 LLM 整合...

.NET 呼叫 Ollama 範例與 CPU 使用率問題

2024-04-14 10:52 PM

5,005

前幾天介紹過用 Ollama + Open WebUI 跑本地 LLM 的懶人做法，只靠 CPU 速度不甚理想。沒 GPU 學人玩地端 LLM，慢到靠北也是剛好而已。。話雖如此，基於好奇我很想看看若 CPU 核數加倍再加倍，效能會不會有明顯提升，便在 Azure 開了台 48 vCPU VM 短...

Qdrant 向量資料庫基本練習

2024-04-13 06:10 AM

6,937

昨天看了一輪常見的向量資料庫，其中 Rust 開發強調效能且支援 Docker 執行的 Qdrant 深得我心。這篇就來練習用 C# 寫入向量資料到 Qdrant 並進行向量相似性搜索。開始前需要對 Embedding、向量相似性等有基本概念，還不清楚的同學推薦前幾天的向量資料庫概念科普影片，而這...

RAG 基礎 - 常見向量資料庫整理

2024-04-12 09:08 PM

10,694

前幾天分享過向量資料庫概念科普，這篇也算豬走路系列，快速看一下 RAG 常用的向量資料庫選項，增廣見聞為主，點到為止。而我出發的角度比較另類，預估未來主要會用 Semantic Kernel 框架開發 RAG 應用程式，所以會先從 SK 提到的向量資料庫看起。早期 SK 提供一套名為 Seman...

傻瓜 LLM 架設 - Ollama + Open WebUI 之 Docker Compose 懶人包

2024-04-11 10:56 PM

29,822

不久前發現不需要 GPU 也能在本機跑 LLM 模型的 llama.cpp，接著如雨後春筍冒出一堆好用地端 LLM 整合平台或工具，例如：可一個指令下載安裝跑 LLM 的 Ollama (延伸閱讀：介紹好用工具：Ollama 快速在本地啟動並執行大型語言模型 by 保哥)，還有為 Ollama 加上...

不專業整理 - A100 / RTX 6000 / 4090 價格與 LLM 效能數據

2024-04-10 08:49 PM

11,464

論大型語言模型(LLM)，目前仍由 ChatGPT 稱霸，要開發相關應用，LLM 模型訓練及執行成本很高(參考：訓練大型語言模型有多燒錢？)，透過 OpenAI 或 Azure 的 API 整合應是成本效益比較高的做法，不過，有些應用情境不允許資料上傳到雲端，或必須重訓練或微調以符合需求，就必須考...

YT 筆記：向量資料庫概念科普

2024-04-09 08:56 PM

9,998

在 RAG 架構中，ChatGPT 等 LLM 之所以能回答專屬領域問題，其關鍵在於已事先將相關文件、影像、資訊消化後存進資料庫並建立索引，當使用者詢問時，先透過索引找到資料，再由 LLM 彙整查詢結果給出答案。來源文字甚至影像之所以能被搜尋，是因為它先經 Embedding 轉為量並存進向量...

印表機感光鼓更換經驗一則

2024-04-08 09:28 PM

4,590

前陣子 PDF 投影片排版列印文末提到我家印表機列印品質每況愈下，之前清過一次感光鼓解決黑點雜線問題，但列印成品顏色偏淡不清楚。上回清理感光鼓學到「感光鼓屬消耗品，用久了可能需要更換」，但經驗不足無法判斷是感光鼓，理由是：印表機買了七八年但印量很少，剛滿兩千張，依規格感光鼓壽命有 12,000 張...

閱讀筆記 - LLM 模型發展歷程基本知識

2024-04-07 09:50 AM

7,253

ChatGPT 帶起大型語言模型(LLM)熱潮，對程式開發產業帶來無法忽視的衝搫。有程式需求但不會寫？跟 ChatGPT 許願就有。一行行敲程式碼太慢？Github Copilot 知道你想做什麼，自動幫你寫完。C# 老鳥遇到適合用其他語言開發的情境，不需要抱著 .NET 硬幹，有 Github C...

閒聊 - 開源程式庫 XZ Utils 臥底下毒事件

2024-04-06 10:50 AM

8,251

本週開源界與資安界有則大新聞：程式庫 XZ Utils近期被植入後門 by iThome 特別讓人震驚是因為 XZ Utils 是 Linux 很基本很常用的壓縮程式庫，若真的被成功植入擴散到現存的 Linux 系統，後果不堪設想。而攻擊手法也很罕見，攻擊者假扮自願程式維護人員多年，於今年二月底才發...