PinnedPyTorch深度學習工具箱本文把文章標題取名成PyTorch深度學習工具箱的用意是在於: 日常在進行PyTorch模型訓練的時候,如果想知道模型的好壞,我們會用不少方式去評估。例如:Confusion Matrix、per class accuracy、F1…Jul 6, 2021Jul 6, 2021
Qwen3: Think Deeper, Act Faster本文的核心研究主題是提出了一種名為 Qwen3 的新型大型語言模型 (LLM) 家族。這個概念的具體內涵包括利用混合專家 (MoE) 架構提升效率、引入創新的「混合思考模式」(Hybrid Thinking Mode) 以平衡推理深度與反應速度,並大幅擴展多語言支援能力。19h ago19h ago
Cursor / Windusrf / VSCode如何解決透過SSH連線到Remote時卡在Downloading vscode server step?在settings.json把 remote.SSH.useExecServer: true 改成remote.SSH.useExecServer: false 或是把RemoteSSH套件設定的"Use Exec Server"選項取消勾選。Apr 22Apr 22
什麼是 Agent2Agent (A2A) Protocol?我們可以把 A2A 想像成 AI Agent 之間的「共通語言協議」。以前,AI Agents(像聊天機器人、任務助手)通常是孤立的,各自用自己的技術架構開發。A2A 的誕生,就像是幫這些 Agent…Apr 21Apr 21
從「會答」到「會用工具」-o‑系列的思考力躍遷:OpenAI o3 & o4-mini在人工智慧日新月異的賽道上,OpenAI 再次把「思考」提到新高度。 4 月17 日,OpenAI 正式推出了全新o‑系列型號o3與o4‑mini,它們不僅是迄今為止最「聰明」的ChatGPT,也是在「深度推理」上一次關鍵的飛躍Apr 17Apr 17
InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models不同於傳統先訓練純文字大型語言模型 (LLM) 再進行post-hoc adaptation的方法,InternVL3在單一預訓練階段就同時處理和學習來自純文字語料庫和多樣化多模態數據 (如圖像-文本對、視頻-文本對) 的知識,使得語言能力和多模態能力得以聯合獲取與內在對齊。Apr 15Apr 15
🚀 GPT-4.1 全面升級:程式編寫、指令理解與長文本處理的突破GPT-4.1 系列模型專為實際應用設計,特別適合開發 AI 代理人(Agents),可用於: 自動化程式開發與除錯、分析大型文件與提取資訊、處理客戶服務請求、多語言內容生成與翻譯。Apr 15Apr 15
🚀 使用 rclone 將檔案上傳至 Google Drive當你在遠端伺服器上工作時,想要將資料備份或同步至 Google Drive,卻沒有超級使用者(sudo)權限,該怎麼辦?別擔心,本篇教學將帶你使用輕量又強大的工具 rclone,在無需 sudo 權限的情況下,實現從遠端伺服器上傳檔案到 Google Drive 的功能。Apr 9Apr 9
Qwen2.5-VL Technical Report本文介紹了Qwen視覺語言模型系列的最新旗艦模型 Qwen2.5-VL。其核心概念在於通過顯著提升基礎能力和引入創新功能,實現多模態理解與互動的重大突破。具體內涵包括:增強的視覺識別、精確的物體定位 (邊界框/點)、強大的文檔解析 (包括表格、圖表、公式等) 和長影片理解。Apr 8Apr 8