🧠 模型發佈/更新
1. 美團 LongCat-2.0 正式發佈:國產算力集群訓練的萬億參數大模型
美團於6月30日發佈新一代萬億參數大模型LongCat-2.0並開源。總參數1.6T,平均激活約48B,原生支持1M超長上下文,在五萬卡國產算力集群上完成全流程訓練與推理。採用LSA稀疏注意力、零計算專家、ScMoE及MOPD多專家融合(Agent/Reasoning/Interaction三組專家)架構。評測中SWE-bench Pro獲59.5,SWE-bench Multilingual獲77.3。預覽版已通過OpenRouter和longcat.ai開放,月調用量躋身OpenRouter全球前三。
TIP來源:公眾號:龍貓LongCat(美團)
2. NVIDIA 發佈 Nemotron-Labs-TwoTower 開放權重擴散語言模型
NVIDIA 發佈 Nemotron-Labs-TwoTower,基於凍結的自迴歸骨幹 Nemotron-3-Nano-30B-A3B 的擴散語言模型。採用雙塔架構:上下文塔凍結,降噪器塔訓練,通過層對齊交叉注意力和狀態播種協作。在 2×H100 上 BF16 評估,保留 98.7% 的 AR 基線質量,生成吞吐量提升 2.42 倍(γ=0.8,塊大小 S=16)。降噪器在約 2.1T token 上訓練,骨幹使用 25T token 預訓練。總參數約 60B,每 token 活躍參數約 3B/塔。支持擴散、模擬 AR 和 AR 三種解碼模式。
TIP來源:MarkTechPost(RSS)
🚀 產品發佈/更新
3. xAI 發佈 Voice Agent Builder 測試版
xAI 推出 Voice Agent Builder 測試版,這是一個基於 Grok Voice 的無代碼平臺,可在兩分鐘內創建生產級語音智能體。它集成電話、知識檢索、工具、MCP、Guardrails 及可觀測性,支持連接現有 SIP 號碼、API 和 WebSocket,採用語音到語音路徑。在 τ-voice Bench 上,Grok Voice Think Fast 1.0 得分 67.3%,領先 Gemini 3.1 Flash Live(43.8%)和 GPT Realtime 1.5(35.3%)。定價為每分鐘音頻 0.05 美元、電話費 0.01 美元,提供 80+ 種語音及聲音克隆,每個賬戶附贈一個免費電話號碼。
TIP來源:xAI:News(網頁)
4. Google Cloud Workbench Notebooks 擴展發佈:在 VS Code 中連接雲端 Jupyter 環境
Google Cloud Workbench Notebooks 擴展正式上線,開發者可在 VS Code 中直接連接可擴展的雲端 Jupyter 環境,無需切換上下文即可利用高性能 Google Cloud 基礎設施完成機器學習全流程。該擴展已完全開源,可在 GitHub 和 VS Code Marketplace 獲取。
TIP來源:Google Developers Blog(RSS)
5. 智譜推出GLM-5.2官方開發環境ZCode
推出 ZCode,GLM-5.2 的官方開發環境 - GLM Coding Plan 訂閱用戶:現可在 ZCode 獲得 1.5 倍使用配額 - 支持 BYOK:可與您現有的訂閱和 API 配合使用 - 適用於 macOS、Windows 和 Linux 立即下載:https://zcode.z.ai/en
TIP來源:X:智譜 Z.ai (@Zai_org)
6. Claude Code v2.1.198 發佈
Claude Code v2.1.198 更新。Claude in Chrome 現已全面可用。為 claude agents 新增後臺智能體通知(agent_needs_input / agent_completed)。新增 /dataviz 技能,提供圖表與儀表盤設計指導及配色驗證器。Gateway 增加 AWS 上的 Claude Platform 作為上游提供商。後臺智能體在 worktree 中完成代碼後自動提交、推送並創建草稿 PR。內置 Explore 智能體現繼承主會話模型(上限 opus)。修復網絡短暫斷開導致響應中斷、後臺任務卡在“Running”狀態、智能體團隊隊友因 API 錯誤失敗等問題。
TIP來源:Claude Code:GitHub Releases(RSS)
7. Cloudflare 推出全新AI流量管理選項:區分搜索、智能體與訓練爬蟲,保護廣告頁面
Cloudflare 為所有網站所有者提供更精細的AI流量管控選項,取代一刀切的屏蔽方式。用戶可輕鬆區分並管理搜索爬蟲、AI智能體爬蟲和訓練爬蟲,同時新增保護廣告變現頁面的能力。
TIP來源:Cloudflare Blog
8. 用 Genkit 構建智能體全棧應用
開源框架 Genkit 推出 Agents API,將消息歷史、工具循環和流式傳輸封裝為單一接口,簡化對話 AI 開發。該 API 支持服務器或客戶端管理的狀態持久化,可實現歷史分支、長時間運行的分離任務及多智能體協調等高級工作流,並通過統一線協議連接前後端。目前以 TypeScript 和 Go 預覽版發佈,集成 Genkit Developer UI,開發者無需編寫客戶端代碼即可測試、調試和檢查智能體快照。
TIP來源:Google Developers Blog(RSS)
9. Cloudflare 推出 Monetization Gateway:通過 x402 協議為任何資源收費
Cloudflare 開放 Monetization Gateway 候補名單,允許對 Cloudflare 背後的任何網頁、數據集、API 或 MCP 工具收費。費用通過 x402 開放協議以穩定幣結算,用戶無需自建支付棧。
TIP來源:Cloudflare Blog
10. 我們為何構建ADK 2.0
Google官方博客闡述了構建ADK 2.0的動機——包括核心特性與升級理由,並解釋了開發者應考慮遷移的原因。該文章發佈於ADK 2.0正式上線次日。
TIP來源:Google Developers Blog(RSS)
🏛️ 行業動態
11. Claude Code 相關地區識別爭議:社群質疑透明度
有社群文章指稱 Claude Code 曾出現地區識別與提示格式標記相關爭議,涉及本地環境資訊、加密清單比對與輸出格式差異等做法。相關討論主要聚焦於透明度、可審計性與用戶信任,後續仍需以官方說明與可驗證證據為準。
TIP來源:公眾號:數字生命卡茲克
12. Meta效仿SpaceX,將過剩AI算力變現
據Bloomberg報道,Meta正計劃推出雲基礎設施業務Meta Compute,對外出售AI計算能力和模型訪問權限,直接與AWS、Google Cloud及Azure競爭。Meta已承諾未來幾年投入1829億美元建設AI基礎設施,其中俄亥俄州數據中心(規模如曼哈頓)將於今年上線。新業務由基礎設施主管Santosh Janardhan、Meta超級智能實驗室負責人Daniel Gross和總裁Dina Powell McCormick領導。Meta可能效仿CoreWeave出售裸計算能力,並像AWS一樣託管AI模型(包括近期發佈的閉源模型Muse Spark)。扎克伯格此前已表示雲業務“definitely on the tabl…
TIP來源:TechCrunch:AI(RSS)
13. OpenAI論文揭示GPT-5.6三個Pro變體,打破單一頂級策略
OpenAI論文首次列出GPT-5.6的三個Pro變體:Luna Pro、Terra Pro和Sol Pro,取代以往單一Pro模式。在基因組學基準中,Sol Pro通過率31.5%居60個測試模型之首,領先標準Sol(28.7%)和Claude Opus 4.8(16.0%)。Pro相比標準版本提升逐級遞減:Luna Pro提升7.1個百分點(16.5%→23.6%),Terra Pro提升5.2(23.3%→28.5%),Sol Pro僅提升2.8(28.7%→31.5%)。Terra Pro(28.5%)幾乎與標準Sol(28.7%)持平。論文未披露Pro運行的token用量,也不清楚該分層是否會在ChatGPT中實際推出。
TIP來源:The Decoder:AI News(RSS)
14. 亞馬遜 AWS 砸 10 億美元,派遣工程師進駐客戶公司
亞馬遜 AWS 宣佈設立新部門,組建前置駐場工程師團隊,先期投入 10 億美元(約 67.97 億元人民幣)。團隊分批派駐客戶企業,每批 5-6 組工程師,駐場週期 45 天,協助客戶落地人工智能軟件與智能體應用。該模式在 Palantir、Salesforce、Anthropic、谷歌雲等企業已有先例,領英數據顯示 2023 至 2025 年間同類崗位需求增長 42 倍。新部門員工規模將達數千人,首批客戶包括 NBA 與理光。
TIP來源:IT之家(RSS)
15. Runway 宣佈與 Bertelsmann 達成創意合作
Runway 宣佈與 Bertelsmann 建立創意合作伙伴關係。雙方將在創意內容領域展開合作,具體合作細節尚未披露。
TIP來源:Runway:News(網頁)
16. Google 2026年6月AI更新彙總
Google在6月發佈多項AI更新:推出Gemini 3.5 Live Translate實時語音翻譯;
TIP來源:Google Blog:AI(RSS)
17. 紐約市教育界和行業領袖齊聚Google AI教育峰會 共議AI課堂未來
Google與New York Jobs CEO Council、Urban Assembly聯合舉辦AI教育峰會,150名教育及行業領袖參與。通過aiEDU的“Vibe Coding”和Google的“Meet LEA”實踐環節,與會者探索了Google AI mode和NotebookLM如何激發好奇心、提升AI素養。行業領袖指出,AI的真正價值在於賦能問題解決,而適應性、協作、批判性判斷等“人類技能”愈發關鍵。與會者一致同意,需堅守隱私和公平訪問原則。最終共識:技術創新必須與學校合作,而非繞開學校。
TIP來源:Google Blog:AI(RSS)
💡 技巧與觀點
18. mattpocockuk 的 /writing-great-skills:編寫可預測 AI Skill 的指南
mattpocockuk 的 /writing-great-skills 成為其最常調用的 Skill,指導如何編寫穩定可預測的 AI Skill。核心:以過程可預測為目標;區分 model-invoked(自動觸發)與 user-invoked(用戶調用),description 應作觸發器;採用三層信息結構(主步驟、參考、外部文件)實現漸進式披露;每步驟需明確完成標準;拆分 Skill 是為了控制模型注意力;利用 leading word 壓縮行為要求。同時診斷五種失敗模式:Premature completion、Duplication、Sediment、Sprawl、No-op,並提供 No-op 測試作為判斷句子是否有效的…
TIP來源:X:邵猛 (@shao__meng)
19. Meta 大規模 AI 存儲藍圖
Meta 運營數百 EB 級存儲集群,基於 Tectonic 分層存儲層構建 BLOB 存儲架構,以應對兩大挑戰:最大化 GPU 利用率與研究迭代速度。傳統 BLOB 架構的多層元數據查詢可導致數百毫秒延遲,使 GPU 因 I/O 等待停頓。新架構將訓練棧逐步遷移到 BLOB 存儲接口上,利用閃存提供可預測的低 pMax 延遲,避免單 GPU 慢速拖慢整批任務。同時,統一的數據湖訪問支持地理分佈 GPU 間的數據高速注入與跨區移動,提升研究效率。
TIP來源:Meta Engineering Blog(RSS)
20. 構建AI智能體應優先設計路由
構建AI智能體時,應優先設計路由(router)而非選擇模型。路由決定每個請求由哪層模型處理。正確路由可使70-80%流量運行在免費本地模型或異步推理上,將AI開銷降低90%+。Brian Armstrong指出Coinbase通過更好的默認設置、路由和緩存,在token使用量增長的同時將AI支出減半。路由分三層:技能分類器、路由器、模型選擇器。本地計算近乎零成本,異步批量推理比實時推理便宜兩個數量級。大多數工作無需秒級返回。同步預測器標記複雜任務,夜間批量評估器更新路由權重。技能蒸餾後,非編碼類任務中70-80%智能體流量可由本地模型處理。
TIP來源:Tomer Tunguz 博客(VC 分析)
21. 關於AI重大問題的獲獎徵文
Dwarkesh Patel舉辦的AI徵文比賽評選出三位獲獎者。第一名Jassi Pannu主張OpenAI基金會應投入數十億美元終結空氣傳播疾病,利用AI加速自主生物學發現,可帶來超1萬億美元年GDP增長並消除災難性流行病風險。第二名Ege Erdil建議AI供應鏈外的國家通過強產權、低資本稅和開放監管政策抓住增長機會。第三名Michael Li類比香港地鐵商業模式,提出AI實驗室可通過收購互補性資產盈利。
TIP來源:Dwarkesh Patel:Podcast & Blog(RSS)
22. 內容獨立日一週年:構建智能體互聯網的商業模型
內容獨立日宣佈一年後,一個付費內容的動態市場已正式形成。自主AI智能體的興起正在顛覆傳統搜索推薦模式,構建可持續的網絡經濟需要一套全新基礎設施來支撐。
TIP來源:Cloudflare Blog