📰 科技風向標 · 2026-07-02

#🧠 模型發佈/更新

#1. 美團 LongCat-2.0 正式發佈：國產算力集群訓練的萬億參數大模型

美團於6月30日發佈新一代萬億參數大模型LongCat-2.0並開源。總參數1.6T，平均激活約48B，原生支持1M超長上下文，在五萬卡國產算力集群上完成全流程訓練與推理。採用LSA稀疏注意力、零計算專家、ScMoE及MOPD多專家融合（Agent/Reasoning/Interaction三組專家）架構。評測中SWE-bench Pro獲59.5，SWE-bench Multilingual獲77.3。預覽版已通過OpenRouter和longcat.ai開放，月調用量躋身OpenRouter全球前三。

TIP
來源：公眾號：龍貓LongCat（美團）

#2. NVIDIA 發佈 Nemotron-Labs-TwoTower 開放權重擴散語言模型

NVIDIA 發佈 Nemotron-Labs-TwoTower，基於凍結的自迴歸骨幹 Nemotron-3-Nano-30B-A3B 的擴散語言模型。採用雙塔架構：上下文塔凍結，降噪器塔訓練，通過層對齊交叉注意力和狀態播種協作。在 2×H100 上 BF16 評估，保留 98.7% 的 AR 基線質量，生成吞吐量提升 2.42 倍（γ=0.8，塊大小 S=16）。降噪器在約 2.1T token 上訓練，骨幹使用 25T token 預訓練。總參數約 60B，每 token 活躍參數約 3B/塔。支持擴散、模擬 AR 和 AR 三種解碼模式。

TIP
來源：MarkTechPost（RSS）

#🚀 產品發佈/更新

#3. xAI 發佈 Voice Agent Builder 測試版

xAI 推出 Voice Agent Builder 測試版，這是一個基於 Grok Voice 的無代碼平臺，可在兩分鐘內創建生產級語音智能體。它集成電話、知識檢索、工具、MCP、Guardrails 及可觀測性，支持連接現有 SIP 號碼、API 和 WebSocket，採用語音到語音路徑。在 τ-voice Bench 上，Grok Voice Think Fast 1.0 得分 67.3%，領先 Gemini 3.1 Flash Live（43.8%）和 GPT Realtime 1.5（35.3%）。定價為每分鐘音頻 0.05 美元、電話費 0.01 美元，提供 80+ 種語音及聲音克隆，每個賬戶附贈一個免費電話號碼。

TIP
來源：xAI：News（網頁）

#4. Google Cloud Workbench Notebooks 擴展發佈：在 VS Code 中連接雲端 Jupyter 環境

Google Cloud Workbench Notebooks 擴展正式上線，開發者可在 VS Code 中直接連接可擴展的雲端 Jupyter 環境，無需切換上下文即可利用高性能 Google Cloud 基礎設施完成機器學習全流程。該擴展已完全開源，可在 GitHub 和 VS Code Marketplace 獲取。

TIP
來源：Google Developers Blog（RSS）

#5. 智譜推出GLM-5.2官方開發環境ZCode

推出 ZCode，GLM-5.2 的官方開發環境 - GLM Coding Plan 訂閱用戶：現可在 ZCode 獲得 1.5 倍使用配額 - 支持 BYOK：可與您現有的訂閱和 API 配合使用 - 適用於 macOS、Windows 和 Linux 立即下載：https://zcode.z.ai/en

TIP
來源：X：智譜 Z.ai (@Zai_org)

#6. Claude Code v2.1.198 發佈

Claude Code v2.1.198 更新。Claude in Chrome 現已全面可用。為 claude agents 新增後臺智能體通知（agent_needs_input / agent_completed）。新增 /dataviz 技能，提供圖表與儀表盤設計指導及配色驗證器。Gateway 增加 AWS 上的 Claude Platform 作為上游提供商。後臺智能體在 worktree 中完成代碼後自動提交、推送並創建草稿 PR。內置 Explore 智能體現繼承主會話模型（上限 opus）。修復網絡短暫斷開導致響應中斷、後臺任務卡在“Running”狀態、智能體團隊隊友因 API 錯誤失敗等問題。

TIP
來源：Claude Code：GitHub Releases（RSS）

#7. Cloudflare 推出全新AI流量管理選項：區分搜索、智能體與訓練爬蟲，保護廣告頁面

Cloudflare 為所有網站所有者提供更精細的AI流量管控選項，取代一刀切的屏蔽方式。用戶可輕鬆區分並管理搜索爬蟲、AI智能體爬蟲和訓練爬蟲，同時新增保護廣告變現頁面的能力。

TIP
來源：Cloudflare Blog

#8. 用 Genkit 構建智能體全棧應用

開源框架 Genkit 推出 Agents API，將消息歷史、工具循環和流式傳輸封裝為單一接口，簡化對話 AI 開發。該 API 支持服務器或客戶端管理的狀態持久化，可實現歷史分支、長時間運行的分離任務及多智能體協調等高級工作流，並通過統一線協議連接前後端。目前以 TypeScript 和 Go 預覽版發佈，集成 Genkit Developer UI，開發者無需編寫客戶端代碼即可測試、調試和檢查智能體快照。

TIP
來源：Google Developers Blog（RSS）

#9. Cloudflare 推出 Monetization Gateway：通過 x402 協議為任何資源收費

Cloudflare 開放 Monetization Gateway 候補名單，允許對 Cloudflare 背後的任何網頁、數據集、API 或 MCP 工具收費。費用通過 x402 開放協議以穩定幣結算，用戶無需自建支付棧。

TIP
來源：Cloudflare Blog

#10. 我們為何構建ADK 2.0

Google官方博客闡述了構建ADK 2.0的動機——包括核心特性與升級理由，並解釋了開發者應考慮遷移的原因。該文章發佈於ADK 2.0正式上線次日。

TIP
來源：Google Developers Blog（RSS）

#🏛️ 行業動態

#11. Claude Code 相關地區識別爭議：社群質疑透明度

有社群文章指稱 Claude Code 曾出現地區識別與提示格式標記相關爭議，涉及本地環境資訊、加密清單比對與輸出格式差異等做法。相關討論主要聚焦於透明度、可審計性與用戶信任，後續仍需以官方說明與可驗證證據為準。

TIP
來源：公眾號：數字生命卡茲克

#12. Meta效仿SpaceX，將過剩AI算力變現

據Bloomberg報道，Meta正計劃推出雲基礎設施業務Meta Compute，對外出售AI計算能力和模型訪問權限，直接與AWS、Google Cloud及Azure競爭。Meta已承諾未來幾年投入1829億美元建設AI基礎設施，其中俄亥俄州數據中心（規模如曼哈頓）將於今年上線。新業務由基礎設施主管Santosh Janardhan、Meta超級智能實驗室負責人Daniel Gross和總裁Dina Powell McCormick領導。Meta可能效仿CoreWeave出售裸計算能力，並像AWS一樣託管AI模型（包括近期發佈的閉源模型Muse Spark）。扎克伯格此前已表示雲業務“definitely on the tabl…

TIP
來源：TechCrunch：AI（RSS）

#13. OpenAI論文揭示GPT-5.6三個Pro變體，打破單一頂級策略

OpenAI論文首次列出GPT-5.6的三個Pro變體：Luna Pro、Terra Pro和Sol Pro，取代以往單一Pro模式。在基因組學基準中，Sol Pro通過率31.5%居60個測試模型之首，領先標準Sol（28.7%）和Claude Opus 4.8（16.0%）。Pro相比標準版本提升逐級遞減：Luna Pro提升7.1個百分點（16.5%→23.6%），Terra Pro提升5.2（23.3%→28.5%），Sol Pro僅提升2.8（28.7%→31.5%）。Terra Pro（28.5%）幾乎與標準Sol（28.7%）持平。論文未披露Pro運行的token用量，也不清楚該分層是否會在ChatGPT中實際推出。

TIP
來源：The Decoder：AI News（RSS）

#14. 亞馬遜 AWS 砸 10 億美元，派遣工程師進駐客戶公司

亞馬遜 AWS 宣佈設立新部門，組建前置駐場工程師團隊，先期投入 10 億美元（約 67.97 億元人民幣）。團隊分批派駐客戶企業，每批 5-6 組工程師，駐場週期 45 天，協助客戶落地人工智能軟件與智能體應用。該模式在 Palantir、Salesforce、Anthropic、谷歌雲等企業已有先例，領英數據顯示 2023 至 2025 年間同類崗位需求增長 42 倍。新部門員工規模將達數千人，首批客戶包括 NBA 與理光。

TIP
來源：IT之家（RSS）

#15. Runway 宣佈與 Bertelsmann 達成創意合作

Runway 宣佈與 Bertelsmann 建立創意合作伙伴關係。雙方將在創意內容領域展開合作，具體合作細節尚未披露。

TIP
來源：Runway：News（網頁）

#16. Google 2026年6月AI更新彙總

Google在6月發佈多項AI更新：推出Gemini 3.5 Live Translate實時語音翻譯；

TIP
來源：Google Blog：AI（RSS）

#17. 紐約市教育界和行業領袖齊聚Google AI教育峰會共議AI課堂未來

Google與New York Jobs CEO Council、Urban Assembly聯合舉辦AI教育峰會，150名教育及行業領袖參與。通過aiEDU的“Vibe Coding”和Google的“Meet LEA”實踐環節，與會者探索了Google AI mode和NotebookLM如何激發好奇心、提升AI素養。行業領袖指出，AI的真正價值在於賦能問題解決，而適應性、協作、批判性判斷等“人類技能”愈發關鍵。與會者一致同意，需堅守隱私和公平訪問原則。最終共識：技術創新必須與學校合作，而非繞開學校。

TIP
來源：Google Blog：AI（RSS）

#💡 技巧與觀點

#18. mattpocockuk 的 /writing-great-skills：編寫可預測 AI Skill 的指南

mattpocockuk 的 /writing-great-skills 成為其最常調用的 Skill，指導如何編寫穩定可預測的 AI Skill。核心：以過程可預測為目標；區分 model-invoked（自動觸發）與 user-invoked（用戶調用），description 應作觸發器；採用三層信息結構（主步驟、參考、外部文件）實現漸進式披露；每步驟需明確完成標準；拆分 Skill 是為了控制模型注意力；利用 leading word 壓縮行為要求。同時診斷五種失敗模式：Premature completion、Duplication、Sediment、Sprawl、No-op，並提供 No-op 測試作為判斷句子是否有效的…

TIP
來源：X：邵猛 (@shao__meng)

#19. Meta 大規模 AI 存儲藍圖

Meta 運營數百 EB 級存儲集群，基於 Tectonic 分層存儲層構建 BLOB 存儲架構，以應對兩大挑戰：最大化 GPU 利用率與研究迭代速度。傳統 BLOB 架構的多層元數據查詢可導致數百毫秒延遲，使 GPU 因 I/O 等待停頓。新架構將訓練棧逐步遷移到 BLOB 存儲接口上，利用閃存提供可預測的低 pMax 延遲，避免單 GPU 慢速拖慢整批任務。同時，統一的數據湖訪問支持地理分佈 GPU 間的數據高速注入與跨區移動，提升研究效率。

TIP
來源：Meta Engineering Blog（RSS）

#20. 構建AI智能體應優先設計路由

構建AI智能體時，應優先設計路由（router）而非選擇模型。路由決定每個請求由哪層模型處理。正確路由可使70-80%流量運行在免費本地模型或異步推理上，將AI開銷降低90%+。Brian Armstrong指出Coinbase通過更好的默認設置、路由和緩存，在token使用量增長的同時將AI支出減半。路由分三層：技能分類器、路由器、模型選擇器。本地計算近乎零成本，異步批量推理比實時推理便宜兩個數量級。大多數工作無需秒級返回。同步預測器標記複雜任務，夜間批量評估器更新路由權重。技能蒸餾後，非編碼類任務中70-80%智能體流量可由本地模型處理。

TIP
來源：Tomer Tunguz 博客（VC 分析）

#21. 關於AI重大問題的獲獎徵文

Dwarkesh Patel舉辦的AI徵文比賽評選出三位獲獎者。第一名Jassi Pannu主張OpenAI基金會應投入數十億美元終結空氣傳播疾病，利用AI加速自主生物學發現，可帶來超1萬億美元年GDP增長並消除災難性流行病風險。第二名Ege Erdil建議AI供應鏈外的國家通過強產權、低資本稅和開放監管政策抓住增長機會。第三名Michael Li類比香港地鐵商業模式，提出AI實驗室可通過收購互補性資產盈利。

TIP
來源：Dwarkesh Patel：Podcast & Blog（RSS）

#22. 內容獨立日一週年：構建智能體互聯網的商業模型

內容獨立日宣佈一年後，一個付費內容的動態市場已正式形成。自主AI智能體的興起正在顛覆傳統搜索推薦模式，構建可持續的網絡經濟需要一套全新基礎設施來支撐。

TIP
來源：Cloudflare Blog

#🧠 模型發佈/更新

#1. 美團 LongCat-2.0 正式發佈：國產算力集群訓練的萬億參數大模型

#2. NVIDIA 發佈 Nemotron-Labs-TwoTower 開放權重擴散語言模型

#🚀 產品發佈/更新

#3. xAI 發佈 Voice Agent Builder 測試版

#4. Google Cloud Workbench Notebooks 擴展發佈：在 VS Code 中連接雲端 Jupyter 環境

#5. 智譜推出GLM-5.2官方開發環境ZCode

#6. Claude Code v2.1.198 發佈

#7. Cloudflare 推出全新AI流量管理選項：區分搜索、智能體與訓練爬蟲，保護廣告頁面

#8. 用 Genkit 構建智能體全棧應用

#9. Cloudflare 推出 Monetization Gateway：通過 x402 協議為任何資源收費

#10. 我們為何構建ADK 2.0

#🏛️ 行業動態

#11. Claude Code 相關地區識別爭議：社群質疑透明度

#12. Meta效仿SpaceX，將過剩AI算力變現

#13. OpenAI論文揭示GPT-5.6三個Pro變體，打破單一頂級策略

#14. 亞馬遜 AWS 砸 10 億美元，派遣工程師進駐客戶公司

#15. Runway 宣佈與 Bertelsmann 達成創意合作

#16. Google 2026年6月AI更新彙總

#17. 紐約市教育界和行業領袖齊聚Google AI教育峰會 共議AI課堂未來

#💡 技巧與觀點

#18. mattpocockuk 的 /writing-great-skills：編寫可預測 AI Skill 的指南

#19. Meta 大規模 AI 存儲藍圖

#20. 構建AI智能體應優先設計路由

#21. 關於AI重大問題的獲獎徵文

#22. 內容獨立日一週年：構建智能體互聯網的商業模型

#17. 紐約市教育界和行業領袖齊聚Google AI教育峰會共議AI課堂未來