2951 字
16 分鐘
請注意,本文最後修改於 0 天前。
📰 科技風向標 · 2026-07-02
Cover image for 📰 科技風向標 · 2026-07-02

#🧠 模型發佈/更新

#1. 美團 LongCat-2.0 正式發佈:國產算力集群訓練的萬億參數大模型

美團於6月30日發佈新一代萬億參數大模型LongCat-2.0並開源。總參數1.6T,平均激活約48B,原生支持1M超長上下文,在五萬卡國產算力集群上完成全流程訓練與推理。採用LSA稀疏注意力、零計算專家、ScMoE及MOPD多專家融合(Agent/Reasoning/Interaction三組專家)架構。評測中SWE-bench Pro獲59.5,SWE-bench Multilingual獲77.3。預覽版已通過OpenRouter和longcat.ai開放,月調用量躋身OpenRouter全球前三。

TIP

來源:公眾號:龍貓LongCat(美團)

#2. NVIDIA 發佈 Nemotron-Labs-TwoTower 開放權重擴散語言模型

NVIDIA 發佈 Nemotron-Labs-TwoTower,基於凍結的自迴歸骨幹 Nemotron-3-Nano-30B-A3B 的擴散語言模型。採用雙塔架構:上下文塔凍結,降噪器塔訓練,通過層對齊交叉注意力和狀態播種協作。在 2×H100 上 BF16 評估,保留 98.7% 的 AR 基線質量,生成吞吐量提升 2.42 倍(γ=0.8,塊大小 S=16)。降噪器在約 2.1T token 上訓練,骨幹使用 25T token 預訓練。總參數約 60B,每 token 活躍參數約 3B/塔。支持擴散、模擬 AR 和 AR 三種解碼模式。

TIP

來源:MarkTechPost(RSS)


#🚀 產品發佈/更新

#3. xAI 發佈 Voice Agent Builder 測試版

xAI 推出 Voice Agent Builder 測試版,這是一個基於 Grok Voice 的無代碼平臺,可在兩分鐘內創建生產級語音智能體。它集成電話、知識檢索、工具、MCP、Guardrails 及可觀測性,支持連接現有 SIP 號碼、API 和 WebSocket,採用語音到語音路徑。在 τ-voice Bench 上,Grok Voice Think Fast 1.0 得分 67.3%,領先 Gemini 3.1 Flash Live(43.8%)和 GPT Realtime 1.5(35.3%)。定價為每分鐘音頻 0.05 美元、電話費 0.01 美元,提供 80+ 種語音及聲音克隆,每個賬戶附贈一個免費電話號碼。

TIP

來源:xAI:News(網頁)

#4. Google Cloud Workbench Notebooks 擴展發佈:在 VS Code 中連接雲端 Jupyter 環境

Google Cloud Workbench Notebooks 擴展正式上線,開發者可在 VS Code 中直接連接可擴展的雲端 Jupyter 環境,無需切換上下文即可利用高性能 Google Cloud 基礎設施完成機器學習全流程。該擴展已完全開源,可在 GitHub 和 VS Code Marketplace 獲取。

TIP

來源:Google Developers Blog(RSS)

#5. 智譜推出GLM-5.2官方開發環境ZCode

推出 ZCode,GLM-5.2 的官方開發環境 - GLM Coding Plan 訂閱用戶:現可在 ZCode 獲得 1.5 倍使用配額 - 支持 BYOK:可與您現有的訂閱和 API 配合使用 - 適用於 macOS、Windows 和 Linux 立即下載:https://zcode.z.ai/en

TIP

來源:X:智譜 Z.ai (@Zai_org)

#6. Claude Code v2.1.198 發佈

Claude Code v2.1.198 更新。Claude in Chrome 現已全面可用。為 claude agents 新增後臺智能體通知(agent_needs_input / agent_completed)。新增 /dataviz 技能,提供圖表與儀表盤設計指導及配色驗證器。Gateway 增加 AWS 上的 Claude Platform 作為上游提供商。後臺智能體在 worktree 中完成代碼後自動提交、推送並創建草稿 PR。內置 Explore 智能體現繼承主會話模型(上限 opus)。修復網絡短暫斷開導致響應中斷、後臺任務卡在“Running”狀態、智能體團隊隊友因 API 錯誤失敗等問題。

TIP

來源:Claude Code:GitHub Releases(RSS)

#7. Cloudflare 推出全新AI流量管理選項:區分搜索、智能體與訓練爬蟲,保護廣告頁面

Cloudflare 為所有網站所有者提供更精細的AI流量管控選項,取代一刀切的屏蔽方式。用戶可輕鬆區分並管理搜索爬蟲、AI智能體爬蟲和訓練爬蟲,同時新增保護廣告變現頁面的能力。

TIP

來源:Cloudflare Blog

#8. 用 Genkit 構建智能體全棧應用

開源框架 Genkit 推出 Agents API,將消息歷史、工具循環和流式傳輸封裝為單一接口,簡化對話 AI 開發。該 API 支持服務器或客戶端管理的狀態持久化,可實現歷史分支、長時間運行的分離任務及多智能體協調等高級工作流,並通過統一線協議連接前後端。目前以 TypeScript 和 Go 預覽版發佈,集成 Genkit Developer UI,開發者無需編寫客戶端代碼即可測試、調試和檢查智能體快照。

TIP

來源:Google Developers Blog(RSS)

#9. Cloudflare 推出 Monetization Gateway:通過 x402 協議為任何資源收費

Cloudflare 開放 Monetization Gateway 候補名單,允許對 Cloudflare 背後的任何網頁、數據集、API 或 MCP 工具收費。費用通過 x402 開放協議以穩定幣結算,用戶無需自建支付棧。

TIP

來源:Cloudflare Blog

#10. 我們為何構建ADK 2.0

Google官方博客闡述了構建ADK 2.0的動機——包括核心特性與升級理由,並解釋了開發者應考慮遷移的原因。該文章發佈於ADK 2.0正式上線次日。

TIP

來源:Google Developers Blog(RSS)


#🏛️ 行業動態

#11. Claude Code 相關地區識別爭議:社群質疑透明度

有社群文章指稱 Claude Code 曾出現地區識別與提示格式標記相關爭議,涉及本地環境資訊、加密清單比對與輸出格式差異等做法。相關討論主要聚焦於透明度、可審計性與用戶信任,後續仍需以官方說明與可驗證證據為準。

TIP

來源:公眾號:數字生命卡茲克

#12. Meta效仿SpaceX,將過剩AI算力變現

據Bloomberg報道,Meta正計劃推出雲基礎設施業務Meta Compute,對外出售AI計算能力和模型訪問權限,直接與AWS、Google Cloud及Azure競爭。Meta已承諾未來幾年投入1829億美元建設AI基礎設施,其中俄亥俄州數據中心(規模如曼哈頓)將於今年上線。新業務由基礎設施主管Santosh Janardhan、Meta超級智能實驗室負責人Daniel Gross和總裁Dina Powell McCormick領導。Meta可能效仿CoreWeave出售裸計算能力,並像AWS一樣託管AI模型(包括近期發佈的閉源模型Muse Spark)。扎克伯格此前已表示雲業務“definitely on the tabl…

TIP

來源:TechCrunch:AI(RSS)

#13. OpenAI論文揭示GPT-5.6三個Pro變體,打破單一頂級策略

OpenAI論文首次列出GPT-5.6的三個Pro變體:Luna Pro、Terra Pro和Sol Pro,取代以往單一Pro模式。在基因組學基準中,Sol Pro通過率31.5%居60個測試模型之首,領先標準Sol(28.7%)和Claude Opus 4.8(16.0%)。Pro相比標準版本提升逐級遞減:Luna Pro提升7.1個百分點(16.5%→23.6%),Terra Pro提升5.2(23.3%→28.5%),Sol Pro僅提升2.8(28.7%→31.5%)。Terra Pro(28.5%)幾乎與標準Sol(28.7%)持平。論文未披露Pro運行的token用量,也不清楚該分層是否會在ChatGPT中實際推出。

TIP

來源:The Decoder:AI News(RSS)

#14. 亞馬遜 AWS 砸 10 億美元,派遣工程師進駐客戶公司

亞馬遜 AWS 宣佈設立新部門,組建前置駐場工程師團隊,先期投入 10 億美元(約 67.97 億元人民幣)。團隊分批派駐客戶企業,每批 5-6 組工程師,駐場週期 45 天,協助客戶落地人工智能軟件與智能體應用。該模式在 Palantir、Salesforce、Anthropic、谷歌雲等企業已有先例,領英數據顯示 2023 至 2025 年間同類崗位需求增長 42 倍。新部門員工規模將達數千人,首批客戶包括 NBA 與理光。

TIP

來源:IT之家(RSS)

#15. Runway 宣佈與 Bertelsmann 達成創意合作

Runway 宣佈與 Bertelsmann 建立創意合作伙伴關係。雙方將在創意內容領域展開合作,具體合作細節尚未披露。

TIP

來源:Runway:News(網頁)

#16. Google 2026年6月AI更新彙總

Google在6月發佈多項AI更新:推出Gemini 3.5 Live Translate實時語音翻譯;

TIP

來源:Google Blog:AI(RSS)

#17. 紐約市教育界和行業領袖齊聚Google AI教育峰會 共議AI課堂未來

Google與New York Jobs CEO Council、Urban Assembly聯合舉辦AI教育峰會,150名教育及行業領袖參與。通過aiEDU的“Vibe Coding”和Google的“Meet LEA”實踐環節,與會者探索了Google AI mode和NotebookLM如何激發好奇心、提升AI素養。行業領袖指出,AI的真正價值在於賦能問題解決,而適應性、協作、批判性判斷等“人類技能”愈發關鍵。與會者一致同意,需堅守隱私和公平訪問原則。最終共識:技術創新必須與學校合作,而非繞開學校。

TIP

來源:Google Blog:AI(RSS)


#💡 技巧與觀點

#18. mattpocockuk 的 /writing-great-skills:編寫可預測 AI Skill 的指南

mattpocockuk 的 /writing-great-skills 成為其最常調用的 Skill,指導如何編寫穩定可預測的 AI Skill。核心:以過程可預測為目標;區分 model-invoked(自動觸發)與 user-invoked(用戶調用),description 應作觸發器;採用三層信息結構(主步驟、參考、外部文件)實現漸進式披露;每步驟需明確完成標準;拆分 Skill 是為了控制模型注意力;利用 leading word 壓縮行為要求。同時診斷五種失敗模式:Premature completion、Duplication、Sediment、Sprawl、No-op,並提供 No-op 測試作為判斷句子是否有效的…

TIP

來源:X:邵猛 (@shao__meng)

#19. Meta 大規模 AI 存儲藍圖

Meta 運營數百 EB 級存儲集群,基於 Tectonic 分層存儲層構建 BLOB 存儲架構,以應對兩大挑戰:最大化 GPU 利用率與研究迭代速度。傳統 BLOB 架構的多層元數據查詢可導致數百毫秒延遲,使 GPU 因 I/O 等待停頓。新架構將訓練棧逐步遷移到 BLOB 存儲接口上,利用閃存提供可預測的低 pMax 延遲,避免單 GPU 慢速拖慢整批任務。同時,統一的數據湖訪問支持地理分佈 GPU 間的數據高速注入與跨區移動,提升研究效率。

TIP

來源:Meta Engineering Blog(RSS)

#20. 構建AI智能體應優先設計路由

構建AI智能體時,應優先設計路由(router)而非選擇模型。路由決定每個請求由哪層模型處理。正確路由可使70-80%流量運行在免費本地模型或異步推理上,將AI開銷降低90%+。Brian Armstrong指出Coinbase通過更好的默認設置、路由和緩存,在token使用量增長的同時將AI支出減半。路由分三層:技能分類器、路由器、模型選擇器。本地計算近乎零成本,異步批量推理比實時推理便宜兩個數量級。大多數工作無需秒級返回。同步預測器標記複雜任務,夜間批量評估器更新路由權重。技能蒸餾後,非編碼類任務中70-80%智能體流量可由本地模型處理。

TIP

來源:Tomer Tunguz 博客(VC 分析)

#21. 關於AI重大問題的獲獎徵文

Dwarkesh Patel舉辦的AI徵文比賽評選出三位獲獎者。第一名Jassi Pannu主張OpenAI基金會應投入數十億美元終結空氣傳播疾病,利用AI加速自主生物學發現,可帶來超1萬億美元年GDP增長並消除災難性流行病風險。第二名Ege Erdil建議AI供應鏈外的國家通過強產權、低資本稅和開放監管政策抓住增長機會。第三名Michael Li類比香港地鐵商業模式,提出AI實驗室可通過收購互補性資產盈利。

TIP

來源:Dwarkesh Patel:Podcast & Blog(RSS)

#22. 內容獨立日一週年:構建智能體互聯網的商業模型

內容獨立日宣佈一年後,一個付費內容的動態市場已正式形成。自主AI智能體的興起正在顛覆傳統搜索推薦模式,構建可持續的網絡經濟需要一套全新基礎設施來支撐。

TIP

來源:Cloudflare Blog

📰 科技風向標 · 2026-07-02
https://illumi.love/posts/日報向/2026-07-02/
作者
𝑰𝒍𝒍𝒖𝒎𝒊糖糖
發布於
2026-07-02
許可協議
🔒CC BY-NC-ND 4.0
分享

如果這篇文章對你有幫助,歡迎分享給更多人!

💬 參與討論
使用 GitHub 帳號登入參與討論