#%E6%A8%A1%E5%BC%8F%E8%AD%98%E5%88%A5

GripNewsGripNews
2025-10-01

🌘 利用預訓練潛在擴散模型,從 WiFi CSI 高解析度高效生成影像
➤ 從 WiFi 訊號的微小擾動中「看見」世界
arxiv.org/abs/2506.10605
研究團隊開發出一種名為 LatentCSI 的新方法,能從 WiFi CSI(通道狀態資訊)測量數據生成物理環境的影像。此方法巧妙運用預訓練的潛在擴散模型(LDM),並透過輕量級神經網路將 CSI 幅度直接映射到 LDM 的潛在空間。隨後,在潛在表示上套用 LDM 的去噪擴散過程,並輔以文字引導,最後透過 LDM 的解碼器生成高解析度影像。這種技術繞過了傳統像素空間的影像生成挑戰,省略了標準影像到影像轉換流程中常見的顯式影像編碼階段,因此能夠有效且高品質地合成影像。研究人員使用自行收集的寬頻 CSI 數據集及部分公開的 MM-Fi 數據集進行驗證,結果顯示 LatentCSI 在運算效率和感知品質上均優於直接在真實影像上訓練的對比方法,且其獨特的文字引導控制能力更增添了實用優勢。
+ 這項技術太令人驚豔了!竟然能靠 WiFi 訊號就生成影像
CSI

GripNewsGripNews
2025-09-17

🌘 我再次透過捨棄 Python 改用英文,在 ARC-AGI 競賽中奪下最高分
➤ 藉由多代理協同與進化式測試時計算,以自然語言指令取代程式碼,締造新紀錄
jeremyberman.substack.com/p/ho
Jeremy Berman 分享他如何透過革新性的「進化式測試時計算」架構,在 ARC-AGI 基準測試中再創佳績。此次他捨棄了先前基於 Python 的方法,轉而利用大型語言模型(如 Grok-4)生成自然語言指令來解決抽象模式識別的挑戰。此新方法透過多輪進化,包含指令生成、獨立與彙總式修正,大幅提升了效率與準確性,尤其在 ARC-AGI v2 上取得了創紀錄的成績,並重新定義了通用人工智慧的發展方向。
+ 太令人驚豔了!從 Python 轉向英文指令,這思路真的很有創意,而且成效卓著。這證明瞭 LLM 的潛力遠不止於程式碼生成。
+ 這篇文章深入探討了 ARC-AGI 的難點以及 LLM 在通用推

GripNewsGripNews
2025-08-21

🌗 藝術中的模式之樂
➤ 模式的力量:解鎖藝術中的深度感知與愉悅
thereader.mitpress.mit.edu/why
本文探討藝術作品如何透過重複與變奏的模式,觸發觀者的深度感知愉悅。作者以 Gustave Caillebotte 的《巴黎街景;雨天》為例,分析畫作中廣泛運用的三角形母題,以及鵝卵石、建築物立面等元素中「相同中見差異」的模式,揭示這些視覺元素如何巧妙地激發大腦中負責辨識臉孔、場景與身體的特定區域,進而創造出結構、節奏與深度,解釋為何繪畫即使在攝影技術出現後仍能持續吸引眾人。
+ 這篇文章提供了對藝術欣賞非常獨特且有見地的角度。我過去從未考慮過圖像中的幾何模式如何影響我的感知。
+ 作者將大腦的視覺處理機制與藝術作品的構成巧妙地結合,解釋了「為何」我們覺得某些畫作如此吸引人,而非僅僅是「描述」它們。

GripNewsGripNews
2024-08-28

🌘 Sapiens:人類視覺模型的基礎
➤ Sapiens模型顯著提升人類視覺任務表現
arxiv.org/abs/2408.12569
本文介紹了Sapiens,一套針對四個核心人類視覺任務(2D姿勢估計、身體部位分割、深度估計和表面法線預測)的模型。這些模型原生支持高達1K解析度的推理,並且可以輕鬆調整以適應各種任務,只需微調在超過3億張人類圖像上預訓練的模型。實驗結果顯示,透過自我監督的預訓練,大大提升了模型在各種人類視覺任務上的表現。Sapiens在多項人類視覺基準測試中超越現有基準,顯示了顯著的性能改進。
+ Sapiens模型的出現為人類視覺任務帶來了革命性的進步,尤其是在處理大規模圖像數據方面。
+ 自我監督預訓練顯著提高了Sapiens模型的表現,顯示了數據驅動的方法在計算機視覺中的強大潛力。

GripNewsGripNews
2023-06-06

🌘 現代影像處理演算法概述與C/C++實現
➤ 從影像細節到演算法概念,深入了解C語言實現現代影像處理演算法的必要性
sod.pixlab.io/articles/modern-
本文介紹了影像處理在電腦視覺、醫學影像、監控系統和攝影等領域中的重要性,並強調在嵌入式設備上實現現代影像處理演算法的必要性。文章提供了C語言實現現代影像處理演算法所需的影像細節、資料結構和演算法概念。除了專利的SIFT和SURF演算法外,大多數演算法都已在開源的SOD嵌入式電腦視覺庫中實現,並已在PixLab或FACEIO中投入生產使用。本文的重點是提醒讀者,機器學習方法並不總是解決常見電腦視覺問題的最佳或首選方案。傳統的影像處理演算法,如骨架化、Hough轉換等,當混合使用時

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst