Alex Cheema - e/acc (@alexocheema)
Kimi K2.5 모델을 데스크톱 환경에서 실행한 사례 보고: 2대의 512GB M3 Ultra Mac Studio를 Thunderbolt 5(RDMA)로 연결하고 @exolabs의 MLX 백엔드를 사용하여 초당 약 24 tokens 처리 성능을 기록했으며, 이를 통해 'clawdbot' 같은 애플리케이션도 구동 가능함을 시연했습니다. 개인/랩톱급 하드웨어에서의 실무적 실행 사례로 의미가 큽니다.


