자는 동안 700번 실험, Karpathy 오픈소스 AI 연구 자동화 도구 autoresearch
Karpathy가 공개한 autoresearch는 AI 에이전트가 자율로 ML 실험을 반복하며 모델을 개선하는 도구. 700번 실험으로 GPT-2 학습 11% 단축, Shopify는 절반 크기 모델로 기존 모델 성능을 능가했습니다.자는 동안 700번 실험, Karpathy 오픈소스 AI 연구 자동화 도구 autoresearch
Karpathy가 공개한 autoresearch는 AI 에이전트가 자율로 ML 실험을 반복하며 모델을 개선하는 도구. 700번 실험으로 GPT-2 학습 11% 단축, Shopify는 절반 크기 모델로 기존 모델 성능을 능가했습니다.Andrej Karpathy veröffentlicht mit Autoresearch ein Tool, das ML-Modelle autonom optimiert.
Das Projekt umfasst knapp 630 Zeilen Code. Es ändert Python-Dateien, trainiert exakt fünf Minuten und bewertet strikt nach Validation Bits Per Byte.
Auf einer handelsüblichen Standard-GPU laufen so völlig automatisiert knapp 100 Tests pro Nacht.
#Autoresearch #Karpathy #MachineLearning
https://www.all-ai.de/news/news26/autoresearch-karpathy-ki
Github Awesome (@GithubAwesome)
AutoKernel은 GPU 프로파일링과 커널 최적화 작업을 자동화하는 도구로, Andrej Karpathy의 autoresearch에서 영감을 받아 개발된 자율 에이전트를 사용합니다. 사용자가 PyTorch 모델을 지정하면 백그라운드에서 Triton 커널을 자동으로 최적화해 주므로 모델 개발자가 수동으로 프로파일을 관찰·조정하는 시간을 크게 절약할 수 있습니다.
AutoKernel: Autoresearch for GPU Kernels
https://github.com/RightNow-AI/autokernel
#HackerNews #AutoKernel #Autoresearch #GPU #Kernels #AI #Technology #OpenSource
[Karpathy, Autoresearch로 nanochat을 2일간 자동 튜닝해 GPT-2 학습 시간 11% 단축
Karpathy가 Autoresearch 에이전트를 사용하여 nanochat 모델을 2일간 자동 튜닝해 GPT-2 학습 시간을 11% 단축하는 데 성공했습니다. 에이전트는 700개의 변화를 시도해 20개의 유효한 개선사항을 발견했으며, 이는 depth=24 모델에도 적용 가능했습니다. 현재 'round 2'를 시작하고 병렬 처리 및 협업 방식을 연구 중입니다.
Andrej Karpathy (@karpathy)
autoresearch가 depth=12 nanochat 모델을 약 이틀간 자동 튜닝해 검증 손실을 개선한 약 20가지 변경점을 발견했고, 어제 테스트 결과 이 변경점들이 모두 더해져 더 큰(depth=24) 모델에도 전이되어 성능 향상을 가져왔다는 발표입니다. 여러 변경을 쌓아 올린 결과라는 점에서 모델 최적화 자동화와 전이 가능성에 대한 실무적 시사점이 큽니다.
[AgentHub - AI 에이전트를 위한 경량 협업 플랫폼
Karpathy가 공개한 Autoresearch 프로젝트를 기반으로 한 경량 협업 플랫폼 AgentHub가 공개되었습니다. 이 플랫폼은 AI 에이전트들이 협업할 수 있도록 설계되었으며, GitHub 구조를 에이전트 중심으로 재구성했습니다. DAG 형태의 커밋 그래프와 게시판 보드를 통해 에이전트들이 실험 결과와 가설을 공유할 수 있습니다. 플랫폼은 Go 기반의 단일 바이너리 구조로, 서버와 CLI로 구성되어 있으며, SQLite 데이터베이스와 bare git 저장소를 사용합니다. MIT 라이선스로 공개되었습니다.
🚀 Andrej Karpathy just open‑sourced Autoresearch, a framework that runs hundreds of AI experiments nightly on a GPU cluster. It brings scientific rigor to ML, automating the trial‑and‑error loop and freeing researchers to focus on insight. Dive into how this could reshape AI automation and open‑source collaboration. #Autoresearch #AndrejKarpathy #OpenSourceAI #AutomatedExperiments
🔗 https://aidailypost.com/news/karpathy-releases-open-source-autoresearch-runs-hundreds-ai-tests
*The jargon term "autoresearch" probably first boiled off a screen on XTwitter about 72 hours ago #autoresearch
*Unfortunately for my own mental equanimity, I (a) already know what "autoresearch" is and (b) share this guy's reasonable apprehensions about it
RE: https://bsky.app/profile/did:plc:vg3thtvfbgfrr3u6pf6hy3yk/post/3mgllivb5sc2w
Andrej Karpathy (@karpathy)
autoresearch의 다음 단계는 에이전트들이 비동기적으로 대규모 협업하는 방식이어야 한다는 주장입니다. SETI@home식 분산 참여를 예로 들며 목표는 단일 박사과정 학생을 흉내 내는 것이 아니라 연구 커뮤니티 전체를 에뮬레이트하는 것이라고 설명합니다. 현재 코드는 동기적으로 하나의 스레드만 성장시킨다고 지적하고 있습니다.
Shopify's CEO Let Karpathy's AI Agent Run Overnight and Woke Up to a 19% Better Model
On Sunday, Shopify CEO Tobi Lütke did something most machine learning engineers spend months trying to achieve. He improved a core model’s performance by 19% while he was asleep & didn’t use a massive compute cluster or a team of researchers. He used a 630-line weekend project released by Andrej Karpathy called autoresearch.
✨ Autoresearch: il nuovo framework open source di Karpathy che automatizza il machine learning con loop autonomi, metriche chiare e agenti AI al lavoro anche mentre dormi.
https://gomoot.com/autoresearch-come-funziona-il-nuovo-framework-open-source-di-karpathy/
Trevin Peterson (@TrevinPeterson)
Apple Silicon 및 MLX용으로 autoresearch의 포트를 작성해 Mac에서 네이티브 실행 가능하게 했다는 공개 소식입니다. PyTorch 불필요, M4 Max에서 depth=4가 depth=8보다 5분 예산에서 더 많은 옵티마이저 스텝이 유리하다는 실험적 발견도 함께 보고되었고, 관련 코드는 github.com/trevin-creator/autoresearch-mlx 에 공개되었습니다.
Akshay (@akshay_pachaar)
Andrej Karpathy가 'autoresearch'를 오픈소스로 공개했다는 소식. 단일 GPU로 하룻밤에 100개의 ML 실험을 자동 실행하며, 에이전트가 코드 작성·훈련·반복·성공 실험 보존까지 수행해 연구자는 하나의 마크다운 파일로 전략만 관리하면 되는 자동화 연구 도구임.
Autoresearch: Agents researching on single-GPU nanochat training automatically
https://github.com/karpathy/autoresearch
#HackerNews #Autoresearch #Nanochat #AI #SingleGPU #MachineLearning
Github Awesome (@GithubAwesome)
Andrej Karpathy가 'autoresearch'를 오픈소스로 공개했습니다. 이 도구는 AI 에이전트에게 실제 LLM 학습 환경을 줘 아키텍처를 자율 수정하고, 단일 GPU에서 고정된 5분 학습 루프를 돌려 검증 손실을 확인하는 자동화된 실험 파이프라인을 제공합니다.