zast (@zast57)
NF4(Normal Float 4-bit) 모델을 사용하고 있다는 짧은 기술 언급으로, 4비트 정밀도(양자화) 형식을 사용해 모델을 구동하고 있음을 밝힘. 경량화/저비용 추론 관련 기술 사용 신호.
zast (@zast57)
NF4(Normal Float 4-bit) 모델을 사용하고 있다는 짧은 기술 언급으로, 4비트 정밀도(양자화) 형식을 사용해 모델을 구동하고 있음을 밝힘. 경량화/저비용 추론 관련 기술 사용 신호.
金のニワトリ (@gosrum)
GLM-Image가 4비트(4bit) 양자화 시 느려지는 문제가 있었음. 원인은 INT4로 양자화되어 있었기 때문이며, nf4로 변경하자 처리 속도가 3배 이상 빨라졌다는 실사용 성능 개선 보고.
Zwei Straßenbahnen der Ruhrbahn getauft
#Essen #NF4 #NRW #Nahverkehr #Ruhrbahn #Straßenbahn #Taufe #ÖPNV
https://bahnblogstelle.com/224955/zwei-strassenbahnen-der-ruhrbahn-getauft/