coding diary
구글에서 나온, 1비트로 압축해서 메모리 절약하는 기술이다. 링크
간단하게 KV 캐시를 정화도 저하 없이 1비트로 양자화 하는 기술이라 생각하면 된다. 이거 할 때 들어가는 식이 있는데, 나도 이해 못했다.