Feature
· 8bit Activation Quantization 기능 지원
·
각 연산에 대한 pipelining을 통한 Latency 감소
·
Batch-Normalization Folding 기능 지원
·
Leaky ReLU Activation 기능 지원
·
이전 Layer의 output feature을 외부메모리(DRAM)으로 전달하지 않고 내부메모리(Block RAM)에 저장한 뒤, 다음 layer의 input으로 활용함에 따라 DRAM access 최소화
·
병렬 연산 효과가 낮은 Detection, Classification 연산은 PS (Processing System)에서 병렬 연산 효과가 높은 Convolution 연산은 PL (Programmable Logic)에서 나눠서 수행할 수 있는 PS-PL Co-Design 지원을 통해 연산 효율성 증가
·
Shift-Only quantization 모듈을 통한 리소스 효율적인 quantization 동작 구현
·
Precision : 8bit INT, fixed-point unit
·
FPS : 18.26
·
Throughput : 137.22 GOP/s
Category
Arithmetic & Mathematic > Arithmetic & Logic Unit