Feature
· ■ 객체 분할 네트워크의 학습과 추론을 모두 지원
·
■ 다양한 kernel size(3x3, 9x9, 18x18, ...)의 convolution 연산 지원
·
■ Convolution과 fully-pipeline 연산이 가능한 보조 연산(Batchnorm, Relu, weight flip, quantization, ...) 기능 지원
·
■ Activation, weight, gradient 특성에 맞는 8-bit INT 양자화 지원
·
■ FPS : 27.6
·
■ Throughput : 805.9 GOPS
Deliverables
· ■ Verification testbench