주메뉴 바로가기 본문 바로가기

POPUP ZONE

회원 개인정보 추가 작성 요청
KAIST AI-PIM PIM반도체연구센터

IP 검색

Low Power Object Detection Forward Process Unit (Tiny-YOLOv3) (차세대지능형반도체사업단)

· High-throughput/Low-power Tiny YOLOv3 추론을 위한 외부 메모리 접근을 최소화한 recursive architecture 기반 가속기 유닛(IP)

Feature
· 8bit Activation Quantization 기능 지원
· 각 연산에 대한 pipelining을 통한 Latency 감소
· Batch-Normalization Folding 기능 지원
· Leaky ReLU Activation 기능 지원
· 이전 Layer의 output feature을 외부메모리(DRAM)으로 전달하지 않고 내부메모리(Block RAM)에 저장한 뒤, 다음 layer의 input으로 활용함에 따라 DRAM access 최소화
· 병렬 연산 효과가 낮은 Detection, Classification 연산은 PS (Processing System)에서 병렬 연산 효과가 높은 Convolution 연산은 PL (Programmable Logic)에서 나눠서 수행할 수 있는 PS-PL Co-Design 지원을 통해 연산 효율성 증가
· Shift-Only quantization 모듈을 통한 리소스 효율적인 quantization 동작 구현
· Precision : 8bit INT, fixed-point unit
· FPS : 18.26
· Throughput : 137.22 GOP/s
Application
· SoC
Business Area
Accelerator
Category

Other


Tech Specs
  • IP Name :

    Low Power Object Detection Forward Process Unit (Tiny-YOLOv3) (차세대지능형반도체사업단)

  • Provider :

    Seoul National University of Science and Technology

  • FPGA Device :

    Xilinx ZCU102

  • Foundry :

    Others

  • Technology :

    FPGA

Deliverables
· Verification testbench
Validation Status
· FPGA-Proven
Availability
Available
Functional Diagram
Benefits
· -
List