Feature
· ■ 의료 영상(X-ray 등) 입력 시 판독 리포트 텍스트 자동 생성
·
■ Image Encoder: X-ray dataset으로 사전 학습된 RAD-DINO 모델 활용
·
■ Decoder: 계층적 교차-주의(Hierarchical Cross-Attention) 레이어 구조 적용
·
■ 핵심 특징: 디코더 설계를 통해 다양한 범위(해상도, 스케일 등)의 이미지 처리가 가능
·
■ 성능 (자체 검증셋 기준):
·
- Precision: 0.548, Recall: 0.461, F1: 0.501
·
- BLEU-1: 0.388, BLEU-4: 0.109, METEOR: 0.165
Deliverables
· ■ Python 소스 코드(.py), 학습된 모델 가중치(.pth), 테스트 리포트(.log)
Validation Status
· ■ Full Simulation (내부 테스트셋/검증셋 기준 성능 검증 완료)