Giải pháp L2R-VTC: Từ video đến text

Bài giải về L2R-VTC (Language-to-Video Cross-Modal Retrieval và Video-to-Text Generation)