이화여자대학교

이지영(李芝泳) 조교수

인공지능전공 / 인공지능ㆍ소프트웨어학부[대학원]

이지영 프로필 사진
Multimodal AI Lab: http://mmai.ewha.ac.kr/

Jiyoung Lee is an assistant professor of the Department of AI at Ewha Womans University. Before joining Ewha Womans University, she was a research scientist at NAVER AI Lab from Dec. 2021 to Feb. 2025. She received a Ph.D. degree from Yonsei University, advised by Prof. Kwanghoon Sohn. Previously, she interned at Adobe Research in 2021, working with Justin Salamon and Dingzeyu Li, and collaborated with Microsoft Research, working with Daniel McDuff and Yale Song in 2020.

She is broadly interested in multimodal learning & computer vision. Mostly, she is interested in audio-visual/vision-language models, generative AI, and video understanding, but not limited to.
  • sdg17
  • sdg08
연구실적
  • Language-guided Recursive Spatiotemporal Graph Modeling for Video Summarization INTERNATIONAL JOURNAL OF COMPUTER VISION, 2025, v.133 no.12, 8617-8641
    SCIE Scopus dColl.
  • [학술지논문] Language-guided Recursive Spatiotemporal Graph Modeling for Video Summarization INTERNATIONAL JOURNAL OF COMPUTER VISION, 2025, v.133 no.12, 8617-8641
    SCIE
  • [학술지논문] Discriminative action tubelet detector for weakly-supervised action detection PATTERN RECOGNITION, 2024, v.155 no.0, 110704-110717
    SCIE
  • [학술발표] Bootstrap your own views: Masked ego-exo modeling for fine-grained view-invariant video representations IEEE/CVF Conference on Computer Vision and Pattern Recognition , 미국, 2025-06-13 Proceedings of the Computer Vision and Pattern Recognition Conference, 2025
  • [학술발표] Read, watch and scream! sound generation from text and video AAAI Conference on Artificial Intelligence , 미국, 2025-02-27 Proceedings of the AAAI Conference on Artificial Intelligence, 2025
  • [학술발표] Bridging vision and language spaces with assignment prediction The Twelfth International Conference on Learning Representations, 오스트리아, 2024-05-07 The Twelfth International Conference on Learning Representations, 2024
  • [학술발표] Let 2D Diffusion Model Know 3D-Consistency for Robust Text-to-3D Generation The Twelfth International Conference on Learning Representations, 오스트리아, 2024-05-07 The Twelfth International Conference on Learning Representations, 2024
  • [지적재산권] 제로샷 텍스트-음성 변환을 위한 훈련 없는 화자 생성 방지 기법 국내 : 특허, 출원
강의
  • 2026-1학기

    • 음성인식

      • 학수번호 39160분반 01
      • 4학년 (3학점, 3시간) 월 5~5 (캠),수 4~4 (143)
      • 영어강의 국외 교환학생 수강불가
    • 멀티모달딥러닝

      • 학수번호 G18958분반 01
      • 학년 (3학점, 3시간) 화 4~5 (포261)
      • 강의실변경
  • 2025-2학기

    • 인공지능데이터사이언스의이해 강의 계획서 상세보기

      • 학수번호 39138분반 01
      • 1학년 (3학점, 3시간) 월 3~3 (캠),수 2~2 (142)
      • 팀티칭/인데부 학생만 수강 가능/국외교환학생 수강 불가
    • AI리빙랩Ⅰ 강의 계획서 상세보기

      • 학수번호 39158분반 01
      • 3학년 (3학점, 4.5시간) 월 7~7 (캠),목 6~7 (134)
      • 팀티칭, 교환학생 수강 불가
    • 생성형AI

      • 학수번호 39165분반 01
      • 4학년 (3학점, 3시간) 월 4~4 (캠),목 5~5 (155)
      • 영어강의 정원 외 교환학생 수강 불가
    • 인공지능특론

      • 학수번호 39167분반 01
      • 4학년 (3학점, 3시간) 월 6~6 (캠),수 5~5 (155)
  • 2025-1학기

    • 컴퓨터알고리즘

      • 학수번호 39148분반 01
      • 3학년 (3학점, 3시간) 화 6~6 (캠),목 4~4 (155)
      • 영어강의
    • 음성인식

      • 학수번호 39160분반 01
      • 4학년 (3학점, 3시간) 월 4~4 (캠),목 5~5 (155)
경력

NAVER Cloud - NAVER AI Lab2023-01-01 ~ 2025-02-28

NAVER - NAVER AI Lab2022-02-22 ~ 2022-12-31

Adobe Research2021-05-24 ~ 2021-11-19