응용/서비스중급
Multimodal
멀티모달 · Multimodal AI
텍스트, 이미지, 음성, 비디오 등 여러 종류의 데이터를 동시에 처리하는 AI
상세 설명
Multimodal (멀티모달)
인간이 다양한 감각으로 세상을 이해하듯, AI도 여러 형식의 데이터를 함께 처리합니다.
종류
- Text-Image: GPT-4V, Claude Vision
- Text-Audio: 음성 AI
- Text-Video: 영상 이해 AI
트렌드
Multimodal이 차세대 AI의 표준이 되고 있음
태그
#생성모델#이미지#통합