텍스트를 넘어 ‘보고 듣는’ 멀티모달 AI의 시대로
AI와 소통하는 방식이 빠르게 바뀌고 있습니다. 텍스트를 입력해 답변을 받는 것에 놀라던 기억이 엊그제 같은데 이제는 글자, 이미지, 소리, 영상 정보까지 활용해 소통하는 수준이 되었습니다. 바야흐로 ‘멀티모달(Multimodal) 시대’의 문을 활짝 열렸습니다. 사람이 눈으로 보고 귀로 들으며 주변 상황을 자연스럽게 파악하듯이 멀티모달 AI는 여러 종류의 데이터를 한데 묶어 복잡한 맥락을 이해합니다. 멀티모달 시대를 이끄는 대표 주자가…