LG AI 연구원, 이미지를 텍스트로 변환하는 솔루션 출시 > IT전자 | 창업늬우스

LG AI 연구원, 이미지를 텍스트로 변환하는 솔루션 출시

작성자

창업뉴스

0건

조회

51회

작성일 23-11-30 04:08

LG AI 연구원, 이미지를 텍스트로 변환하는 AI 서비스 출시

LG AI 연구원은 이미지를 텍스트로 변환하는 AI 서비스를 개발하고 출시했다고 밝혔다. 이 서비스는 이미지 데이터의 관리 및 시각 장애인을 위한 시각 자료 해설 등 다양한 용도로 활용될 것으로 예상된다. 또한, 이 연구원은 아마존 웹 서비스(AWS)를 통해 기업 간 거래(B2B) 솔루션을 외부에도 공급할 계획이다.

이 서비스를 개발하기 위해 LG AI 연구원은 자체 개발한 다중 표현(멀티모달)용 AI 기초 모델인 엑사원을 활용했다. 연구원은 AWS의 클라우드 솔루션인 아마존 엘라스틱 컴퓨트 클라우드를 사용하여 연산 작업을 진행했다.

이 서비스를 통해 시간당 2000개 이상의 이미지에 대해 캡션을 생성할 수 있다. LG AI 연구원은 아마존 세이지메이커를 활용하여 고해상도 이미지 35,000개를 엑사원에 학습시켰다. 또한, 클라우드 서비스를 이용해 데이터 용량을 조정하고 결과를 신속하게 미세 조정할 수 있었다고 설명하였다.

LG AI 연구원은 광고, 패션, 유통 등의 다양한 분야의 기업을 대상으로 이 서비스를 공급할 계획이다. 많은 대기업들은 이미지 데이터가 내부적으로 분산되어 있어 외부에서 이미지를 활용하는 일이 발생하기 쉽다. 이 서비스를 적용함으로써 이미지를 텍스트로 변환하여 라이브러리로 쉽게 관리할 수 있다는 것이 LG AI 연구원의 설명이다.

이 서비스의 활용은 이미지 데이터 관리뿐만 아니라 시각 장애인을 위한 시각 자료 해설 등 다양한 분야에 활용될 것으로 기대된다. 이화영 LG AI 연구원 상무는 "이 서비스를 통해 이미지를 텍스트로 분류하고 라이브러리로 관리하는 것이 쉬워질 것"이라며 "필요한 이미지를 검색하면 쉽고 빠르게 찾을 수 있을 것"이라고 말했다.