LG AI 연구원, 이미지를 텍스트로 변환하는 솔루션 출시
LG AI 연구원, 이미지를 텍스트로 변환하는 AI 서비스 출시
LG AI 연구원은 이미지를 텍스트로 변환하는 AI 서비스를 개발하고 출시했다고 밝혔다. 이 서비스는 이미지 데이터의 관리 및 시각 장애인을 위한 시각 자료 해설 등 다양한 용도로 활용될 것으로 예상된다. 또한, 이 연구원은 아마존 웹 서비스(AWS)를 통해 기업 간 거래(B2B) 솔루션을 외부에도 공급할 계획이다.
이 서비스를 개발하기 위해 LG AI 연구원은 자체 개발한 다중 표현(멀티모달)용 AI 기초 모델인 엑사원을 활용했다. 연구원은 AWS의 클라우드 솔루션인 아마존 엘라스틱 컴퓨트 클라우드를 사용하여 연산 작업을 진행했다.
이 서비스를 통해 시간당 2000개 이상의 이미지에 대해 캡션을 생성할 수 있다. LG AI 연구원은 아마존 세이지메이커를 활용하여 고해상도 이미지 35,000개를 엑사원에 학습시켰다. 또한, 클라우드 서비스를 이용해 데이터 용량을 조정하고 결과를 신속하게 미세 조정할 수 있었다고 설명하였다.
LG AI 연구원은 광고, 패션, 유통 등의 다양한 분야의 기업을 대상으로 이 서비스를 공급할 계획이다. 많은 대기업들은 이미지 데이터가 내부적으로 분산되어 있어 외부에서 이미지를 활용하는 일이 발생하기 쉽다. 이 서비스를 적용함으로써 이미지를 텍스트로 변환하여 라이브러리로 쉽게 관리할 수 있다는 것이 LG AI 연구원의 설명이다.
이 서비스의 활용은 이미지 데이터 관리뿐만 아니라 시각 장애인을 위한 시각 자료 해설 등 다양한 분야에 활용될 것으로 기대된다. 이화영 LG AI 연구원 상무는 "이 서비스를 통해 이미지를 텍스트로 분류하고 라이브러리로 관리하는 것이 쉬워질 것"이라며 "필요한 이미지를 검색하면 쉽고 빠르게 찾을 수 있을 것"이라고 말했다.
LG AI 연구원은 이미지를 텍스트로 변환하는 AI 서비스를 개발하고 출시했다고 밝혔다. 이 서비스는 이미지 데이터의 관리 및 시각 장애인을 위한 시각 자료 해설 등 다양한 용도로 활용될 것으로 예상된다. 또한, 이 연구원은 아마존 웹 서비스(AWS)를 통해 기업 간 거래(B2B) 솔루션을 외부에도 공급할 계획이다.
이 서비스를 개발하기 위해 LG AI 연구원은 자체 개발한 다중 표현(멀티모달)용 AI 기초 모델인 엑사원을 활용했다. 연구원은 AWS의 클라우드 솔루션인 아마존 엘라스틱 컴퓨트 클라우드를 사용하여 연산 작업을 진행했다.
이 서비스를 통해 시간당 2000개 이상의 이미지에 대해 캡션을 생성할 수 있다. LG AI 연구원은 아마존 세이지메이커를 활용하여 고해상도 이미지 35,000개를 엑사원에 학습시켰다. 또한, 클라우드 서비스를 이용해 데이터 용량을 조정하고 결과를 신속하게 미세 조정할 수 있었다고 설명하였다.
LG AI 연구원은 광고, 패션, 유통 등의 다양한 분야의 기업을 대상으로 이 서비스를 공급할 계획이다. 많은 대기업들은 이미지 데이터가 내부적으로 분산되어 있어 외부에서 이미지를 활용하는 일이 발생하기 쉽다. 이 서비스를 적용함으로써 이미지를 텍스트로 변환하여 라이브러리로 쉽게 관리할 수 있다는 것이 LG AI 연구원의 설명이다.
이 서비스의 활용은 이미지 데이터 관리뿐만 아니라 시각 장애인을 위한 시각 자료 해설 등 다양한 분야에 활용될 것으로 기대된다. 이화영 LG AI 연구원 상무는 "이 서비스를 통해 이미지를 텍스트로 분류하고 라이브러리로 관리하는 것이 쉬워질 것"이라며 "필요한 이미지를 검색하면 쉽고 빠르게 찾을 수 있을 것"이라고 말했다.
추천
0
비추천0
- 이전글교육과정의 진화와 대학 입시의 한계 23.11.30
- 다음글엠비아이솔루션, 업데이트된 ARS Flow Builder로 Multi-Depth ARS 시나리오 도입 가능 23.11.30
이동*
정말 최고예요!
김한*
정말 대책없네요.
김한*
창업뉴스라고 왔더니 창업에 관련된게 하나도 없네요.
등록된 댓글이 없습니다.