엔비디아, AI를 활용한 화상회의 음성 품질 향상 기술 발표
AI 엔비디아, 화상회의 음질 향상과 수퍼 해상도 오디오 솔루션 소개
가상 환경 기반 비대면 업무가 코로나19 장기화로 인해 증가하고 있는 가운데, 화상회의는 이러한 비대면 업무의 대표적인 방법 중 하나입니다. 이에 따라 온라인 세계에서 현실 설비를 복제하여 관리하는 디지털트윈 등의 기술도 활용되고 있습니다. 글로벌 반도체 기업인 엔비디아(NVIDIA)는 최근 연례 개발자 포럼 GTC 2022에서 화상회의와 디지털트윈 제작 등에 활용할 수 있는 여러 솔루션을 소개했습니다. 이러한 솔루션들은 인공지능(AI)을 활용하여 기존과 비교하여 데이터 품질을 향상시키고 처리 시간을 단축시키는 특징을 가지고 있습니다.
AI를 활용하여 자동으로 음성 품질을 향상시키는 엔비디아는 GTC 2022에서 AI 영상회의 플랫폼 맥신에 다양한 업데이트를 적용한다고 발표했습니다. 이 중에서도 새로운 기능인 수퍼 해상도 오디오는 AI 기술을 사용하여 오디오 품질을 높여줍니다.
디지털 기기가 음성을 전달하기 위해서는 아날로그 음성 신호를 디지털로 변환해야 합니다. 이 과정에서 음성을 1초당 몇 차례씩 디지털 신호로 나누어 처리하는지에 따라 음성 품질이 달라집니다. 이를 샘플링이라고 합니다. 일반적으로 초당 샘플링 횟수가 많을수록 음성 품질이 더 높아집니다. 이는 점묘법으로 그림을 그릴 때 1cm 지름의 점을 사용하여 그릴 때보다 0.1cm 지름의 점을 사용할 때 더 자세한 풍경을 표현할 수 있는 것과 유사합니다.
엔비디아는 음성 처리 과정에서 초당 디지털 신호의 수를 기존에 비해 더 잘게 나누는 업샘플링 방식을 채택하여 화상회의 음성 품질을 향상시켰습니다. 맥신의 수퍼 해상도 오디오 기능은 8kHz에서 48kHz로 오디오 업샘플링을 지원합니다. 예를 들어, 원래 음성 데이터가 초당 음성 샘플링을 8000회 했다면, 이를 AI가 초당 48,000회 샘플링한 것처럼 변환해줍니다. 이러한 과정에서 필요한 추가 오디오 데이터는 AI가 알고리즘을 통해 생성합니다.
엔비디아의 수퍼 해상도 오디오 기능은 화상회의와 같은 비대면 업무에서 음성 통화의 품질을 높여주는 중요한 솔루션입니다. 이는 저명한 반도체 기업인 엔비디아가 최신 기술을 활용하여 현실과 가상을 융합시키는 영역에서도 우수한 성과를 이끌어내고 있다는 것을 보여줍니다.
가상 환경 기반 비대면 업무가 코로나19 장기화로 인해 증가하고 있는 가운데, 화상회의는 이러한 비대면 업무의 대표적인 방법 중 하나입니다. 이에 따라 온라인 세계에서 현실 설비를 복제하여 관리하는 디지털트윈 등의 기술도 활용되고 있습니다. 글로벌 반도체 기업인 엔비디아(NVIDIA)는 최근 연례 개발자 포럼 GTC 2022에서 화상회의와 디지털트윈 제작 등에 활용할 수 있는 여러 솔루션을 소개했습니다. 이러한 솔루션들은 인공지능(AI)을 활용하여 기존과 비교하여 데이터 품질을 향상시키고 처리 시간을 단축시키는 특징을 가지고 있습니다.
AI를 활용하여 자동으로 음성 품질을 향상시키는 엔비디아는 GTC 2022에서 AI 영상회의 플랫폼 맥신에 다양한 업데이트를 적용한다고 발표했습니다. 이 중에서도 새로운 기능인 수퍼 해상도 오디오는 AI 기술을 사용하여 오디오 품질을 높여줍니다.
디지털 기기가 음성을 전달하기 위해서는 아날로그 음성 신호를 디지털로 변환해야 합니다. 이 과정에서 음성을 1초당 몇 차례씩 디지털 신호로 나누어 처리하는지에 따라 음성 품질이 달라집니다. 이를 샘플링이라고 합니다. 일반적으로 초당 샘플링 횟수가 많을수록 음성 품질이 더 높아집니다. 이는 점묘법으로 그림을 그릴 때 1cm 지름의 점을 사용하여 그릴 때보다 0.1cm 지름의 점을 사용할 때 더 자세한 풍경을 표현할 수 있는 것과 유사합니다.
엔비디아는 음성 처리 과정에서 초당 디지털 신호의 수를 기존에 비해 더 잘게 나누는 업샘플링 방식을 채택하여 화상회의 음성 품질을 향상시켰습니다. 맥신의 수퍼 해상도 오디오 기능은 8kHz에서 48kHz로 오디오 업샘플링을 지원합니다. 예를 들어, 원래 음성 데이터가 초당 음성 샘플링을 8000회 했다면, 이를 AI가 초당 48,000회 샘플링한 것처럼 변환해줍니다. 이러한 과정에서 필요한 추가 오디오 데이터는 AI가 알고리즘을 통해 생성합니다.
엔비디아의 수퍼 해상도 오디오 기능은 화상회의와 같은 비대면 업무에서 음성 통화의 품질을 높여주는 중요한 솔루션입니다. 이는 저명한 반도체 기업인 엔비디아가 최신 기술을 활용하여 현실과 가상을 융합시키는 영역에서도 우수한 성과를 이끌어내고 있다는 것을 보여줍니다.
추천
0
비추천0
- 이전글1987년부터 근무한 여성 버스 기사, 키 때문에 해고… 복직 청원 쇄도 23.08.18
- 다음글국내 연구진, 플렉서블 복합소재 기반 방사능 센서 개발 23.08.18
홍한*
이런 소식 정말 좋아요.
김홍*
이게 나라냐!!
한혜*
정말 미래적인 기술이네요. 어서 빨리 상용화 되었으면 좋겠습니다.
등록된 댓글이 없습니다.