AI개발 학습모델과 데이터셋 구축, ‘엔드 투 엔드’ 플랫폼 대중화 실감케
‘GPU 클러스터’ 서버, 장애인용 디지털 휴먼, AI 설계 도면 분석 등도 출시
효율적인 데이터 처리 엔진 제공으로 “고객 기업의 AI개발 능력 향상”

지난 10일부터 사흘 간 서울 코엑스에서 열린 'AI엑스포코리아 2023' 전시장 모습.
지난 10일부터 사흘 간 서울 코엑스에서 열린 'AI엑스포코리아 2023' 전시장 모습.

[애플경제 박문석 기자] [애플경제 김향자 기자]지난 10일부터 12일까지 열린 ‘AI엑스포 코리아 2013’에선 특히 AI플랫폼이나 데이터셋 구축 등 AI솔루션이 가장 많이 출품되었다. AI가 SW개발이나 R&D는 물론, 일상 생활 구석구석에 틈입하고 있는 현실을 반영한 것으로 해석된다.

특히 고비용의 난해한 학습 데이터 구축 대행에 나선 업체도 크게 늘어났다. 이들은 엔드 투 엔드 형태의 공격적 마케팅을 펼침으로써 시장 경쟁이 한층 가열되고 있음을 실감하게 한다.

그 중 A사는 AI모델을 공장처럼 만들고 배포하여 누구나 자유롭게 활용할 수 있게 한다는 취지의 ‘AI모델 서빙 플랫폼’을 출시했다.

모델 개발자와 사용자의 소통을 통해 AI의 성능을 검증하고, 안전한 제품을 제공하는 것이다. A사의 엔지니어링 매니저는 “최적화 관리와 온프레미스 탑재까지 고객 맞춤형의 ‘엔드 투 엔드’ 서비스를 제공한다.”면서 “단기간에 AI모델을 개발해줄 수 있고, 모델 성능 확인부터 배포, 그리고 최신 트렌드에 대한 세미나, 교육도 병행한다”고 밝혔다.

고품질의 학습데이터로 고성능 AI 구축

Z사는 데이터 설계와 구축, 인공지능 모델 학습, 배표에 이르는 엔드 투 엔드 AI솔루션 (Zaant)을 개발, 출시했다. 회사측에 의하면 이는 데이터옵스(DataOps)와 AI옵스(AIOps)를 병행한 제품이다.

그 중 데이터옵스는 데이터 관리 모드를 통해 생성되는 데이터를 인공지능 연구 개발을 위해 데이터 구축 플랫폼으로 활용할 수 있게 한다. 이는 인공지능 학습데이터 구축을 위한 기본적인 기법, 즉 Annotation, Sampling, Augmentation) 등을 제공하며, 고품질의 주석을 위해 Semi-Auto, 리뷰 기능 등을 제공한다.

AIOps는 인공지능 개발 과정의 특성상 프레임워크, 패키지 버전, 프레임워크 버전 등의 환경문제가 발생하고, 관리하기도 어렵다. 이를 해결하기 위해 쿠버네티스를 활용, 분산학습과 버전관리를 하는게 특징이다. 또 “산업현장의 수요에 맞게, 클라우드나 엣지에 모델을 원격배포할 수도 있다.”는 설명이다.

한편 또 다른 Y사도 개발, 연구에 필요한 모델을 개발하고, 활용, 관리해주는 엔드 투 엔드 플랫폼을 제공하고 있다. 이 회사의 개발사업본부 관계자는 “몇 번의 클릭으로 누구나 쉽게 머신러닝을 분석할 수 있는 환경을 구축하고, 안전하게 관리하고 손쉽게 활용할 수 있는 전사 데이터 통합 운영체계를 제공한다”면서 “또한 서버 클러스터링을 통한 유연한 리소스 활용과 다중 사용자 관리 시스템, 그리고 ‘오토 하이퍼 패러미터’ 튜닝을 통해 AI알고리즘 모델이 최적화를 완성한 후 쉽고 빠르게 인공지능 모델 제품을 배포한다”고 소개했다.

S사 역시 기업이 AI를 도입할 수 있도록 구축 과정 전체 요소를 제공하는 제품을 출시했다. 회사측에 따르면 서비스 정의 및 데이터 설계 후 학습용 데이터 수집, 선별, 그리고 대규모 라벨링과 가공, 관리를 수행한다. 그런 다음 구축한 데이터로 모델 학습을 시행하고, 최종적으로 모델을 적용하고 배포한다.

가상의 합성데이터로 신속․용이한 모델링

특히 AI모델 학습을 위한 합성데이터를 구축, 제공하는 사례도 등장해 눈길을 끌었다. 비솔(VISOL)사는 이를 위해 실제 환경이 아니라, 가상의 디지털 환경에서 데이터셋을 생성한다. “실제 환경에서 데이터를 수집, 구축하는 것보다 훨씬 수월하게 AI모델을 학습할 수 있게 해준다”는 얘기다.

전문가들에 의하면 합성데이터는 △AI성능을 고도화하고, △고품질의 다양한 학습데이터를 통해 데이터 불균형과 과적합을 해소하며, △희소성 높은 데이터를 생성한다. 또 △성능 지표 만족을 위한 최적의 데이터셋을 구축하며, 3차원 정보 기반으 빠르고 정확한 라벨링이 가능하다. 특히 데이터 수집 과정에서 발생하는 윤리적 문제나, 개인정보 보호 우려도 해소할 수 있다.

T사는 자율주행 AI데이터 가공 노하우를 바탕으로 한 AI솔루션을 출시했다. 이는 “데이터 수집, 가공, 검수, 모델 개발, 검증에 이르기까지 원스톱 서비스를 제공한다”는 회사측 설명이다. 즉, 다양한 비정형 데이터를 수집하며, 최신 AI기술과 대규모 AI데이터 가공 노하우를 기반으로 한 고품질 데이터셋을 구축한다. 그런 다음 AI모델 추천과 개발, 성능 분석, 데이터 품질 검수와 개선의 과정을 거친다.

이 회사의 TDC 팀 리더는 특히 “AI 반도체 검증, SW 테스팅 자동화, 임베디드 시스템 CI/CD/CT를 구축하고, 고객 환경 맞춤형 시험과 검증을 실시한다”는 설명이다.

P사는 ‘멀티-GPU AI 서버’를 구축, 제공한다. 이른바 ‘바로 AI’의 ‘GPU 클러스터 패키지’다. 이 회사 네트워크 사업부 관계자는 “이는 수냉각 시스템으로 소음과 발열을 최소화하면서 별도 서버실을 둘 필요없이 사무실에서 편리하게 연구에 임할 수 있게 한다”면서 “이를 위해 ‘멀티 GPU’ 소형 클러스터와 UPS, 네트워크 장비, 데이터 스토리지를 포함한 패키지 시스템을 구축하고 있다.”고 설명했다.

C사 역시 AI모델링과 솔루션인 ‘Dataiku’를 출시했다. 이 역시 데이터 수집과 전처리, 분석, 시각화, ML/DL 모델링을 거쳐 배포한다.

이는 “데이터 플랫폼 기반의 업무 방식으로 혁신할 수 있는 엔드 투 엔드 데이터 사이언스 플랫폼”이란 설명이다. AI개발 연구소의 한 관계자는 또 “쉽고 유연하며 강력한 분석엔진으로 노코드, 로우코드, 풀 코드 등 다양한 레벨의 사용자들이 활용할 수 있고, 효율적인 데이터 처리 엔진으로서, 푸시-다운 컴퓨팅이 가능하다”고 했다.

U사도 “엔드 투 엔드 GPU 워크플로우를 가속화하는 차세대 AI인프라”를 표방한 ‘에이리//S’를 출시했다. 사측에 따르면 이는 엔비디아의 DGX시스템으로서, 스펙트럼 이더넷 패브릭, 퓨어스토리지의 플래시블레이드 등을 통해 구축된 AI플랫폼이다.

장애인 위한 수어 생성시스템도 출시

T사는 장애인을 위한 인터넷 영상 콘텐츠 음성 자막 수어 생성시스템과 애플리케이션을 개발, 출시했다. 특히 인공지능 아바타 수어 생성시스템인 디지털 휴먼 ‘리나’를 선보였다.

이는 3가지 수어 솔루션(수어 아바타, 수어 인식, 수어 번역)과 함께 인공지능 기술을 적용, 쌍방향 의사소통을 기하는 디지털 휴먼 제품이다.

전시장에서 자사 기술을 소개하던 한 관계자는 “특히 실제 사람과 유사한 캐릭터로 제작되어서, 얼굴 표현이 자연스럽고 수어 전달력이 높다.”면서 “수어 아바타를 위한 디지털 휴먼 ‘리나’는 각종 관공서 민원이나 행정업무를 위한 스마트사이니지에 두루 활용된다. 또한 수어 아바타를 활용한 인터넷 의사중계시스템에도 활용되기도 한다”고 소개했다.

인공지능 아바타 수어 생성시스템인 디지털 휴먼 ‘리나’

학습데이터의 품질이 AI의 성능을 좌우한다. 이에 또 다른 C사는 크라우드 소싱을 통해 품이 많이 드는 데이터를 수집, 가공하고, 검수를 해결함으로써 신속히 양질의 데이터를 생산할 수 있게 하는 플랫폼을 출시했다. 이 회사의 기술 매니저는 “대신 고객사는 본업에만 집중하면 되고, 데이터는 셀렉트스타에게 맡기면 된다”고 했다.

그에 따르면 우선 수학적 알고리즘과 반자동 레이블링 기술로 정확하고 신뢰할 만한 데이터를 만들어낸다. 또 30만명의 유저가 만들어낸 초고속의 반자동 레이블링 기술로 88%의 정확도를 기한다. 이를 통해 “학습데이터 19개의 기술 특허를 바탕으로 200여 고객사로부터 전폭적인 신뢰를 얻고 있다”는 설명이다.

사흘 간 열린 'AI엑스포코리아 2023'엔 수많은 관람객과 바이어들이 운집, 성황을 이뤘다.
사흘 간 열린 'AI엑스포코리아 2023'엔 수많은 관람객과 바이어들이 운집, 성황을 이뤘다.

지능형 온라인 마켓 분석 SW도 선봬

이 밖에 온라인상의 고객 리뷰를 지능적으로 분석, 마케팅 효과를 극대화하는 지능형 마킷 소프트웨어도 출시되었다.

D사는 뉴스, 블로그, 카페, 커뮤니티, 앱 등의 댓글과 대댓글까지 실시간 수집, 분석하는 기술을 선보였다. 진정성을 판별하기 위해 딥러닝 알고리즘을 적용하며, 긍․부정 점수와 함께 속성 기반 기술이 더해져 제품이나 서비스에 대해 한층 깊게 감성적 분석을 할 수 있게 한다. 또한 다양한 채널 중에서 집중적으로 관리할 만한 채널만을 골라 효율적으로 관리할 수도 있다.

또 다른 S사는 설계 도면을 AI가 자동으로 분석, 도면 내의 심벌이나 텍스트, 라인을 찾아내는 디지털화된 플랫폼 솔루션을 출시했다. 심벌과 텍스트, 라인 간의 연계성을 표현해주고, 범례 정보를 추출하며, 심벌과 텍스트 수정을 통한 AI재학습이 가능하다.

이 회사의 마케팅 총괄 매니저는 “이는 조선소, 발전소, 제철소 등에서 도면 관리용으로 활용할 수 있다. 또 설계 도면의 디지털화를 통해 견적과 설계, 운영 등을 지원한다. 특히 심벌가 라인의 연계를 통하 설계 도면 내 유체의 흐름을 제어하는데 유용하다는 평가”라고 전했다.

 

저작권자 © 애플경제 무단전재 및 재배포 금지