관계형 또는 비관계형 DB관리시스템, 클라우드 DB 등 폭증
“비구조화 데이터 폭증에 대응한 DB관리 기술도 빠르게 진화”

사진은 데이터센터의 관제실로 본문 기사와 직접 관련은 없음.
사진은 데이터센터의 관제실로 본문 기사와 직접 관련은 없음.

[애플경제 박문석 기자]데이터베이스 시장이 그 끝을 모르게 폭발적인 성장을 거듭하고 있다. 국내는 물론, 세계적으로도 특히 클라우드 데이터베이스를 중심으로 매년 가파른 성장률을 보이고 있다. 기술매체 ‘테크리퍼블릭’은 이에 대해 “오라클과 같은 데이터베이스 공급업체들이 성장이 더딘 것으로 알려졌음에도 불구하고, 이 분야는 날로 호황을 누리고 있다.”면서 “가장 큰 이유는 역시 클라우드”라고 전했다. 또 “그 못지않게 데이터가 모든 기업에서 날로 중요해지고, 다양한 비정형 데이터가 늘어나는 가운데, 새로운 데이터베이스를 끊임없이 구축하기 때문”이라고 진단했다.

IT전문가들에 의하면 관계형 데이터베이스는 1970년대 초부터 등장했다. 오라클, 마이크로소프트, IBM 등이 그 시초인데, 이들 기업은 DB를 위한 기업을 따로 만들어 이를 판매하며 시장을 형성했다. 이들 주요 업체들은 때로 부침을 거듭했지만, 데이터베이스 시장 전체는 꾸준히 견조한 성장세를 유지했다.

특히 포스트그리스큐엘(PostgreSQL)가 등장하면서 클라우드 데이터베이스 시장이 새로 유망산업으로 떠올랐다. 또 AWS와 다른 클라우드 대기업이 관리형 포스트그리스큐엘을 제공하기도 한다. 객체-관계형 데이터베이스 관리 시스템의 하나인 포스트그리스큐엘은 주로 오픈소스 개발자나 관련업체들이 개발해왔다. 이는 데이터를 안전하게 저장하고 다른 응용 소프트웨어로부터의 요청에 응답할 때 데이터를 반환하는 등 DB관리의 핵심요소이기도 하다.

또한 ‘노스큐엘’(NoSQL) 데이터베이스도 지속적으로 증가하고 있다. 이는 단순 검색이나 추가 작업을 위한 매우 최적화된 키 값 저장 공간만으로, 레이턴시와 전송용량을 조절하거나 증가시켜준다. 기술매체 ‘엔가젯’은 “예를 들어 ‘MongoDB’나, 아파치 카산드라, Neo4j, DynamoDB, 레디스 등과 같은 데이터베이스들이 그런 경우”라며 “이들은 유연하고 수평적으로 확장할 수 있고, 구조화되지 않은 데이터가 폭발적으로 증가해도 이를 관리할 수 있다”고 밝혔다.

또 다른 전문가들은 “관계형 데이터베이스는 ‘포스트그리스큐엘’을 제외하면, DB엔진을 기준으로 보면 지난 1년을 포함하여 지난 9년 동안 비관계형 데이터베이스에 비해 감소해온 경향”이라고 주장한다. 그러나 또 다른 전문가들은 “그렇다고 해서 SQL과 관계적 사용이 감소하고 있는 것은 아니다”고 했다.

특히 기술매체 테크크런치는 “실제로 채용 공고를 통해 측정되는 업계의 SQL 수요는 계속 증가하고 있다.”면서 “기업들은 편리하고 널리 사용되는 SQL에 친숙한 만큼, 그 동안 기업을 운영해 온 데이터베이스를 쿼리할 수 있는 개발자를 늘 찾고 있다”고 강조했다. 즉, 데이터베이스 관리와 검색을 위한 SQL은 기업에 매우 중요한 역할을 해왔기 때문이란 얘기다.

물론 “기술이 날로 발달하면서 기업들은 SQL이 포함되지 않는 새로운 데이터 유형과 소스를 쿼리할 수 있는 개발자를 찾고 있긴 하다”는 주장도 있다. 이는 곧 SQL이 포함된 경우와 그렇지 않은 프로젝트에 모두 적합한 인재를 요구한다는 얘기다. 궁극적으론 “데이터를 최대한 활용하고 업무에 적합한 데이터베이스로 전환하려는 노력”이라는 해석이다.

또 하나의 DB시장의 특징은 구조화되지 않은 데이터기 날로 증가함에 따라 이를 이해하도록 훈련된 기계 학습 모델의 사용이 꾸준히 증가하고 있다는 점이다. 단어 연관성을 학습하기 위해 신경망을 사용하는 자연어 처리(NLP) 알고리듬인 ‘word2vec’가 대표적인 사례다. ‘word2vec’ 모델은 특정 언어를 부동소수점 값 또는 벡터의 목록으로 변환할 수 있다. 이를 위해 서로 가까운 벡터는 서로 유사한 단어를 나타내도록 훈련하며, 이에 따라 ‘임베딩 벡터’라는 용어를 사용하기도 한다.

이같은 벡터 데이터베이스는 영상 검색이나 비디오, 오디오 또는 각종 비정형 데이터 내의 검색에 유용하다. 또한 특정한 콘텐츠와 관련된 키워드가 아닌 콘텐츠도 이해할 수 있다. 이처럼 “구조화된 데이터와, 구조화되지 않은 데이터가 서로 맞물리면서, 데이터베이스 시장은 끝없이 팽창할 것”이라는게 많은 전문가들의 예상이다.

저작권자 © 애플경제 무단전재 및 재배포 금지