2021년 미국 IPO 예정 스타트업: 데이터브릭스

2021년 미국 IPO 예정 스타트업: 데이터브릭스

주식시장에서 기업공개(IPO)는 상당히 큰 이슈입니다. 새로운 기업이 공개됨에 따라 일반인이 그 기업의 주식을 거래할 수 있기 때문입니다. 기존에는 비상장 주식으로써 일대일 거래만 가능했던 것이 주식시장에서 일정한 룰에 따라 거래될 수 있으니 투자자 입장에서는 보다 안전한 방법으로 기업에 투자할 수 있게 된 것입니다. 따라서 IPO는 언제나 주식시장에서 화제가 될 수 밖에 없고 미국에서도 마찬가지입니다.

작년 미국 증권시장에 새롭게 상장한 스노우플레이크는 데이터 웨어하우스 기업으로 유명합니다. 4차 산업혁명에서 빅 데이터 프로세싱은 반드시 필요한 기술로 스노우플레이크는 데이터를 보관하고 가공하는 솔루션을 제공하기 때문에 많은 사람들로부터 주목을 받았습니다. 지금도 미국 증시에서 스노우플레이크 주식은 높은 프리미엄으로 거래되고 있습니다.

이 글에서 소개하는 데이터브릭스는 스노우플레이크와 유사한 데이터 통합 플랫폼 스타트업입니다. 기업이 획득한 수많은 데이터를 분석해 사업 목표에 가장 적합한 정보를 추출하는 솔루션을 제공합니다. 인공지능을 활용하는 이 솔루션은 기업 운영의 모든 분야에 활용될 수 있습니다. 심지어 입사 지원자 중 누구를 면접전형 대상자로 선발할 것인지까지 이 솔루션을 통해 결정할 수 있습니다. 다만 그 방법은 스노우플레이크와 차이가 있습니다. 자세한 내용은 아래에서 설명하겠습니다.

과거 미국증시에 상장한 기업들을 살펴보면 상장 이후 주가가 크게 급등한 것을 알 수 있습니다. 그래서 지금도 많은 투자자들은 미국시장에 상장하는 기업에 대한 분석을 계속하고 있습니다. 데이터브릭스는 올해 상장 예정 회사 중에서도 가장 주목받고 있는 스타트업으로 우리나라에서도 주목을 해볼만한 기업이라고 생각해 이렇게 블로그를 통해 소개하게 되었습니다.

데이터브릭스 상장 관련 뉴스

이 섹션은 Protocol에 게시된 기고문의 일부 번역문이며 전체 내용은 아래 링크를 통해 원문을 참고해주시기 바랍니다.

원문 바로가기: Databricks plans to take on Snowflake and Google and score a huge IPO | Protocol

시가총액 62억 달러에 달하는 스타트업 데이터브릭스는 통합 데이터 분석 플랫폼을 제공하는 미국 기업입니다. 2021년 미국증시 상장이 예정되어 있는 기업 중 데이터브릭스는 가장 주목받고 있는 스타트업입니다. 작년 미국증시에 상장한 스노우플레이크와 사업영역이 일부 겹치는 데이터브릭스는 소비자들에게 어떤 제품이 가장 적합한지, 어떤 지원자가 면접전형에 응시할 자격이 있는지 판단하는데 도움을 주는 알고리즘을 제공합니다. 데이터브릭스 솔루션을 이용하면 수많은 경로에서 획득한 데이터를 분석하여 기업이 원하는 정보를 쉽게 얻을 수 있습니다.

보통 미국증시에 상장하기 전 기업에서는 새로운 최고재무책임자(CFO)를 영입하여 IPO 관련 업무를 전적으로 담당하게 합니다. 그러나 데이터브릭스에는 이미 CFO 데이브 콘테(Dave Conte)가 있기 때문에 새로운 사람을 들일 필요가 없으며 상대적으로 안정적으로 IPO 절차를 밟을 수 있습니다. 데이브 콘테는 이전에 머신 데이터 분석 플랫폼 스플렁크를 상장시킨 경력이 있어 이번 IPO 과정에서 큰 역할을 담당할 것으로 보입니다.

2020년 데이터브릭스 매출은 가파르게 증가한 것으로 알려져 있습니다. 현재 데이터브릭스는 비상장 기업이기 때문에 최근 자료를 찾지는 못 했지만, 데이터브릭스 공식 발표를 살펴보면 지난 3/4분기 매출이 전년 동기 대비 75% 증가한 3억 5천 만 달러를 기록했다고 합니다. 이는 코로나19로 인해 장기간 경기침체가 이어졌음에도 데이터 프로세싱 및 인공지능 도구에 대한 수요는 지속적으로 증가했다는 것을 의미합니다.

데이터 프로세싱 및 인공지능 도구 산업 경쟁은 치열한 편이며, 데이터브릭스는 2018년부터 스노우플레이크와 협력 관계를 맺고 있지만 구글의 빅쿼리와는 경쟁할 수 밖에 없는 상황입니다. 경쟁자가 있다는 것은 데이터브릭스 투자 리스크로 작용할 수 밖에 없습니다. 그러나 스포티파이와 같이 기존 경쟁 시장에 등장해 크게 성공하는 스타트업도 있으므로 데이터브릭스에 대한 관심을 줄일 수는 없습니다.

사파이어 벤처스 설립자 자이 다스(Jai Das)는 데이터 과학 및 분석 분야에서 데이터브릭스와 스노우플레이크, 구글은 서로 경쟁자가 될 수 밖에 없지만, 이 시장은 상당히 커서 세 기업 모두 성장하게 될 것이라 평가했습니다.

데이터 관리 및 인공지능 도구는 스노우플레이크 및 구글 빅쿼리에서도 제공하고 있는 솔루션이지만 데이터브릭스는 비정형화된 데이터를 인공지능을 통해 선별하고 활용하는 방식을 사용하는 데이터 레이크하우스를 지향하기 때문에 앞선 기업의 솔루션과는 비교됩니다. 보통 데이터 관리 방법에는 스노우플레이크가 사용하는 방법인 데이터 웨어하우스와 데이터브릭스의 데이터 레이크하우스 두 가지 방법이 있습니다. 데이터 웨어하우스는 정형화된 스토리지에서 데이터를 활용하고 데이터 레이크하우스는 비정형화된 방대한 공개된 자료에서 데이터를 활용합니다. 쉽게 말해서 SQL과 NoSQL의 차이라고 보면 됩니다. “MySQL vs MongoDB”

데이터브릭스는 자사 솔루션이 4차 산업혁명의 주요 산업인 헬스케어 산업에서 유용하게 활용될 수 있다고 판단하고 있습니다. 2021년에는 더 많은 신제품 발표가 예정되어 있습니다. 데이터브릭스 CEO는 현재 개발되고 있는 거의 모든 백신의 배경에는 데이터브릭스의 솔루션이 사용되었다고 설명합니다. 추가적으로 의료 서비스 제공업체는 이 솔루션을 통해 재고를 추적하고 병원의 혼잡도를 줄일 수 있게 됐다고 평가했습니다.

데이터 레이크하우스란?

데이터브릭스가 제공하는 데이터 레이크하우스(Data Lakehouse)는 데이터 웨어하우스와 데이터레이크를 결합한 것으로 여러 곳에 분산 저장되어 있는 비정형화된 데이터 집합을 인공지능으로 분석하여 최적의 결론을 도출할 때 사용되는 데이터 통합 분석 기술입니다.

기존 데이터 웨어하우스는 오래 전부터 사용되었던 데이터 관리 방법으로, 보통 정형화된 데이터를 처리하는 데에는 효율적이지만 비정형화된 데이터를 처리하기에는 적합하지 않습니다. 반면 데이터레이크는 데이터 과학 및 기계학습을 활용해 비정형화된 데이터를 처리할 목적으로 등장했습니다. 그러나 데이터레이크는 처리하는 데이터가 비정형화되어 있기 때문에 트랜잭션이나 기타 데이터 일관성 유지를 위한 작업이 불가능합니다.

데이터 레이크하우스는 데이터레이크에 사용되는 저비용 스토리지에 직접 데이터 웨어하우스 데이터 구조 및 데이터 관리 기능을 구현하는 새로운 개방형 시스템입니다. 두 가지 방법을 결합하면 여러 시스템에 접근할 필요 없이 저장된 데이터를 사용할 수 있기 때문에 효율적입니다. 또한 데이터 레이크하우스는 기계학습이나 비즈니스 분석 프로젝트에 사용할 수 있는 최신화된 데이터를 저장합니다.

참고자료

데이터브릭스 플랫폼

데이터브릭스 플랫폼은 데이터 레이크하우스를 기반으로 합니다. 간단하면서도 개방된 데이터브릭스 플랫폼은 기업이 가진 데이터를 관리하고 비즈니스 상황에 맞게 분석할 수 있는 기능을 제공합니다. 최신 오픈소스 머신러닝 기술을 사용할 수 있으며 몇 번의 클릭만으로 기계 학습 프레임워크를 사용할 수 있습니다. 파이토치, 텐서플로우, 케라스 등 데이터 과학자 또는 머신러닝 개발자가 사용할 수 있는 프레임워크 종류는 다양합니다. 인터페이스가 간단하게 구성되어 있기 때문에 확장 가능한 클러스터 인프라를 사용하여 손쉽게 소규모 데이터를 빅 데이터로 전환할 수 있습니다.

데이터브릭스 플랫폼은 비즈니스 환경을 분석하기 위해 사용될 수 있습니다. 사업을 영위하며 획득한 비정형화된 데이터를 머신러닝으로 분석하고 기업에서 원하는 정보를 빠르게 얻을 수 있습니다. 가령 이 플랫폼은 어느 고객에게 어떤 제품이 가장 적합할 것인지 추론하는 기능을 제공합니다. 모든 서비스는 데이터브릭스 플랫폼에서 손쉽게 사용할 수 있습니다.

데이터브릭스 플랫폼은 매우 안전한 상태에서 실행됩니다. 사용자별 권한을 지정하여 불필요한 접근을 차단할 수 있으며, 다각도로 관리할 수 있는 시스템을 제공하여 사용자 액세스를 관리하고 지출을 제어하거나 모든 작업 공간을 분석할 수 있는 도구를 제공합니다. 다중 클라우드를 지원하여 마이크로소프트 애저와 아마존 웹 서비스에 저장된 데이터를 통합하여 사용자가 각 클라우드 컴퓨팅 서비스에 대한 지식이 없어도 데이터 분석 및 기계학습 기능을 사용할 수 있게 해줍니다.

데이터브릭스 고객사

데이터브릭스 관련 내용을 찾아보는 것은 생각보다 어려웠지만, 미국에서 데이터브릭스 플랫폼을 사용하는 기업을 찾을 수는 있었습니다. 바이오젠, T모바일, 그랩, HSBC 등 다양한 기업을 고객사로 보유하고 있습니다. 우리가 흔히 알고 있는 소매기업도 포함되어 있는 것을 보면 데이터브릭스 플랫폼을 통해 고객 소비 분석을 하고 있는 것으로 판단됩니다.

지금까지 올해 새롭게 상장할 예정인 데이터브릭스에 대해 알아봤습니다. 관련 자료는 대부분 해외 사이트에 존재하기 때문에 원하는 자료를 완벽하게 찾지는 못 했지만 데이터브릭스에 대한 간단한 설명을 하기에는 부족하지 않다고 판단해 일단 데이터브릭스 관련 첫 번째 글을 작성하였습니다. 앞으로 데이터브릭스 관련 뉴스나 정보가 추가적으로 발견된다면 해당 내용을 곧바로 이 블로그에서 소개할 수 있도록 하겠습니다.

Leave a reply

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다