‘빅데이터 마스터’ 박사 김진철을 만나다..

빅데이터 마스터로 불리는 한국정보화진흥원의 김진철 박사와 ‘빅데이터 플랫폼’ 사업과 각 플랫폼 별 이슈, 그리고 빅데이터 미래의 대한 이야기를 나눠보았다.

MQ) 4차 산업혁명에서 데이터가 중요한 자산으로 여겨지는데, 데이터를 어떠한 관점에서 보는가?

2016년 MIT에서 발표한 ‘데이터 자본의 부상’이라는 기술보고서를 보면 데이터를 4차산업의 신자본으로 소개하고 있다. 우리가 사용하는 돈보다도 더 가치가 있다고 말하고 있는데, 그 이유는 요즘 기업의 가치를 판단할 때 데이터와 같은 무형자산이 매출이나 부동산과 같은 유동자산보다도 더 가치를 인정받기 때문이다. 또한, 여러 기업에서 동시에 같은 데이터를 비경쟁적으로 활용가능하며 데이터마다 특성이 있어 비대체적으로 어떻게 분석 활용하느냐에 따라서 무한한 가치를 이끌어 낼 수 있는 경험적 재화의 특장성을 가지기 때문이다.
하나의 예로, 우리나라에서도 위암을 진단하는 AI 서비스를 개발한 모회사에서도 우수한 사업 아이템으로, 금융 투자는 쉽게 받을 수 있었으나 실상, AI 분석 알고리즘을 개발하기 위해 필요한 의료데이터를 구할 수가 없어서 병원에 상주하면서 연구용 데이터를 얻어 활용했다는 일화가 있다.
이렇게 데이터 확보가 어려운 스타트업이나 중소기업에게는 돈보다 더 가치 있는 자원임에는 틀림이 없는 것 같다.

MQ) 그렇다면 이번 추진하는 빅데이터 플랫폼 구축 사업에서 어떠한 기대를 가질 수 있을까?

몇 가지 거는 기대가 있다. 첫 번째는 활용한 데이터가 풍부해진다는 것이다. 즉, 앞서 언급했듯이 아이디어를 가진 스타트업이나 중소기업들이 창의적인 빅데이터 AI 서비스를 개발하고 시장에서 성장할 수 있도록 분야별 활용성 있는 데이터를 많이 만들어 유통 개방하는 것이다.
두 번째로 플랫폼에서는 분야별 공공, 민간의 각종 현안 문제를 해결하고 데이터로 돈을 벌 수 있는 기장 환경을 만들어 줘야 하겠다.
세 번째로 빅데이터 생태계가 형성되고 활용화되는 계기가 되겠다. 예로서 인력양상, 창업지원, 표준화 등 거버넌스를 리드해줄 것을 기대한다.

MQ) 이를 위해 우리나라는 기술적으로 무엇을 해야 하나?

빅데이터 기술은 매우 빨리 발전하고 있다. 기존에는 많은 양의 데이터를 어떻게 빠르게 분석할 것인지에 대한 고민을 했지만 요즘은 센터, 영상 등 다양한 데이터를 실시간 분석 및 딥러닝하고 시각화하는 기술들이 너무 잘 나왔다. 외국에서는 아마존이나 마이크로소프트사 등 우수기업들이 이러한 빅데이터 분석, 딥러닝, 시각화 기술들을 클라우드로 잘 접목시켜 빅데이터 클라우드 서비스로 제공하고 있어, 누구나 손쉽게 다양한 데이터를 특성에 맞도록 분석해 활용할 수 있다. 하지만, 우리나라는 이러한 기술들을 활용하는 능력이 부족한 상황이다. 따라서, 기존의 저장소 개념의 클라우드에 오픈 소스로 제공중인 우수한 빅데이터 기술들을 탑재하여 빅데이터 플랫폼에서 활용하는 것이 시급하다.
비유하자면, 우리가 자전거를 탈 때 자전거 기능과 성능이 좋아야 운전자가 빨리 달리고 비포장에서도 넘어지지 않듯이 플랫폼에서는 앞으로 빅데이터 클라우드가 잘 갖춰져야 성능이 좋은 빅데이터 서비스를 그때 그때 신속하게 개발하여 제공 가능하다.

 

MQ) 그 외 플랫폼이 잘 되기 위해서 해결해야 할 이슈가 있을까?

몇 가지 소개하겠다.
우선, 기존에는 개념이 없던 데이터의 상품화에 대한 이야기 이다. 상품가치가 높은 활용성 있는 데이터를 많이 만들어서 개방 및 잘 판매되기 위하여 데이터 품질, 안정성을 검증하고 합리적인 데이터 가격을 책정하는 정책이 마련되어야 한다.
그리고, 무엇보다 중요한 것은 데이터들 간에 연계활용을 잘하는 것이다. 외국의 경우에도 데이터 연계활용에 많은 관심을 쏟고 있다. 영국은 빅데이터 네트워크 프로그램을 통해 행정, 도시, 소비, 산업 등 9개 데이터센터를 만들어 상호간에 데이터 연계를 통한 문제해결을 시도하고 있고, 미국도 전역을 4개 권역으로 나누어 데이터 혁신허브를 두고 허브간 데이터 연계와 혁신 서비스 개발 및 노하우 공유에 힘쓰고 있다.
따라서, 우리도 이를 위해서는 데이터 간에 연계를 위한 표준화 작업과 함께 플랫폼 간에 데이터 협력 프로젝트 조성, 데이터 공유활용 등의 노력이 필요해 보인다.

MQ) 이용자가 데이터를 잘 활용할 수 있도록 지원하는 노력은 있는가?

우선, 스타트업, 중소기업 등의 이용자가 데이터를 쉽게 찾아 활용 할 수 있도록 플랫폼에서 생산되는 모든 데이터를 검색하고 확인 할 수 있도록 데이터맵을 구축할 계획이다. 우리는 이것을 데이터의 위치와 관련 정보를 제공하는 데이터 상황판이라고 이야기 하고 있다.
많은 분들도 아시다시피, 웹문서는 인터넷과 웹이라는 기술을 활용하여 서로 연결되어 활용되고 있다. 사람 사이에도 더 친하고 가까운 친구와, 조금 덜 친한 친구가 있다. 데이터도 데이터간에 친밀도를 가질 수 있다. 예로서, 상권분석을 할 때 카드데이터와 유동인구데이터는 쌍둥이처럼 함께 분석된다. 그리고, 건강예측을 할 때도 경유자동차데이터와 미세먼지데이터는 연계 분석해야 한다.
이렇게 플랫폼에서 생산되는 데이터도 데이터간에 친밀도를 잘 계산하여 데이터맵으로 그려내어, 많은 분들이 데이터를 검색할 때 함께 분석하면 좋을 연관 데이터들도 함께 검색될 수 있도록 시맨틱 데이터맵 형태로 제공하려 한다. 또 다른 측면으로 이용자 입장에서 데이터를 잘 활용하기 위해서는 해당 분야의 도메인 지식과 분석 기술을 배우는 것이 중요하지만 초기단계에서는 전문기업의 컨설팅을 받아 데이터 활용에 대한 노하우를 단계적으로 확보해 나가는 것도 추천한다.

 

MQ) 데이터 활용 잘하기 위해 기업, 기관에게 하고 싶은 이야기를 전해달라.

실리콘벨리에서 해마다 40~50개 이상의 유니콘 기업이 탄생하고 있다. 다들 보면 데이터를 기반으로 비즈니스, 기술 상장을 하고 있다. 또한, 해외 유명기업들은 빅데이터 활용을 통해 수요와 이익을 창출하고 있다. 이렇듯 이제 기업, 기관에서 데이터의 분석활용은 선택사항이 아닌 필수사항이 된 것 같다.
따라서, 기업, 기관의 경영진이나 임직원들의 데이터 중요성에 대한 인식변화와 함께 적극적인 데이터 기반 서비스 활용을 통해 해당 분야를 선도할 수 있는 기회를 잡으면 좋겠다.

▲클릭을 하시면 확대해집니다.
.

▲클릭을 하시면 배우 ‘김래혁’ 화보 페이지로 이동합니다.
.

▲클릭을 하시면 데이터홀릭 제작자 ‘최재완’ 인터뷰 페이지로 이동합니다.
.
.
글/사진 _ 엠큐데이
mqday@naver.com
ⓒ엠큐데이, 무단전재 및 재배포 금지