선도연구센터지원사업 공학분야(ERC) 선정돼 7년간 109억원 지원받아
  • ▲ DGIST 암흑데이터 극한활용 연구센터가 2018년 선도연구센터지원사업 공학분야 지정공모에 선정됐다. 이번 사업의 과제책임자인 DGIST 정보통신융합전공 김민수 교수).ⓒDGIST
    ▲ DGIST 암흑데이터 극한활용 연구센터가 2018년 선도연구센터지원사업 공학분야 지정공모에 선정됐다. 이번 사업의 과제책임자인 DGIST 정보통신융합전공 김민수 교수).ⓒDGIST

    DGIST가 ‘2018년 선도연구센터지원사업 공학분야(ERC·Engineering Research Center)’지정공모에 선정돼 암흑데이터 분석 및 기술연구 선도에 나선다.

    26일 DGIST(총장 손상혁)에 따르면, 차세대 빅데이터를 유용한 정보로 활용하지 못했던 ‘암흑데이터’를 이용해 차세대 빅데이터 플랫폼 원천기술을 개발하고, 이를 국가과학기술 연구데이터 플랫폼에 적용하는 연구에 나선다고 밝혔다.

    이번 사업에 선정된 DGIST는 2024년까지 국비(정부) 99억여원, 시비(대구시) 9억9,000만원 등 총 109억여원의 사업비를 지원받는다.

    암흑데이터(dark data)란 사람 혹은 기계에 의해서 생성되지만 데이터의 규모가 방대하거나 무한히 생성돼 저장 혹은 분석하지 못하는 데이터, 어딘가 저장돼 있지만 존재 여부를 알 수 없거나 찾지 못하는 데이터, 사용자에게 필요한 데이터인지 몰라 활용하지 못하는 데이터 등을 의미한다.

    전 세계 데이터의 90% 이상이라고 알려진 암흑데이터를 처리하기 위해 막대한 저장 비용, 데이터센터에서 부담하는 에너지 비용 등이 발생하며 미국을 중심으로 한 정보통신 분야 강국에서는 암흑데이터 연구의 필요성이 부각되고 있다.

    DGIST ‘암흑데이터 극한활용 연구센터’는 암흑데이터의 대부분을 차지하고 있는 비정형 형태의 데이터를 수집, 저장, 관리, 처리해 암흑데이터에서 필요한 정보를 분석 및 활용할 수 있는 차세대 정보 플랫폼의 줄임말로 암흑데이터를 극한으로 활용할 수 있는 정보 플랫폼을 말한다.) 원천기술을 개발할 계획이다.

    특히 지금까지 불가능하다고 여겨진 대규모 데이터를 언제 어디서나 저장 및 공유하면서도 누구나 간편하게 분석, 활용할 수 있는 블록체인 기반의 탈중앙 분산 파일시스템, GPU(그래픽처리장치) 및 SSD(솔리드스테이트드라이브) 기반의 초고속 데이터 처리 기술, 엣지(edge) 컴퓨팅 등의 융합 기술을 연구한다.

    또 데이터에 대한 메타 데이터와 이력 정보를 자동 추출 및 공유해 암흑데이터의 발생을 원천적으로 차단할 수 있는 인공지능, 블록체인, 지능형 분산 검색 기술도 개발할 예정이다.

     DGIST 정보통신융합공학전공 김민수 교수는 “실제 10% 미만의 데이터만 활용하던 스몰데이터 시대에서 나머지 90% 이상의 암흑데이터까지 활용하는 진정한 빅데이터 시대로의 패러다임을 전환하는 기술을 선도적으로 연구개발하고자 한다”며 “1914년 이후 노벨상 수상 연구의 87%가 대용량 연구 데이터 분석을 통해 이뤄질 정도로 연구 데이터의 공유와 활용이 중요한 만큼 관련 원천기술을 국가과학기술 연구데이터 플랫폼 구축에 적용하겠다”고 말했다.

    한편, 선도연구센터지원사업은 창의성과 탁월성을 보유한 우수 연구 집단을 발굴 및 육성해 세계적 경쟁력을 갖춘 핵심 연구 분야를 육성하고 국가 기초연구 역량 향상을 위해 과학기술정보통신부와 한국연구재단이 주관하는 사업이다.