대학소식
김현지씨, DB 분야 세계 최정상 학술대회서 1저자로 논문 발표
대용량 네트워크 분석기술 개발해 ACM SIGMOD 2016 참가
창의IT융합공학과 대학원생 김현지씨(21)와 한욱신 지도교수가 기존 방식보다 수십 배 성능이 뛰어나면서도 간편한 대용량 네트워크 분석 기반기술인 ‘듀얼심(DUALSIM)’ 개발에 성공했다.
올 6월 샌프란시스코에서 열리는 제 42회 미국 컴퓨터학회 데이터베이스분과(ACM SIGMOD) 학술대회에서 관련 논문을 발표할 예정인 김 씨는 지난 11월 학부생 신분으로 이 논문을 제출, 게재 승인을 받은 사실이 알려지며 눈길을 끌고 있다. 데이터베이스 분야에서 세계적 권위를 지닌 ACM SIGMOD에 학부생이 제 1저자인 논문이 발표되는 것은 세계적으로도 이례적인 일이다.
김 씨가 개발한 ‘듀얼심’ 방법은 수백 대의 컴퓨터 서버가 필요했던 기존의 방식과는 달리 일반 PC 한 대만을 가지고도 방대한 그래프 데이터 처리가 가능한 ‘서브그래프 열거’ 기술이다. 대용량 네트워크의 데이터 안에서 반복적으로 나타나는 특정 패턴을 모두 찾아내 나열하는 ‘서브그래프 열거’는 소셜 네트워크의 특성을 분석하는 친구 추천이나 커뮤니티 찾기, 진화 연구 등을 비롯해 데이터 마이닝의 소형 커널 연산, 생명과학 분야의 네트워크 모티프1 탐사 등 널리 쓰이고 있다. 김 씨는 이번 연구를 통해 메모리 사용은 대폭 줄이면서도 데이터 처리 속도를 수십 배 높이는 획기적인 결과를 보였다.
기존의 ‘서브그래프 열거’ 기술들은 하나의 결과를 구하기까지 그 중간에 발생하는 부분 검색 결과를 모두 저장해왔다. 이런 과정에서 본래의 데이터보다 용량이 수십 배 이상 커진 부분 검색 결과를 모두 메인 메모리에 저장하기 위해 메모리 용량이 큰 고사양 컴퓨터가 여러 대 필요하거나 그마저도 원하는 결과를 구하지 못한 채 도중에 실패하는 경우가 잦았다.
김 씨는 부분 검색 결과를 저장하지 않아도 되는 새로운 방식을 채택해 메모리 사용을 수백 배 이상 대폭 줄이며 제한된 리소스로 대용량의 그래프 데이터 처리를 가능하게 했다. 또, 멀티 코어 CPU 등의 하드웨어를 최대한 활용하며 효율성을 극대화 해 기존의 가장 빠른 처리 방식보다 성능을 수십 배 향상 시켰다.
김 씨의 연구를 지도한 한욱신 교수는 “새로 개발한 서브그래프 열거 기술에 따르면 가정용 컴퓨터로도 방대한 양의 그래프 데이터를 단시간 안에 처리할 수 있다”며 “데이터 분석을 바탕으로 하는 전산, 생명, 화학 등의 분야 뿐 아니라 빅데이터의 분석이 필요한 기업과 연구소에도 큰 도움이 될 것”이라고 의의를 밝혔다. 또, “학부생이 이런 연구를 수행하고 세계적 학술대회에 참가하는 것은 큰 의미가 있다”며 김 씨의 가능성을 높이 평가했다.
1. 모티프(motif): 여러 가지 단백질의 아미노산배열에 나타나는 작은 구조부분