한국의 데이터 저널리즘, 어디까지 왔나? – 수다피플

데이터 저널리즘 유행은 한풀 꺾였다. 유행처럼 반짝 주목을 받았고, 제대로 된 준비 없이 따라하는 형식으로 ‘몇 건’ 만드는 언론사들이 있었다가 사라졌다. 지금은 대폭 줄었다. 꾸준한 언론사에서만 운영하고 있다. 여러 가지 이유가 있겠다. 특성상 소셜과 포털을 통한 유통이 어려워서 일수도 있고, 많은 인력이 들어가다 보니 소위 말하는 ‘ROI(투자대비효율)’가 안 나와서 일수도 있다. 물론 더 근본적인 구조와 운영의 문제일 수도 있다.

유행이 꺾인 지금의 모습을 보는 게 중요하다. 지난 시간에서 얻은 경험과 교훈을 바탕으로 앞으로 한국의 데이터 저널리즘이 어떻게 발전해 나갈지 엿볼 수 있어서다.

지난 11월 16일 구글코리아와 미디어오늘 주관으로 열린 ‘2017 데이터저널리즘 컨퍼런스’ 에서는 그동안 국내에서는 어떤 데이터 저널리즘 보도물이 있었고, 어떻게 보도해왔는지에 대해 데이터 저널리즘 팀을 운영하는 기자들이 경험을 공유하는 시간을 가졌다. 모더레이터를 맡은 함형건 <YTN> 데이터저널리즘 팀장은 “각기 다른 여건과 다른 지향점, 문제의식을 갖고 활발하게 보도하고 있다”라고 말했다.

김한별 <중앙일보> 데이터저널리즘 데스크(사진=이치열 <미디어오늘>기자)

<중앙일보> “바보야, 문제는 사용자야”

“종이신문, 방송이 아니라 PC 검색 비율도 떨어지고 있습니다. 모바일만이 주된 미디어가 되고 있는 겁니다. 일반 기사만 그런 게 아니라, 데이터 드리븐 콘텐츠도 그렇다는 거죠. ‘우리 이렇게 방대한 데이터 연구해서 보여줬어요’라고 말하는 게 무슨 의미가 있겠습니까?”

<중앙일보> 데이터저널리즘 팀은 2016년 여름에 처음 생겼다. 여타 데이터 저널리즘 콘텐츠처럼 데이터를 바탕으로 인터랙티브 차트를 만들거나, 맵 위에 정보를 뿌리는 식의 콘텐츠를 제작했다. 보기에는 좋았지만, 충분하지 않았다. 이런 형식은 기본적으로 PC 환경에서나 쾌적한 소비가 가능하다. 김한별 <중앙일보> 데이터저널리즘 데스크는 “우리가 일하는 방식을 되짚어봤다”라며 “우리가 일하는 프로세스에서 빠졌던 게 사용자였다”라고 말했다. 이후에는 ‘누구를 위해 이 작업을 하고 있는지’를 먼저 고민했다. 만들어진 콘텐츠가 사용자에게 적합한가를 확인했다.

보통 데이터 저널리즘을 달고 나오는 콘텐츠는 동적인 효과를 쓴다. 웹에서 움직이면서 데이터를 드러내는 콘텐츠는 그 모습만으로도 있어 보이고 ‘뭔가 한 것’ 같은 느낌을 준다. 양도 어려운 문제다. 기사는 정보를 전달하는 게 목적인 만큼 덜어내는 게 중요한 콘텐츠지만, 데이터 저널리즘은 보여줄 만한 게 많다. 양도 많고 길어지는 이유다.

<중앙일보>는 사용자를 생각해 유통에서 3가지 변화를 줬다. 첫 번째는 이미지 파일이다. 별도 페이지를 개발하지 않고 인포그래픽 형태로 가공한다. 사용자 입장에서는 데이터도 아낄 수 있고, 만드는 사람 입장에서도 손이 덜 간다.

두 번째 방법은 ‘기사 쪼개기’다. 김한별 기자는 ‘한 번에 보여주면 ‘스압’을 느낄 수밖에 없다”라며 “체류시간 보면 다 안 보고 나가는 사람이 많아서 쪼개기 시작했다”라고 말했다.

‘거제, 이대로 추락할까’ 기사 페이지 갈무리 (사진=이치열 <미디어오늘>기자)

세 번째는 ‘사람’이다. 숫자는 건조하다. 그 자체로는 별다른 매력이 없다. <중앙일보>팀은 대우조선해양사태 문제를 콘텐츠로 만들 때였다. 처음에는 주가의 하락세에 포인트를 잡아 세미 3D 인터랙티브 차트로 만들었다. 하지만 반응이 시원찮았다. 두 번째에는 사람을 넣었다. 거제도 지역 실업급여 데이터를 청구해 받고, 분석을 통해 파악한 내용을 바탕으로 취재기자를 보내 르포 기사를 썼다. ‘거제, 이대로 추락할까‘라는 제목으로 나온 기사는 사람을 앞에, 데이터는 뒤에 둬서 좋은 평가를 받았다. 김한별 기자는 “서생의 문제의식, 상인의 현실감각이 필요하다는 화두를 담고 있다”라며 “전달하는 방법에서는 상인의 현실감각이 필요하고, 현실감각을 위해서도 더 많은 노력과 투자, 의지가 필요하다”라고 강조했다.

김태형 <KBS> 데이터저널리즘팀 기자 (사진=이치열 <미디어오늘>기자)

<KBS>, 지도는 이야기의 출발점

<KBS>도 여러 데이터 저널리즘 보도를 만들어왔다. 방송뉴스는 욕을 먹었을지언정 데이터 저널리즘 팀에서는 100건의 기록을 3D 타임라인으로 구성했다. 전국의 유치원, 초·중·고등학교의 석면 정보를 바탕으로 ‘전국 석면 지도’를 만들기도 했다. 올해 초에는 대선을 맞아 공약을 좀 더 쉽게 보려는 시도도 진행했다. ‘전국 소녀상 지도‘를 만든 것도 <KBS>다. 지도를 활용한 콘텐츠가 많다.

김태형 <KBS> 데이터저널리즘팀 기자는 “지도는 이야기의 출발점”이라고 말했다. 데이터 시각화에서 가장 많이 쓰는 방법 중 하나인 매핑은 위치 정보를 바탕으로 의미를 찾아나가는 작업이다. 정보의 레이어를 겹쳐서 유의미한 정보를 제공하거나 문제를 제기할 수 있다.

‘전국 소녀상 지도’ 기사 페이지 갈무리

데이터를 일단 지도에 뿌려보면 패턴을 살펴볼 수 있다. 패턴을 살피면서 가설을 세워보고 스토리를 발전시켜 나갈 수 있다. 지도가 이야기의 출발점인 이유다. 김태형 기자는 “데이터가 확보된 상황에서 기사를 쓰면 쉬울 것 같은데 어렵게 느껴질 때가 많다”라며 “지도를 취재의 출발점으로 삼고 지도를 놓고 (독자들이) 이야기를 할 수 있도록 고민하겠다”라고 말했다.

박원경 <SBS> 데이터저널리즘팀 기자 (사진=이치열 <미디어오늘>기자)

<SBS>, 이유를 설명하는 데이터 저널리즘을 찾는다

<SBS>의 데이터 저널리즘 브랜드인 ‘마부작침’은 꾸준히 좋은 결과물을 만들어 오고 있다. 대표적인 보도는 ‘무변촌 지도‘다. 좀 더 보편적인 법률서비스를 위해 ‘로스쿨’이 도입된 지도 9년 정도 지났는데, 취지에 맞게 많은 국민에게 법률서비스의 접근성이 좋아졌는지 확인해보는 콘텐츠다. 실제로 확인해 본 결과 여전히 서울 등 수도권에 집중돼 있고, 지방에는 변호사가 단 한 명도 없는 ‘무변촌’이 수두룩했다는 사실을 확인했다. 변호사 1인당 담당 인구수도 수도권이 압도적으로 좋았다.

‘무변촌 지도’ 기사 페이지 갈무리

그 외에도 검사장의 배경을 분석하는 ‘검사장 전수 분석’, 지자체 주민 건강을 살펴보는 기획, 미세먼지 측정 자료 분석 등도 좋은 문제의식과 깔끔한 시각화가 돋보이는 콘텐츠들이다.

결과물만 보면 무척 좋지만, 만들어내는 뒷단의 고민은 깊다. 박원경 <SBS> 데이터저널리즘팀 기자는 “회사에서 말을 안 해도 빨리 결과물을 내놓고 싶지만 실상은 시간이 오래 걸리고, 시간을 많이 쓰는 작업이다”라고 말했다. 데이터 저널리즘은 지루한 작업이다. 매번 턱턱 막히는 지점들이 있다. 하다못해 데이터를 수집할 때도 보면 자료 구하기도 어렵고, 어렵게 구해도 쓸 수 있는 상태의 데이터가 아닌 것도 많다. ‘데이터’가 저널리즘보다 앞에 오다보니 수단과 목적이 전치되는 일도 생긴다. 박원경 기자는 “가설을 세우고 검증해야 하는데, 데이터를 수집해서 억지로 이야기를 끌어내게 된다”라고 말했다. 콘텐츠를 어렵게 만들어도 전달의 문제가 있다. 데이터를 열심히 분석해서 최대한 친절하게 설명하려고 인터랙티브, 특별페이지를 만들지만, 뉴스 대부분이 소비되는 포털에서는 구현이 전혀 안 된다. 박원경 기자는 “어렵게 작업한 결과물을 사람들이 못 보는 구조적인 문제가 있다”라고 말했다.

데이터 저널리즘은 이런 어려움을 극복해 나가면 끊임없이 답을 찾아 나가는 과정이다. 그 과정에서 최근 답을 찾고 있는 문제는 ‘이유’다. 지금까지의 데이터 저널리즘 콘텐츠는 현상을 보여줄 수 있어도 이유에 대해서는 잘 설명해주지 못한다는 생각이다. 박원경 기자는 “현장 나가는 게 쉽진 않지만 적극적으로 시도하고 있다”라며 “데이터 저널리즘에서 중요한 건 문제의식”이라고 말했다.

함형건 <YTN> 데이터저널리즘팀 팀장 (사진=이치열 <미디어오늘>기자)

<YTN>, 소외된 사람들의 이야기를 기억하라

함형건 <YTN> 데이터저널리즘팀 팀장은 국내에서 GIS를 활용한 보도에 가장 적극적인 기자다. 최근에는 ‘매장문화재 데이터 분석’으로 매장 문화재 근방에서 벌어지는 난개발 문제를 다뤘고, ‘펀치볼 지뢰 지도’로 민간인 지뢰 피해 실태를 살폈다. 내진 설계 현황을 살펴봤고, 유독물 공장 지도를 만들기도 했다.

이날 함형건 기자가 소개한 사례는 ‘펀치볼 지뢰 지도‘다. 엄청나게 큰 데이터를 다뤘다거나, 무척 효과적인 시각화를 구현해 내서 가지고 온 사례가 아니다. ‘소외된 사람들의 이야기’를 듣는다는 본질을 되새기게 한 기사이기 때문이다.

강원도 양구군에는 ‘펀치볼’이라 불리는 지역이 있다. 푹 파인 분지 지형인데, 한국전 때 미군 병사들이 ‘화채 그릇을 닮았다’고 해서 붙여진 별명이다. 민간통제선에서 해제된 지역인데, 접경지역 부근이기 때문에 지뢰 피해 사고가 무척 잦은 곳이다. 1960년 이후 펀치볼에서 지뢰 사고로 목숨을 잃거나 크게 다친 민간인은 40명이 넘는다.

‘펀치볼 지뢰 지도’ 기사 페이지 갈무리

국방부는 물론 미군 측에도 정보를 청구했지만 ‘가지고 있지 않다’는 답만 돌아왔다. 가장 기본이 되는 데이터 확보가 어려운 상황에서 함형건 기자는 직접 지역에 가서 시민단체 활동가가 1년간에 걸쳐 구축한 지도를 받았고, 직접 피해자를 수소문하면서 위치 정보를 수집했다. 그 과정에서 수십년 전 군 헌병대 조사보고서도 열람할 수 있었다. 하나하나 확인해가면서 35명 희생자의 사고 위치를 파악해 지도에 점을 찍었다. 함형건 기자는 “어떻게 보면 소박한 맵이지만 하나하나에 절절하고 비극적인 사연이 있다”라며 “지도 레이어를 중첩해서 분석하는 것도 중요하다고 생각하지만, 작은 그림과 큰 그림을 동시에 보여줘야 한다”라고 말했다.

“알짜 데이터는 별로 없지만, 패턴을 읽는 방식으로 분석하면 미필적 고의에 의한 사회안전망 붕괴, 시스템의 미비를 드러낼 수 있다. 한국의 데이터 저널리즘이 신경 써야 할 부분이 아닌가 한다.”

김강민 <뉴스타파> 데이터팀 기자 (사진=이치열 <미디어오늘>기자)

<뉴스타파>, 데이터 공개로 만드는 생태계

<뉴스타파>의 다른 이름은 한국탐사저널리즘센터다. 탐사보도와 데이터 저널리즘은 떨어질 수 없다. <뉴스타파>에서도 그간 데이터를 활용한 보도를 꾸준하게 냈다. ‘원전 묵시록 프로젝트’에서는 원전 납품 문제를 살펴보기 위해 한국수력원자력이 맺은 하청 관련 데이터를 수집해서 분석했고, ‘친일파 망각 보도’ 에서는 친일파와 그 후손 관련 데이터를 꼼꼼하게 파악해서 분석했다.

김강민 <뉴스타파> 데이터팀 기자가 이날 가지고 온 사레는 ‘고위공직자 재산 공개 사이트‘ 다. <뉴스타파>의 고위공직자 재산 공개 사이트는 그간 기관별로 산발적으로 공개되던 고위공직자들의 재산 내역을 한 데 모아 시민들의 쉽게 찾아볼 수 있는 웹사이트를 지향한다. 매년 재산 공개 철이 되면 데이터를 업데이트한다.

고위공직자 재산 정보 공개 페이지 갈무리

한국에서 공공기관이 제공하는 데이터는 신뢰도가 그리 높지 않다. 항상 검증 과정이 필요하다. 김강민 기자는 “중간에 잘못된 내용이 있으면 임의로 처리해서 나중에 맞춰보면 합계가 안 맞더라”라고 어려움을 이야기했다. 데이터도 처리하기 쉬운 형식은 커녕 이미지 파일로 주는 경우도 허다하다. 컴퓨터를 눈 앞에 두고 수작업이 들어가야 하는 현실이다. 아르바이트도 쓰고, 문자 인식 프로그램도 돌리고 수작업으로 검증해서 정리된 데이터셋을 만들었다.

힘들게 만들었지만 내부의 시선이 곱지만은 않다. 언론사의 특성이다. 정리된 자료를 타사 기자들도 쉽게 볼 수 있다보니 다른 기자들은 ‘왜 그걸 우리가 해야 하는 지 잘 모르겠다’는 반응이다. 김강민 기자는 “성과가 쌓이고 업계에서 좋은 평가가 있으면서 조직에서도 더 호의적인 반응이 생기는 것 같다”라며 “데이터 다루는 분들이 공개와 공유에 호의적이다. 여기 계시는 분들도 좋은 생태계를 만들어 달라”라고 말했다.

from Bloter.net http://www.bloter.net/archives/295225