“네이버 뉴스 검색 결과, 관리자 개입 원칙적 불가능해” – 수다피플

“네이버는 뉴스 생태계 관리·유지라는 공적 책임과, 뉴스 서비스의 사업적 가치 제고 및 경쟁력 강화라는 사적 가치를 동시에 추구해야 합니다. 이를 위해 뉴스 서비스 자동화를 선택한 것은 공정성과 신뢰성 문제 해결을 위한 좋은 선택이라 생각합니다.”

네이버가 뉴스 서비스에 적용한 알고리즘을 외부 전문가에 맡겨 기술적·학술적으로 검토한 결과를 내놓았다. ‘네이버 뉴스 알고리즘 검토 위원회’(이하 검토위)는 11월29일 미디어 간담회를 열고 지난 6개월 동안 진행한 네이버 뉴스 알고리즘 검토 결과를 공개했다.

검토위는 지난 5월 발족했다. 스포츠 뉴스 배열 조작과 같은 편파적 뉴스 배치, 매크로 프로그램을 이용한 랭킹 조작, 뉴스 속 금칙어 설정 및 정보 차단 등의 문제가 불거지며 외부 검토위 구성 필요성이 제기되면서다. 이번 검토위엔 컴퓨터공학, 정보학, 커뮤니케이션 3개 분야 전문가 11명이 참여했다. 검토위는 네이버 뉴스를 ▲뉴스 검색 서비스 ▲AiRS(에어스) 뉴스 추천 서비스 ▲연예 및 스포츠 뉴스로 구분하고 각 서비스별 데이터의 확보 과정, 실제 검색 결과를 결정하는 알고리즘과 그에 반영되는 자질(feature), 이용자에게 서비스가 실제로 공개되는 과정, 전체 과정에 대해 수립된 업무 절차의 적절성 등을 검토했다.

공정성·다양성 합격점…이용자·전문가 의견 보다 적극 반영해야

먼저 뉴스 검색 서비스를 보자. 검토위는 데이터 확보 및 사용, 뉴스 자질 및 알고리즘 선정 방식, 서비스 운영 등 3가지 요소를 기준으로 평가했다. 위원장을 맡은 맹성현 한국과학기술원 전산학부 교수는 “데이터 확보 및 사용시 품질평가 가이드라인이 7단계에 걸친 과정으로 작성돼 있고 뉴스의 연관성, 시의성, 품질을 기반으로 하고 있었다”라고 긍정적 평가를 내렸다. 가장 관심을 모은 뉴스 서비스 운영 부분에 대해서도 “뉴스 검색 결과는 알고리즘에 따라 자동으로 배치되므로 관리자 개입이 원칙적으로 불가능한 구조로 돼 있다”라며 “낚시성 기사를 제공하는 언론사의 점수를 낮추는 어뷰징 기준을 갖고 있으며, 어뷰징 자질을 언론사 뿐 아니라 기사 단위로도 부과해 잠재적인 언론사의 역차별을 방지하고 있다”라고 평가했다.

몇 가지 권고사항도 덧붙였다. 알고리즘 선정 방식에 대해 검토위는 “가이드라인의 세부 요소들을 위해 별도의 자질을 추출하기엔 현실적으로 어려움이 있으므로, 향후 자질 및 가이드라인 세부 요소를 좀 더 잘 맞춰나가는 노력이 필요하다”라고 권고했다. 가이드라인이 제시한 요소들을 보다 세밀하게 알고리즘에 반영하는 시스템을 마련해달라는 주문이다. 뉴스 운영 부분에 대해서도 “이용자 피드백을 수집하고 반영하는 프로세서를 좀 더 체계적으로 가져가는 것이 필요해 보인다”라며 “이용자 뿐 아니라 전문가 피드백을 개선 프로세스에 적극 반영했으면 좋겠다”라는 의견을 덧붙였다.

인공지능 뉴스 맞춤 추천 서비스인 AiRS(에어스)는 어떨까. 네이버는 뉴스 이용자들의 피드백 데이터만을 이용해 학습 데이터를 생성한다. 이용자 클릭과 누적 조회수·체류시간 등을 학습해 가중치를 부여하고, 이를 바탕으로 AiRS가 맞춤형 뉴스를 추천해준다. 이에 대해 검토위는 다양성 측면에서 합격점을 줬다. 이용자 입맞에 맞는 뉴스만 제공하다 자칫 확증편향에 빠지는, 이른바 ‘필터버블’ 현상은 AiRS 추천 서비스에선 나타나지 않았다는 설명이다.

맹성현 위원장은 “AiRS 추천 기사와 사람이 직접 편집한 기사를 비교했더니 AiRS 추천 기사가 훨씬 다양성이 높았다”라며 “이용자가 관심 있는 정보만 접하면서 편향된 정보를 습득하는 필터버블 문제점은 없는 것으로 확인됐다”라고 밝혔다. 다만 “서비스가 시작한 지 얼마 안 돼 지금은 다소 주먹구구식인데, 장기적으로 학습 데이터를 수집·활용하는 계획이 필요하다”라는 권고를 보탰다.

언론사별 어뷰징이 가장 심한 영역으로 꼽히는 스포츠·연예 뉴스 서비스에 대해선 별도 검토를 거쳤다. 네이버는 유사한 주제의 뉴스를 묶어 제공하는 클러스터링 알고리즘을 스포츠·연예 뉴스에 적용하고 있다. 검토위는 “댓글 가중치 최대값 제한, 시간 간격에 따른 작성 횟수 제한 등 어뷰징 방안이 마련돼 있다”라고 평가했다. 그러면서 “댓글 어뷰징 방지에도 기계학습 방법을 도입하는 것도 검토할 만하다”라고 덧붙였다.

검토위는 네이버 뉴스 서비스에 대해 공정성과 투명성, 다양성 측면에서 긍정적 평가를 내렸다. “공적, 사적 가치를 동시에 추구하기 위해 네이버가 뉴스 서비스 자동화를 선택한 것은 공정성과 신뢰성 문제 해결을 위한 좋은 선택”이라는 평가다. 검토위 활동에 대해서는 “뉴스 서비스 전반의 공정성과 투명성 관련한 발전 방안을 논의한 것은 세계 최초의 시도로, 나름 의미가 있다”는 자평을 곁들였다.

제언도 남겼다. 맹성현 위원장은 “뉴스 알고리즘과 데이터는 네이버 고유 자산이므로 전체 공개는 불가능하다”면서도 “어뷰징에 악용되지 않는 범위 안에서 개략적 프로세스와 자료 일부라도 공개하면 공정성과 객관성을 확보하는 데 도움이 되지 않나 생각한다”라고 밝혔다. “현재는 뉴스 서비스 품질 평가를 (조직별로) 각자 하고 있는데 이를 공통적으로 하고, 평가자 풀과 관점도 좀 더 다변화하면 좋겠다”는 의견도 덧붙였다. 그러면서 “뉴스 서비스가 부문별로 각각 개발·운영되다보니 서로 노하우가 공유되지 않는 경향이 있는데, 전체 서비스를 통합해 서비스와 노하우를 공유하는 문화를 만드는 노력도 필요하지 않나 생각한다”라고 조언했다. 검토위는 이번 평가 보고서 공개를 끝으로 6개월여에 걸친 활동을 마감할 예정이다.

네이버 알고리즘은 최적의 뉴스 서비스를 제공하고 있을까

몇 가지 숙제는 여전히 남았다. 먼저, 네이버란 뉴스 플랫폼 사업자가 준수해야 할 ‘저널리즘 가치’의 범위는 어디까지인지는 여전히 논란으로 남아 있다. 뉴스 서비스 제공자도 언론사에 버금가는 사회적 책무를 마땅히 가져야 하는지의 문제다. 이는 이번 검토위 논의 대상에서도 빠졌다. 이를테면 사회적 합의 문제이기 때문이다.

그렇다면 네이버 뉴스 알고리즘은 과연 최적의 뉴스 서비스를 제공하도록 구축돼 있는가. 이 또한 꾸준히 던져야 할 질문으로 남아 있다. 이번 검토위가 들여다본 건 네이버 뉴스 서비스의 투명성과 공정성에 집중돼 있다. 맹성현 위원장도 “위원회가 알고리즘을 검토할 때 목표로 삼은 건 뉴스 자동화가 침해할 수 있는 공정성 문제를 들여다보는 것이었지, 네이버가 현재 기술적으로 구현 가능한 최상의 알고리즘을 활용하는지 여부는 아니었다”라고 밝혔다. 뉴스 서비스의 공정성 문제와 별개로, 뉴스 서비스의 ‘완성도’에 대한 평가와 관리는 이용자와 사업자 모두 기울여야 한다는 지적이다.

뉴스 자동화 서비스와 인간의 개입 범위에 대한 기준을 마련하는 일도 쉽지 않다. 검토위는 “뉴스 검색 결과에 관리자(사람)가 개입하는 것이 원칙적으로 불가능하다”고 했지만, 이는 사안에 따라 인간의 개입 여지가 남아 있다는 뜻이기도 하다. 검토위에 참여한 김용찬 교수(연세대학교 언론홍보영상학과)도 “사람이 개입하는 걸완전히 차단하는 것이 문제가 되는 경우도 있다”라며 “사고가 발생하는 데 따라 인간이 개입하는 건 있을 수 있지만, 그 경우 어떤 형태로든 기록이 모두 남으며 그것이 체계적으로 관리돼야 한다고 검토위는 지적했다”라고 밝혔다. 하지만 해당 수정 기록이 어디까지 공개될지 결정하는 건 여전히 네이버 몫이다. ‘기업 비밀’이라는 정책적 판단과 서비스 투명성 사이에 줄타기는 남아 있다.

from Bloter.net http://www.bloter.net/archives/325417