이 일련의 이야기를 접하면서 ‘데이터 투명성’에 대해 여러 가지가 궁금해졌어요. 그래서 UC 버클리의 장기 사이버 보안 센터에서 연구하고 계시는 백지연 박사님께 궁금한 것들을 여쭤봤습니다. 박사님은 프라이버시, 데이터 거버넌스, 플랫폼 콘텐츠 규제 같은 이슈에 대한 정책을 연구하고 계시다고 하니 이 분야에 제격이시죠. 박사님의 인터뷰와 브랜던 실버맨의 인터뷰를 녹여서 데이터 투명성에 대해 더 알아보았습니다.
🤗 백지연 박사님의 인터뷰 내용은 박사님 개인의 의견으로, 박사님이 소속된 센터의 입장이 아닙니다.
찬비: 소셜 미디어 플랫폼에 데이터 투명성은 왜 필요한가요?
백지연: 소셜미디어 플랫폼이 우리의 다양한 생활 영역 전반에 걸쳐 중요한 역할을 한다는 점을 생각할 때, 데이터 투명성은 점점 대두되고 있는 다양한 플랫폼 관련 문제점들을 이해하고 나아가 해결책을 의논하는 과정에 도움이 될 첫 단추라고 생각합니다.
찬비: 그렇다면 데이터 투명성은 사회적으로 어떤 도움이 될 수 있을까요?
백지연: 크게 두 가지 측면을 이야기할 수 있어요. 첫째, 데이터가 공개됨으로써 정부 기관, 학계, 미디어, 시민 단체 및 개개인 등 다양한 우리 사회 구성원이 플랫폼의 기능과 영향에 대해 잘 이해하고 분석하는 시작점이 될 수 있습니다. 둘째, 소셜 미디어 플랫폼이 데이터 공개로 인해 부담을 가지게 되고 이로 인해 데이터를 더 나은 방식으로 다루고 이용할 방법을 모색할 수도 있습니다.
실버맨 역시 박사님과 비슷하게 세 가지를 이야기합니다. 현상을 이해하고 연구할 수 있는 강건하면서 강력한 연구자 커뮤니티를 만들 수 있고, 플랫폼이 올바른 결정을 내렸는지 책임을 물을 수 있고, 플랫폼 내의 악성 사용자를 막을 수 있다고요.
또한 인터뷰에서 크라우드탱글로 얻을 수 있는 데이터가 실제로 미얀마나 스리랑카, 에티오피아의 인권운동가에게 큰 도움이 된다는 것을 언급합니다. 실제로 발생하는 폭력을 방지하고 선거가 문제없이 진행되도록 도울 수 있다는 거죠. 지난해 노벨 평화상 수상자인 마리아 레사(Maria Ressa)와 그의 래플러(Rappler)팀은 크라우드탱글을 활용해 필리핀에서 퍼지는 허위정보와 혐오 표현을 저지하기 위해 노력해왔다고 해요.
찬비: 사회적으로는 도움이 된다는 것은 알겠어요. 하지만 소셜 미디어 플랫폼에게는 꽤나 불리한 내용인 것 같은데, 플랫폼이 자사의 데이터를 공개해야 하는 이유는 무엇일까요?
실버맨은 이 질문에 대해 꽤 강력한 톤으로 답해요. 여러 가지 이유로 설득할 수 있겠지만 “결국 그것을 해야 하는 진짜 이유는 당신이 구축한 것에 대한 책임을 져야 하기 때문입니다”라고요. 강력한 힘에는 그만큼의 감시가 필요한 법인만큼 자사 플랫폼이 사회에 어떤 영향을 미치고 있는지 알 수 있도록 사회를 지원해야 할 필요가 있다고 해요. 덧붙여 실버맨은 페이스북은 현재 크라우드탱글이라도 있지만, 틱톡, 텔레그램, 유튜브는 이런 노력을 별로 하지 않고 있다고 비판합니다.
찬비: 위에서 언급했던 법안이 실질적으로 도움이 되려면 어떤 내용이 포함되어야 할까요?
백지연: 여러 플랫폼이 일관된 방식으로 지표를 도출할 수 있도록 하는 조항이 필요합니다. 도출 방식이나 제공하는 지표가 상이할 경우, 비교 연구가 어려워지기 때문입니다. 정확한 비교가 가능해져야 플랫폼의 사회적인 영향에 대한 보다 구체적인 연구가 가능해지니까요.
또한 데이터를 공개하는 과정에서 발생할 수 있는 문제점을 방지하는 조항도 필요합니다. 예를 들어, 데이터가 공개될 때 플랫폼 이용자들의 데이터 프라이버시 등이 제대로 지켜질 수 있도록 데이터를 적절히 관리하고 취합하는 방법 등을 명시할 필요가 있습니다.
실버맨은 프라이버시와 관계없는 데이터임에도 플랫폼에서 공개하지 않는 데이터가 많다고 지적해요. 이미 있는 데이터를 더 접근하기 쉽고, 잘 활용할 수 있도록 하는 ‘효율적인 투명성'에 대한 고민이 필요하다고요. 예를 들어, 팩트체크가 되었는지 여부에 대한 라벨을 공개한다면 러시아-우크라이나 전쟁에 대해 어떤 허위정보가 가장 많이 퍼졌는지를 알 수 있겠죠.
비슷하게 플랫폼에서 자체적으로 삭제한 콘텐츠에 대한 데이터를 공개하는 것도 중요한데, 삭제된 콘텐츠를 보관하거나 연구자와 공유하는 것에 대한 기준이 없는 것이 안타깝다고 이야기합니다.
찬비: 넷플릭스는 최근 TOP 10이라는 웹사이트를 통해 자체적인 시청률 지표를 공개하고 있는데, 이런 것도 도움이 될까요?
백지연: 아예 공개를 하지 않는 것보다는 일정 부분 도움이 되는 변화이겠지만, 자체적인 지표 공개에 대한 한계점은 있다고 생각해요.
찬비: 이번에는 조금 다른 이야기를 해볼게요. 국내외에서는 데이터보다는 알고리즘을 공개해야 한다는 이야기가 먼저 언급되었어요. 알고리즘과 데이터, 두 가지를 공개하는 것은 어떻게 다를까요?
백지연: 알고리즘과 데이터, 두 가지가 모두 공개될 때 플랫폼에서 파생되는 여러 문제점을 적절히 이해할 수 있을 것입니다. 데이터만 공개된다면 그 데이터들이 어떤 알고리즘을 통해 결과에 도달했는지를, 알고리즘만 공개된다면 이 알고리즘이 왜 특정 결과를 도출했는지를 이해하지 못하게 될 거예요.
찬비: 최근 PATA를 비롯해서 데이터 투명성 관련 법안들이 제안되고 발의되고 있습니다. 연구자로서는 어떤 인상을 받으시는지 궁금해요.
백지연: 법안들에 연구자의 역할이 중요하게 제안되어 있다는 점이 인상적이고, 연구자로서 책임감이 들기도 합니다. 정부-연구자-플랫폼 간 데이터 공개와 분석이 안전하고 정확하게 이뤄지도록 구체적인 내용이 포함되어야 법안이 성공할 수 있을 것이라 생각합니다.
PATA나 캘리포니아에서 발의된 Social Media Transparency and Accountability Act of 2021이 대체로 양당의 지지를 받고 있다는 점이 인상적입니다. 구체적인 조항에서는 차이가 있지만 소셜미디어 플랫폼 데이터 투명성이 필요하다는 일종의 사회적 합의가 이루어지고 있다는 느낌을 받습니다.
찬비: 마지막으로 연구자로서 데이터 투명성과 관련해 앞으로의 전망을 어떻게 보시나요?
백지연: 데이터 투명성에 대한 여러 법안들이 제안되고 있는 것은 상당히 고무적이지만, 실제로 이 법안들이 성공적으로 통과될지, 또 통과된다면 그 과정이 얼마나 걸리고 그 결과가 실효적일지는 지속적인 사회적 관심과 합의에 달려있다고 생각합니다.
데이터 투명성은 프라이버시, 차별과 같은 여러 다른 문제점들과 맞닿아 있는 이슈이기도 합니다. 따라서 소셜미디어 플랫폼을 넘어 인공지능과 같이 새롭게 결합되고 발전되는 기술들을 이해하고 그로부터 파생되는 문제점을 해결하는 데도 데이터 투명성은 계속 중요한 지점으로 논의될 것이라고 생각합니다. |