구글·우버, 그리고 오바마 선거캠프 후원금 모집에서 활용된 '데이터 분석'
다양한 분야에 꼭 필요한 내용, 메모 추천

▲ 도서 '데이터분석의 힘' 표지. 사진=(주)인플루엔셜

[일간투데이 정우교 기자] 데이터는 문제를 인식하고 결과를 도출하는 과정에 객관성을 부여한다. 빅데이터가 4차산업혁명 기술의 동력으로 평가받는 이유도 이렇다고 볼 수 있다.

모든 의사결정이 데이터에서 시작되기 때문이다. 잠재적인 고객의 성향을 조사해 서비스의 방향이 결정되고 기능 추가‧개선도 논의된다. 구글‧우버의 전략도 데이터 분석에 중점을 두고 있다. 하지만 분석을 거쳐 도출된 결과는 전부 옳다고 말할 수 있을까. 책 '데이터 분석의 힘'은 분석자가 올바른 결정을 내릴 수 있도록 돕는다.

■ 어려운 내용? 노트에 적어 반드시 이해해야 할 내용!

사실 통계학 전공이거나 데이터 분석 관련 업무와 관련 없다면 책의 내용은 다소 어려울 수 있다고 생각했다. 그러나 이는 오해였다. 데이터 분석법은 실제 사례와 함께 설명되고 있었다. 만약 개념을 놓쳤다면 각 장 마지막에는 별도의 요약이 있어 무난히 이해할 수 있었다.

단순히 머릿속으로 이해하는 것보다 필기하면서 독서하기를 추천한다. 왜 다산 정약용 선생의 독서법에도 중요한 부분과 문장을 자신의 독서 노트에 옮겨 적는 내용이 들어 있다고 하지 않은가. 필기를 통해 이 책이 전하는 데이터 분석법을 온전히 습득하기를 바란다.

이 책은 RCT, RD디자인, 집군분석, 패널 데이터 분석법 등을 소개하고 있다. 데이터 분석의 목적은 어떤 요인이 결과에 영향을 미쳤는가 즉, '인과관계가 성립하는가'를 확인하는 것이라고 한다. 주로 일본 내 이야기를 담고 있지만 전기료, 연비규제 정책 수립 등 국내서도 참고할만한 사례도 등장한다.

■ 데이터 분석을 활용한 오바마 캠프의 후원금 모금

이중 소개할 분석법은 무작위 비교시행(이하 RCT)이다. RCT의 개념을 "오마바 캠프는 어떻게 후원금을 '더' 모았을까"라는 사례와 함께 설명하는 것이 좋을 것 같다.

미국 대통령 선거는 후원금의 규모에 따라 결과가 달라진다고 한다. 지난 2008년 대통령 선거에서 오바마 캠프는 구글 출신 전문가를 영입해 후원금 모금을 맡겼고 그 전문가는 RCT를 이용한 데이터분석으로 광고전략을 짜왔다.

당시 오바마 후보 홈페이지 디자인을 통해 후원금을 모집하는 전략이었다. 캠프 측은 홈페이지 방문자들에게 화면시안 6개와 메시지 4개를 결합한 총 24개의 디자인 시안을 무작위로 뽑아 하나만 보이게 했다.

총 31만명의 방문자들은 24개로 나눈 시안으로 각 시안마다 약 1만3천명씩 무작위로 배분됐고 메일 등록률이 가장 높았던 디자인을 선거운동에 사용했다. 그 결과 약 6천만 달러의 후원금을 추가로 모금할 수 있었다.

RCT의 원칙은 이렇다. 우선 집단을 비교·개입집단(24개 시안)으로 구분하고 무작위로 집단을 나눈다. 그 후 집단별로 충분한 표본수(약 1만3천명)를 채웠다. 이것만 지켜진다면 어떤 변수에서도 각 집단이 평균적으로 동등해진다. 객관적인 결과를 얻을 수 있다는 뜻이다.

또한 RCT를 실제(미국 대통령 선거)에 적용한 오바마 캠프의 과감한 결정도 인상적으로 느껴졌다. 분석 과정에서 소모되는 시간·비용을 감수하면서 말이다. 저자 이토 고이치로는 책에서 "데이터를 분석할 때는 과정과 결과가 투명해서 분석자가 아닌 사람에게도 설득력이 있어야 한다"고 말하고 있다.

오바마 캠프의 사례는 많은 사람들을 설득했고 후원금 모집, 대통령 당선도 얻을 수 있었다. 객관성이 보장된 데이터 분석은 이렇게 힘을 가질 수 있다. '데이터 분석의 힘'을 통해 독자의 분야에서 최선의 결과를 얻기 바란다.


저작권자 © 일간투데이 무단전재 및 재배포 금지