논문 때문에 돌린 설문조사가 생각보다 일이 커질 뻔했다

졸업 논문 준비하면서 설문조사 데이터가 꼭 필요하다고 했을 때, 솔직히 구글폼으로 링크 하나 만들어서 단톡방에 뿌리면 끝날 줄 알았다. 처음에는 그렇게 쉬워 보였다. 다들 한 번쯤 해봤을 테니까. 친구들한테 기프티콘 하나씩 걸고 참여해달라고 하면 금방 응답이 쌓일 거라 생각했는데, 막상 해보니까 생각보다 훨씬 지루하고 답답한 과정이더라.

응답자 모집의 늪에서 허우적대기

결국 나중에는 지인 찬스도 한계가 왔다. 100명은 채워야 데이터로서 의미가 있다고 지도 교수님이 말씀하셨는데, 실제 응답은 40명에서 멈췄다. 맘카페에 올릴까 고민하다가도, 내가 하려는 주제가 너무 학술적이라 일반인들이 관심이나 있을까 싶어서 포기했다. 결국 에브리타임이랑 학교 커뮤니티에 글을 올렸는데, 거기서도 반응은 시원찮았다. 설문조사 한 번 하는 데 무슨 500원짜리 간식 기프티콘을 뿌려야 하는지, 논문 하나 쓰려고 아르바이트비의 상당 부분을 여기서 다 쓴 것 같다. 생각해보면 설문조사 사이트인 서베이몽키 같은 걸 써볼까도 고민했었는데, 무료 버전은 질문 개수 제한이 너무 심해서 결국 익숙한 구글폼으로 돌아오게 되더라. 그게 가장 만만하기도 하고.

네이버 폼 이슈 뉴스를 보며 든 생각

요즘 뉴스에서 삼성전자 노조 관련해서 네이버 폼 설문조사 결과가 논란이 됐다는 기사를 봤다. 가처분 신청까지 들어갔다길래 무슨 일인가 싶어 읽어봤는데, 절차상 문제로 설문조사의 신뢰성을 따지는 상황이더라. 나는 겨우 학부생 수준의 논문 데이터를 모으면서도 ‘이게 제대로 된 응답일까’, ‘중복 응답자가 있으면 어떡하지’ 싶어 매일 구글 시트 들어가서 데이터 클리닝 하느라 끙끙거렸는데, 하물며 수천 명 단위의 의사결정을 그런 방식으로 했다니 참 신기하기도 하고 무모해 보이기도 했다. 설문조사라는 게 사실 마음먹고 조작하려고 하면 너무 쉬운 구조라, 나중에 교수님 앞에서 논문 방어할 때 데이터 정당성을 어떻게 방어해야 할지 벌써부터 머리가 아파온다.

데이터 수집과 현실 사이의 괴리

결국 일주일 넘게 커뮤니티마다 눈팅하면서 ‘설문조사 부탁드립니다’ 글을 새로 고침 하느라 시간을 다 보냈다. 통계 포스터를 만들려면 표본 수가 적어도 150명은 넘어야 깔끔하게 나온다는데, 지금 상태로는 턱없이 부족하다. 수업 듣는 틈틈이 카페에 앉아서 리서치 알바 하듯 홍보 글 올리고, 누가 응답했는지 하나하나 체크하는 게 이게 무슨 공부인가 싶기도 했다. 예전에는 그냥 설문조사 링크 오면 아무 생각 없이 5초 만에 체크하고 끝냈는데, 막상 입장이 바뀌니 응답 한 건이 얼마나 소중한지 새삼 깨닫는다. 아는 동생은 투표 사이트 활용해서 하면 그나마 좀 낫다고 하던데, 이미 폼 다 만들어둔 상황에서 옮기기도 귀찮아서 그냥 그대로 밀고 나가는 중이다.

끝이 보이지 않는 데이터 정제 작업

어찌어찌 응답은 쌓여가는데, 불성실 응답자들이 문제다. 응답 시간을 보니까 설문 시작하자마자 30초 만에 끝낸 사람들이 꽤 많다. 고민도 안 하고 아무 버튼이나 누른 게 뻔한데, 이걸 다 걸러내야 하니까 실제 데이터는 또 줄어든다. 연구 보고서 써본 선배들이 왜 처음에 데이터 수집할 때 표본을 넉넉하게 잡으라고 했는지 이제야 알 것 같다. 지금 데이터 깎아내면 논문 분량은 나올지 걱정이다. 다음 주까지는 무조건 마무리 지어야 하는데, 또 사람 구하러 다니느라 학교 근처 카페나 돌아다녀야 할 것 같다. 차라리 2만 원 내고 유료 설문 대행 플랫폼을 썼어야 했나 싶은 후회도 잠깐 들지만, 이미 늦었다. 논문이라는 게 생각보다 훨씬 더 사람 피 말리는 작업이라는 걸 이번에 제대로 느끼고 있다. 졸업은 할 수 있겠지.

Similar Posts

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다