사람과디지털기사

기사

‘사람 흉내 음성비서’ 구글안경 실패 넘어설까?

2018.05.14
AI 어시스턴트 사람음성 구별 논란
미용실·식당 예약도 완벽하게 처리
통화 상대 사람인지 로봇인지 몰라
‘매크로’ 예약도 못 막는 세상에 충격
기술위주 접근 ‘구글안경’은 결국 실패
지난 8일 미국 샌프란시스코에서 열린 구글 개발자회의에서 구글의 최고경영자 순다 피차이가 구글의 인공지능 비서 서비스 듀플렉스의 최신 기능을 공개하고 있다.  구글 제공
지난 8일 미국 샌프란시스코에서 열린 구글 개발자회의에서 구글의 최고경영자 순다 피차이가 구글의 인공지능 비서 서비스 듀플렉스의 최신 기능을 공개하고 있다. 구글 제공

# 미용실(B)에 손님의 예약전화(A)가 걸려왔다.



A: “5월3일에 머리 손질 가능한가요?”
B: “일정 볼게요. 잠깐만 기다리세요.”
A: “흐음~”
B: “언제쯤 원하시나요.”
A: “낮 12시요.”
B: “12시는 안 되고, 오후 가장 이른 시간이 1시15분이네요.”
A: “그러면 오전 10~12시는 어떤가요?”
B: “무슨 서비스인지에 따라 달라요.”
A: “헤어컷 하려고요.”
B: “헤어컷이라면 오전 10시 가능합니다. 예약자 이름은요?”
A: “리사예요. 감사합니다.”



지난 8일 미국 샌프란시스코 쇼라인 앰피시어터에서 열린 구글 연례 개발자회의(I/O 2018) 기조연설에서 구글의 최고경영자 순다르 피차이가 공개한 인공지능과 사람의 실제 대화 내용이다. A는 구글이 개발한 인공지능 비서 ‘구글 어시스턴트(듀플렉스)’이고, B는 미용실 주인이다. 피차이는 실제로 이뤄진 대화 내용이라고 소개했다. 애초 원하는 시간이 불가능하자 대화를 지속하며 가장 가까운 시간으로 예약을 했다. A의 음성은 강세와 톤에서 사람의 목소리가 아니라고 생각할 만한 구석이 전혀 없었고, 답변을 기다리고 ‘음’ ‘흐음~’과 같은 감탄사까지 적절하게 사용하며 매끄럽게 대화를 이어갔다. B의 “잠깐만 기다리세요”라는 말에 A가 “흐음~”으로 응대하자, 개발자회의에 모인 7500여 참석자들은 일제히 탄성을 쏟아냈다.


붐비는 식당에 네 사람 저녁을 예약하는 전화 대화 내용도 함께 소개됐는데, 남성 목소리를 흉내낸 듀플렉스는 식당 직원을 상대로 요일별 혼잡도까지 문의해가며 자연스럽고 정교한 대화 끝에 애초 희망한 시각을 변경하며 예약에 성공했다. 듀플렉스는 이미 여섯 종류의 목소리를 사용할 수 있어 음성분석으로 로봇인지를 구분하기도 불가능하다.


순다르 피차이는 이날 “미국 소형 점포의 60%는 온라인 예약 시스템을 갖추지 못해 기존 구글 서비스의 활용이 제한적이었다”며 “이용자가 바빠 직접 전화를 걸어 예약하는 게 힘들다면 이 기능을 유용하게 쓸 수 있을 것”이라고 설명했다.


2년 전 공개된 구글의 음성비서 서비스는 인공지능 기술을 적용해 이번에 훨씬 똑똑해졌다. 주인이 자신에게 지시하는 말과 주인이 다른 사람과 대화하는 말을 구분할 줄 알고, 상대가 공손하게 말을 걸면 이에 맞게 반응하는 ‘공손하게 말하기’ 기능도 추가됐다. 이런 기능을 갖춘 구글 홈은 연내에 한국을 비롯한 7개국에 출시될 예정이다.


듀플렉스가 선보인 예약 기능에 대한 반응은 엇갈렸다. 발표 현장에 모인 개발자들을 비롯해 많은 사람이 환호와 탄성으로 인공지능 기술의 발달을 반겼지만, 적지 않은 언론과 전문가들이 비판과 우려의 목소리를 내놓았다. 영국 신문 <인디펜던트>는 “사람 흉내를 내는 끔찍한 인공지능 로봇”이라고 비판했고, <블룸버그> 통신은 “사람을 속일 만큼 똑똑한 인공지능의 실제 목소리 주인공이 누구인지 공개해야 한다”며 “이 기능은 현재 기술기업들이 직면한 프라이버시나 개인정보 보호 문제를 해결하는 데 전혀 도움이 되지 못한다”고 말했다.


매사추세츠공대의 에릭 브린욜프슨 교수는 “놀라운 기술발전이지만, 인공지능의 핵심 목표가 사람을 흉내내는 것은 아니다. 그보다 인공지능 개발자들은 사람이 상대하고 있는 대상이 사람인지 기계인지 알 수 있도록 해야 한다”고 <워싱턴 포스트>와의 회견에서 밝혔다.



기계가 알려주지 않으면 사람이 아니라고 전혀 알아차릴 수 없는 인공지능 기술이 실용화를 앞둠에 따라 많은 문제가 생겨나고 있다. 녹음임을 알 수 있는 스팸전화나 마케팅전화와 달리 듀플렉스가 전화를 걸어오면 사용자가 대화를 마칠 때까지도 상대 정체를 알 수 없다. 이런 도구를 활용하는 사람이 혼잡한 식당이나 미용실만이 아니라 거의 모든 예약서비스를 이용할 경우 특정 집단이 사회의 자원과 기회를 독차지할 우려가 높다. 현재 우리나라에서는 단순한 프로그램인 매크로가 사용돼 예약 풍토와 댓글 문화를 망가뜨리고 있지만 적절한 해결방안을 찾지 못하는 상태인데, 상황이 크게 악화할 수 있다. 문자 캡차에 이어 통화마다 “당신이 로봇이 아니라는 것을 증명하시오”라는 음성 튜링테스트를 거쳐야 할지 모른다.



인공지능이 사람을 닮은 정도를 넘어 더 이상 사람과 식별할 수 없는 상황이 되면 이는 기술과 개발의 문제가 아니라 정서와 사회적 합의, 윤리 차원의 논쟁이 된다. 누군가에게는 나의 수고와 시간을 아껴주는 편리한 기능이지만, 동시에 그것을 상대하거나 지켜보는 다수에게는 ‘사람인 체하며 나와 사회를 속이는’ 기만적 기술일 수 있다.


구글 듀플렉스는 2012년 세르게이 브린이 구글 개발자회의에서 소개하며 환호와 기대를 불러온 구글안경의 사례와 유사하다. 개발자들은 구글안경을 획기적 진전으로 받아들였지만, 그 기술이 사용될 상황을 살아갈 보통사람들에게는 한 사람의 착용자로 프라이버시가 없어지는 원형감옥의 도구로 여겨졌다. 구글 듀플렉스가 실패한 구글안경의 전철을 밟지 않으려면 기술 너머 사용자들의 마음과 사회적 가치를 살펴야 한다.


구본권 사람과디지털연구소장