[MBC사태] MBC 자체개발한 음성인식서비스(STT) 돌려봤더니 결과는...
[MBC사태] MBC 자체개발한 음성인식서비스(STT) 돌려봤더니 결과는...
  • 이준규
    이준규
  • 승인 2022.11.22 12:37
  • 댓글 0
이 기사를 공유합니다

MBC의 STT 서비스가 도마위에 올랐다.

MBC노조 측은 성명을 내고 MBC가 야심차게 개발한 음성인식서비스 (STT서비스)를 소개하면서 자사의 허위 가짜뉴스를 비판했다. 

윤석열 대통령의 사적인 대화 녹음파일 관련해서 결국 STT서비스로 돌려보니 인식할 수 없었다는 것이 결론이다. 그런데도 MBC는 악의적으로 자막을 넣고 허위 보도를 했다는 것이 골자다. 

다음은 MBC노조의 성명서 전문이다. 

[MBC노조 성명서 전문]

지난 9월 22일 대통령의 발언을 ‘악의적으로’ 자막을 넣어 방송한 점에 대해 대통령실과 MBC측의 공방이 MBC 출입기자의 도어스태핑 항의 사건을 계기로 다시 재점화되고 있다.

이기주 기자가 “뭐가 악의적이예요? 아니 영상이 있는데 왜 그걸 부정해요?”

라고 큰 목소리로 반복 질문하는 것을 보니 결국 그날의 진실을 밝히는 것이 급선무라는 생각이 든다.

사건 직후 MBC노동조합은 윤석열 대통령의 뉴욕 글로벌 재정펀드 모금 행사 연설에 대해 MBC의 보도국 직원이 MBC가 직접 개발해 사용중인 STT(Speech To Text)서비스를 돌려보았으며 “윤 대통령의 공식 연설내용이 토시 하나 안 틀리고 녹취가 풀어져 있었다”고 밝힌 바 있다. 그 녹취록이 풀렸던 내용을 공개한다.

또한 윤 대통령의 ‘비속어 논란’이 있었던 구간인 20분 28초에서 20분 34초까지의 구간에는 STT 인공지능 서비스가 전혀 음성을 인식하지 못하였고, 어떠한 결과도 출력하지 못하였다.

그러나 당시 핸드마이크가 아닌, 카메라에 부착된 ‘현장음 마이크’에 의해 녹음된 박모 카메라 기자의 혼잣말 “저 매트릭스 조명이 어떤 여자의 치마를 다 찢어버릴뻔 했어..”라는 말은 거의 정확하게 인식되어 녹취가 풀려 기록되었고, 잡음이 많은 상태지만 정확도를 73%라고 표현해 주기까지 하였다.

MBC는 MBC노동조합의 이러한 성명이 나가자 “STT 서비스는 2022년 1월 AI 기술을 바탕으로 개발하여 보도본부와 시사교양본부에서 사용되고 있다”고 밝히고 “이 서비스는 콘텐츠 제작의 효율성을 높이기 위한 보조적인 수단일 뿐 주위 소음, 다수 화자 간의 음성 겹침, 화자의 연령, 사투리 사용 등 녹취 상태에 따라 오류를 내재하고 있다”고 반론하였다.

즉 오류 가능성이 커서 “프리뷰 스크립트 작성을 보조하는 용도로 사용된다”는 것이 주된 주장이었다.

그러면서 “소란스러운 환경에서 낮은 음량으로 녹취된 콘텐츠에 대해 STT 기술이 ‘인식없음’이라고 출력할 수 있으나 ‘AI가 음성을 인식하지 못한다고 해서 사람도 인식할 수 없다’고 단언할 수 없다고 주장하였다.

■ 대주주인 방문진 업무보고에서 “월간 1,600여건.. 하루 53건 사용” 자랑

그런데 MBC 노동조합이 취재한 바에 따르면 지난 7월 20일 정영하 MBC 방송인프라본부장이 대주주인 방송문화진흥회 이사들에게 MBC 상반기 업무 진행 상황을 보고한 내용에 따르면 “STT 시스템은 개발을 완료해서 활용을 굉장히 활발하게 하고 있다” “최근 보도본부가 월간 1,600여건, 시사교양이 월간 300여건을 사용한다” “녹취 풀기 초벌 작업은 이 시스템을 쓴다” “외주로 녹취를 맡기면 10분에 5만 원이 드는데 STT는 건당 1,500원에 끝난다” 라고 자랑하였다.

이러한 정영하 기술본부장의 보고내용에 따르면 STT 시스템의 정확도에 대해 보도와 시사교양 직원들의 반응이 매우 호의적이고 신뢰성이 있다는 평가가 있는 것으로 추정된다. 정확성을 생명으로 하는 보도국에서 월간 1600건, 하루 50여건의 사용하고 있다는 것은 초벌 녹취풀기용 이상으로 정확도가 높고 활용성이 있음을 방증하는 것이다. 특히 윤석열 대통령의 공식발표 내용은 99% 정확도로 인식해내지 않았는가?

결국 MBC의 STT 서비스는 완벽하지는 않지만, 초벌 녹취 풀기 기능을 충실히 수행하기 때문에 인터뷰 내용의 위치를 찾거나 녹취록 작성을 돈을 주고 맡기기보다는 STT를 통해 수행하는 것이 이득일 정도로 보도국의 방송업무에 최적화되어 있는 서비스라는 것을 알 수 있다.

더군다나 MBC의 STT 서비스는 인공지능 기반이기 때문에 학습을 통해 녹취 풀기의 정확도를 더 높일 수 있으며 2022년 1월부터 매달 1천여 건에서 2천여 건의 사용함으로써 정확도는 계속 높아졌을 것이다.

이러한 STT 서비스가 윤 대통령의 발언 내용을 ‘인식불가’ 판정하였다.

■ AI가 인식하지 못하는 것을 사람이 정확하게 인식하였다고도 할 수 없다.

MBC는 “STT 서비스가 잡음이 많은 상황에서는 사람의 음성을 정확히 인식할 수 없다”고 설명하는데 실제로 9월 22일 대통령의 발언이 나온 상황은 음악이 매우 크게 흘러나오고 있었고, 대통령은 주변에 함께 걸어가는 사람들만 들을 수 있는 목소리로 말하였다.

그런 음성을 대통령의 바로 앞에 설치된 카메라의 ‘현장음 마이크’가 수음한 것인데, 현장에 있는 카메라 기자는 현장음이 잘 들어가고 있는지 이어폰을 끼고 듣고 있기 때문에 대통령이 말한 “.... 쪽팔려서 어떻게 하나?“ 라는 말을 들을 수 있었다고 하더라도 그 공간에 조금만 떨어져 있던 사람들이라면 대통령의 말을 정확히 알아들을 수 있는 상황이 아니었음은 명확하다.

AI가 인식하지 못한 말을 ‘선입된 정보’에 의해 ‘왜곡 인식이 가능한 인간’이 분명하고 정확하게 인식했다고도 단정할 수 없다.

당시 MBC 순방취재단 기자가 “바이든 대통령을 조롱하는 비속어가 들린다”며 주변 기자들에게 전파하고 ‘자발적인 공동 확인작업’ (원래 기자 사회에서 타사 기자와의 공동취재는 금기시 된다) 을 하였다고 하지만 이러한 ‘선입된 정보’를 주는 것 자체가 인식을 왜곡할 수 있는 것이다.

더욱이 뉴욕에 풀 카메라 취재단으로 참여했던 MBC 카메라 기자 박모 씨는 박성제 사장의 ‘딱 보니 백만’ 발언으로 유명한 2019년 가을 조국 수호 촛불집회 시위군중의 머리 위로 드론을 띄운 카메라 취재 부서(영상취재2부)의 부서장이었다.

다수의 군중 머리 위로 드론을 띄우는 행위는 추락 위험이 있기 때문에 지금도 불법인데, 담당 영상국장이나 영상취재1,2부장 누구도 불법 야간촬영한 사실을 털어놓고 자성한 기억이 없다.

대통령에 대한 ‘부정적인 선입된 인식’이 해당 음성의 자의적인 왜곡인식을 유도했을 가능성도 있는 것이다.

■ 당시 MBC 영상자료시스템에 ‘저속 편집본’ ‘노이즈 제거본’ 나돌아

당시 MBC 영상자료시스템 화면에는 ‘저속 편집본’ ‘노이즈 제거본’ 등 원본을 그대로 편집한 것이 아니라 노이즈를 제거하거나 저속으로 가공한 편집본들이 다수 나돌았다.

보통 노이즈를 제거하기 위해 방송국에서는 이퀼라이저를 통해 사람의 음성에 해당하는 주파수만을 키우고 다른 음역대의 소리를 최대한 낮춰 녹음을 한 뒤 이러한 녹음본을 토대로 다시 사람의 음성을 증폭하고 다른 음역대의 소리를 지우는 방식으로 두세 차례 녹음과 증폭을 반복한다.

이 과정에서 노이즈는 사라질지 몰라도 사람의 음성에 있던 소리들도 함께 제거되어 원래의 음성이 훼손된다.

그렇기에 MBC노동조합은 적어도 대통령 발언의 경우는 조금이라도 불명확하다고 생각된다면 일단 방송을 보류하는 것이 옳고, 대통령 본인의 해명과 당시의 맥락을 충분히 이해하여 원음 그대로 방송하여야 올바른 방송이라 할 수 있다고 설명한 바 있다.

9월 22일 낮 12시 뉴스와 뉴스데스크에 방송된 대통령의 발언 음성이 조금이라도 증폭 과정을 거치거나 노이즈 제거 과정을 거쳤다면 원본과는 다른 훼손된 음성이라 할 수 있다.

이러한 차원에서 당시 뉴욕에서 송출되어온 송출 원본을 MBC 영상자료시스템에서 재생하여 녹음한 음성을 들려드리고자 한다.

자막 없이 듣는다면 ‘쪽팔려서 어떡하나?”라는 말은 들리지만 다른 말은 알아듣기 어렵다.

이것이 진실이다.

2022.11.21.
MBC노동조합 (제3노조)

Fn투데이는 여러분의 후원금을 귀하게 쓰겠습니다.

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • 제호 : 파이낸스투데이
  • 서울시 서초구 서초동 사임당로 39
  • 등록번호 : 서울 아 00570 법인명 : (주)메이벅스 사업자등록번호 : 214-88-86677
  • 등록일 : 2008-05-01
  • 발행일 : 2008-05-01
  • 발행(편집)인 : 인세영
  • 청소년보호책임자 : 장인수
  • 본사긴급 연락처 : 02-583-8333 / 010-3797-3464
  • 법률고문: 유병두 변호사 (前 수원지검 안양지청장, 서울중앙지검 , 서울동부지검 부장검사)
    최기식 변호사 (前 서울고등검찰청 부장검사, 대구지방검찰청 제1차장검사, 수원지방검찰청 성남지청 차장검사)
  • 파이낸스투데이 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2023 파이낸스투데이. All rights reserved. mail to news1@fntoday.co.kr
ND소프트 인신위