번역회사의 사람번역과 기계번역

핫도그 세 개 주세요!
Please, Hot dog World~

꽃보다 청춘꽃보다 청춘

‘꽃보다 청춘 中’ – tvN

얼마전 방영한 ‘꽃보다 청춘 : 아이슬란드 편’ 에서 재미있는 에피소드가 있었다.
영어 대화에 어려움을 느낀 배우 조정석이 번역기 어플을 사용했고 “핫도그 하나 주세요”를 음성 입력하자 즉석에서 번역돼 음성으로 흘러나와 모두를 기쁘게 했다.
이후 핫도그를 주문하러 간 조정석은 “핫도그 세 개 주세요”를 입력했지만 번역기는 ‘세 개’를 ‘세계’로 잘못 알아듣고 ‘핫도그 월드’로 번역해 보는 이들의 웃음을 자아냈다.

좋은 번역 서비스

요즘엔 많은 사용자들이 WEB 서비스를 통해 손쉽게 해외의 다양한 정보들을 얻을 수 있다. 당연한 소리지만 해외의 콘텐츠는 해당 국가 언어로 작성되어 있다. 좋은 번역 서비스는 언어가 달라서 생기는 제한을 해결한다. 좋은 번역 서비스가 있다면 사용자의 경험도 폭넓게 증대된다. 영어로 된 좋은 자료를 큰 힘 들이지 않고 읽을 수 있고, 중국의 쇼핑몰 사이트에서도 쉽게 물건을 구매할 수 있다.
이처럼 좋은 번역 서비스는 언어의 장벽을 허물고 사용자들에게 쉽고 편리한 서비스를 제공해 준다.

이런 번역 서비스는 상당부분 해당 국가의 전문 번역가들을 통해 서비스 되지만 다른 한편으론 기계번역을 이용하기도 한다.
컴퓨터가 수행하는 번역 작업을 ‘기계번역’이라고 하며 기계번역은 컴퓨터가 입력된 하나의 언어를 다른 언어로 바꿔서 출력한다는 걸 뜻한다.

최근 번역 업계에서는 비용 절감과 생산성 향상을 위해 MT(machine translation: 기계 번역)를 도입하여 활용하고 있다. 뿐만 아니라 Microsoft와 같은 거대 IT 기업에서는 이미 자사의 콘텐츠 일부를 기계 번역하여 제공하고 있다. (아래 그림 참조)

기계번역
기계번역 딥러닝 ?

사실 기계를 이용하여 번역하려는 시도는 오래 전부터 있어 왔지만 아직 사람을 대체할 만한 수준에 이르지는 못했다. 그러나 최근 알파고의 등장은 인공지능의 가능성에 대한 기대감을 증폭시켰다. 번역도 마찬가지로 딥러닝을 통해 사람은 번역(학습) 데이터를 수집하고 가공해서 컴퓨터에 던져주고, 컴퓨터는 입력된 번역(학습) 데이터를 바탕으로 스스로 공부한다. 학습이 끝나면 번역기가 스스로 공부한 바를 바탕으로 새로운 문장을 보더라도 번역할 수 있는 능력을 키울 수 있다.

그러면 기계가 과연 인간의 번역을 대체할 날이 올 수 있을까?
기계번역에 대해 좀더 자세하게 알아보도록 하자!

1. 기계번역의 유형: 규칙 기반(rule-based) vs 통계 기반

기계번역에 대한 전통적인 접근 방식은 ‘규칙 기반’이었지만 최근에는 ‘통계 기반’ 기계번역에 대한 연구가 활발하게 이루어지고 있다. ‘규칙 기반’은 언어의 일정한 규칙을 정한 다음 이를 적용하여 기계가 번역하도록 하는 방식이고, ‘통계 기반’은 기계가 ‘Corpus(말뭉치)’를 가지고 문법 규칙을 통계적으로 분석 및 자가 학습하여 번역하도록 하는 방식이다.

같은 영어 문장을 ‘규칙 기반’ 기계번역기를 가지고 돌린 것과 ‘통계 기반’ 기계번역기를 가지고 돌린 것을 비교해 보았다.
어떤 기계번역이 더 나은지는 개인의 판단으로 ^^


  • [ 영어 원문 ]
    Machine translation (MT) is a form of translation where a computer program analyses the text in one language – the “source text” – and then attempts to produce another, equivalent text in another language – the target text – without human intervention.
  • A. 규칙 기반 기계번역
    표적 원본 – 기계 번역 (MT)은 인간 내정간섭없이 – 곳에 컴퓨터 프로그램이 1개의 언어안에 원본 – “근원 원본” -을 분석하고 그때 또 다른 한개를 생성한것을 시도하는 번역, 다른 언어안에 동등한 원본의 모양 이다.
  • B. 통계 기반 기계번역
    ‘통계 기반’ 기계번역: “소스 텍스트”- – 기계 번역 (MT)는 컴퓨터 프로그램이 하나의 언어의 텍스트를 분석 번역의 한 형태이다 다음 다른, 다른 언어에 해당하는 텍스트 생성을 시도 – 대상 텍스트 – 사람의 개입없이 합니다.
  • C. 사람의 번역
    기계 번역(MT)이란 컴퓨터 프로그램이 인간의 개입 없이 하나의 언어(원본 언어)로 쓰여진 텍스트를 분석한 다음, 그와 동등한 의미를 갖는 다른 언어(대상 언어)로 쓰여진 텍스트를 만들어 내려고 시도하는 형태의 번역을 가리킨다.

2. 기계번역은 사람의 번역을 대체할 수 있을까?

글로벌 로컬
많은 사람들이 바둑에서 알파고가 보여 준 높은 수준의 인공지능에 근거하여 언젠가 번역도 기계가 인간을 대체하는 날이 올지도 모른다고 생각할 수도 있겠다. 하지만 언어란 바둑과는 달리 어느 한 가지 규칙으로 정의하기가 사실상 불가능한 데다가 문화적 차이,시대적 차이, 각 사람의 언어 사용의 차이, 분야별 언어 사용의 차이 등 그 특성과 변수가 매우 다양하고 복잡하다. 또한 기계는 인간만이 이해할 수 있고 심지어 인간마저도 서로 이해의 수준이 다른 언어의 감성적, 정서적, 추상적 특징을 전혀 이해하지 못하기 때문에 기계가 아무리 발전한다 해도 인간이 하는 수준의 번역을 하기란 불가능하다.

3. 기계번역에 대처하는 우리의 자세

비록 기계번역이 인간의 번역을 대체하지는 못하겠지만 기술의 발달과 수많은 연구를 통해 기계번역의 품질이 어느 정도 개선되고 있는 것은 사실이다. 이 경우 기존에 인간이 해야 했던 많은 양의 문서를 기계가 대신 번역해 줌으로써 비용과 시간을 절감할 수 있다. 그래서 현재 번역업계에서는 그러한 수준의 기계번역기를 만들기 위한 연구와 노력이 활발히 이루어지고 있다. 아직까지는 기계가 인간의 번역을 대체하기보다는 인간이 시간과 비용 절감 차원에서 기계번역을 활용하는 셈이죠. 텍스트리 역시 이러한 흐름에 맞춰 번역의 품질을 유지하면서 시간과 비용을 절감하기 위한 차원에서 기계번역을 어떻게 활용할 수 있을지 고민중이다. 이처럼 기계는 어디까지나 도구일 뿐, 사람이 이해하고 공감할 수 있는 수준의 번역은 결국 사람이 해야 한다는 기본 명제는 앞으로도 상당 기간 유지되리라 믿는다.^^

2017-02-01T13:44:36+00:00