번역의 품질과 기계번역

//번역의 품질과 기계번역

번역의 품질과 기계번역

기계 번역이란 무엇입니까?

 기계 번역 (MT-Machine Translation)은 소프트웨어를 사용하여 한 언어에서 다른 언어로 텍스트 또는 음성을 번역하는 것을 말합니다. 사람의 개입 없이 컴퓨터 알고리즘에 기반을 둔 텍스트 번역을 제공합니다. 기계 번역은 번역 엔진을 사용하여 한 언어의 단어를 다른 언어의 단어로 간단하게 대체할 수는 있지만 일반적으로 최고 품질의 번역을 제공하지는 않습니다. 보다 정확한 번역을 위해서는 전체 문장의 맥락에 맞는 단어를 대상 언어로 인식해야 합니다.

적은 예산으로 실시간 번역을 원한다면 기계 번역(MT)는 좋은 선택이 될 수 있습니다. 하지만 완벽한 품질을 보장받을 수는 없습니다. 기계번역을 사용하여 트윗, 블로그 게시물, 블로그 댓글, 포럼 또는 게시판과 같이 중요도가 낮은 콘텐츠를 번역하는 데에 많이 활용되고 있습니다.

기계 번역은 다음과 같이 일반적으로 두 가지 유형의 기계 번역이 있습니다.

● 통계 기계 번역 (SMT) 컴퓨터가 언어쌍 말뭉치(Corpus)를 학습하여 통계학적으로 번역하는 기술
번역 엔진에 단어가 가진 여러 의미를 저장해 놓으면 사용자가 입력한 문장을 단어 단위로 쪼갠 후 확률적으로 가장 유사한 의미의 단어를 찾아 번역하는 방식으로 특히 인터넷 시대에 접어들어 수많은 번역 데이터를 수집할 수 있게 됨에 따라 통계 기반 기계 번역의 품질은 크게 향상되었습니다.

● 규칙 기반 기계 번역 (RBMT)  언어의 구조와 문법을 바탕으로 규칙을 만들어 번역하는 방법
사용자가 번역 엔진에 문장을 입력하면 이를 단어나 구 단위로 쪼갠 후 설정해 놓은 규칙에 따라 단어를 조합해 번역합니다. 문법에 맞지 않는 문장은 제대로 번역되지 않고, 각 언어마다 언어 학자들이 규칙을 설정해 주어야 하기 때문에 개발 비용이 많이 듭니다.

번역을 위한 선택

 기계 번역을 잘못 사용하면 문법적으로 부정확하거나 잘못된 번역으로 인해 잘못된 이해를 가져올 수 있기 때문에 비즈니스에 해를 끼칠 수 있습니다.

● 기계 번역
단순히 의미를 파악할 수 있는 정도 수준의 번역에 활용하며 일반적으로 해외 웹사이트 번역, 뉴스 · 블로그 · SNS 콘텐츠 등의 웹 콘텐츠를 번역하는데 활용할 수 있습니다. 특히 기계번역의 가장 큰 강점은 실시간으로 번역 내용을 확인할 수 있다는 점입니다.

● 일반 번역
일반 번역가를 통한 번역은 구어체 및 주제가 정확하고 저렴한 비용과 합리적인 속도를 제공합니다. 일반 번역은 비용이 적지만 전문 번역가가 제공하는 수준과 기존 번역 결과물에 대한 일관성을 제공하지 못할 수 있습니다. 비즈니스 메일, 영상물 자막, 다국어 웹 페이지 제작 등에 일반 번역을 활용할 수 있습니다.

● 전문 번역
전문 번역은 최고 품질을 제공하며 정확성을 보장하기 위해 추가 검토(원어민 리뷰, 법률 자문 등) 수준을 포함합니다. 해외 보도 자료 제작, 브로슈어 및 백서, 비즈니스 계약 문서, 제품 소개서 및 매뉴얼과 같은 매우 중요한 콘텐츠에 전문 번역을 사용해야 합니다. 또한 전문 번역회사를 통해 번역 메모리 (TM)를 관리하여 비즈니스 콘텐츠에 대한 번역문의 일관성을 유지하는 것도 중요합니다.

기계 번역의 미래

 수백만 명의 사람들이 매일 Google 번역을 사용하는 기계 번역은 이미 우리 일상생활의 일부가 되었습니다.
구글은 인공지능을 이용하는 ‘구글 신경망 기계번역(GNMT·Google Neural Machine Translation)’ 시스템을 한국어를 포함해 수십여 개 언어의 번역 서비스에 적용하고 있습니다. 기존의 번역 시스템이 단어·문장 단위로 번역을 수행하는 것과 달리, GNMT는 번역할 전체 문장의 문맥을 파악해 자연스러운 번역을 수행합니다.  NMT는 여러 문장 간 전체 맥락을 파악해 문장들을 한꺼번에 통째로 번역하며 SMT 방식보다 의미 전달이 더 정확하고 어순과 문법도 더 자연스럽다는 평가를 받습니다. NMT 방식은 AI가 스스로 계속 학습하기 때문에 번역 이용자가 늘고 데이터가 많아지면 번역 품질이 더 좋아진다고 할 수 있습니다.

 이러한 번역 기술은 인공지능 구현의 핵심 기술인 머신 러닝(기계 학습)과 딥러닝(인공 신경망)을 활용해 특정 언어를 번역할 수 있는 모델(인공지능)을 만든 후 해당 모델을 활용한 번역 서비스를 제공하는 기술입니다. 수많은 인공 신경망으로 구성되어 있는 인공지능이 개발자에게 감독 학습(교육)을 받은 후 비감독 학습(자습)을 수행해 번역 성능을 향상시키는 겁니다. 바둑 인공지능 알파고가 수많은 자체 대국으로 기력을 향상시킨 것과 동일한 원리로 볼 수 있습니다.

물론

기계 번역 기술이 좋아지고 그에 따라 번역의 결과물 역시 원문과 가깝게 자연스러워지는 것은 부정할 수 없는 현실입니다. 또한 번역 결과물의 데이터 학습에 따른 발전 속도 역시 무시할 수는 없습니다. 하지만 언어에 따른 문화의 이해와 전문 분야에 대한 지식 등은 번역 결과물에 많은 차이가 있으며 앞으로도 기계 번역과 사람 번역에 대해서는 별도의 영역이 있을 것으로 보입니다.

글 작성: 마케팅팀 Jeff

2018-03-27T13:36:22+00:00