DeepFuture

죽다 살아난 멤링고(Memlingo) 프로젝트

42-the-answer 2023. 11. 22. 14:12

죽다 살아난 멤링고(Memlingo) 프로젝트

우리 희망회로를 끝까지 돌려 봅시다. 세계적인 인기를 몰고 다니는 우리의 자랑스러운 BTS와 블랙핑크, 뉴진스가 신곡가사를 에스페란토로 써서 발표하는 게 아니겠어요. 난리가 났습니다. 전세계 수천만 팬들이 에스페란토가 뭐야? 하면서 검색하고 쉽게 배울 수 있다기에, 그중 상당수는 실제로 배우기로 작정했습니다.

그런데 웬걸, 막상 수백만이 배우려고 하는데, 학습자료는 구시대 냄새가 나는 구린 것들만 있고, 오프라인 강습도 수백만이 하기엔 어림도 없지요. 오프라인 강습은 만명만 몰려들어도 대략난감이지요.

당연히 온라인 자율학습 앱이 필요합니다. 천만다행으로 그런 앱이 있습니다. 외국어 학습분야 세계 일등 앱 '듀오링고(Duolingo)'입니다. 다만 영어를 먼저 알아야 하는 게 함정이죠.

2019년 즈음에, '멤라이즈(Memrise)' 앱을 이용하자는 생각이 들었습니다. 멤라이즈는 듀오링고 만큼 우수하지는 않지만, 일반 사용자가 직접 학습 콘텐트를 코스로 만들어 업로드 할 수 있기에, 앱개발 없이 콘텐트 개발만 하면 되겠다 싶었습니다.

콘텐트 구성은 3~5단어 어구 중심으로 에스페란토/아시아언어 쌍을 기초부터 순서대로 2천개 정도 배치하자는 계획이었습니다. 대략 5백개 정도 한국어/일본어 대상으로 만들어 멤라이즈에 올려놓고 한국과 일본의 몇몇 에스페란티스토들에게 풀어놓고 시험해 봤습니다. 완전 실패였습니다. 문제는 멤라이즈 앱이 최초 사용자에게 너무 불친절해서 애써서 만들어둔 에스페란토 학습 콘텐트까지 안내하는 것조차 너무 어려웠습니다.

결국 사용이 편리한 앱을 직접 만들 수 밖에 없었습니다. 좀 밉더라도 똥손 디자인으로 일단 앱을 만들고, 대략 1/4 정도 콘텐트를 한국어/일본어에 대해 제작해 2020년 가을 한국대회를 기점으로 멤링고(Memlingo)라는 이름으로 베타버전을 발표했습니다.

그후로 콘텐트도 추가로 보강하고, 디자인도 외주에 맡겨서 한세트 마련하였습니다. 깔끔하게 옷을 갈아 입히기만 하면 정식으로 발표할 수 있겠다 싶었습니다.

그런데 그날(2021.04)이 왔습니다.

퇴근길에 헛디뎌 아파트 철문에 부딛쳐 고개가 뒤로 젖혀져 전신 마비되어 병원에 실려갔습니다. 십년쯤 전에 목디스크 수술했던 게 도져서, 그 즈음에 넘어지는 게 잦았더랬습니다.

마비와 코로나로 외부와 단절된 채 수개월 살다가, 어느정도 안정된 후(2022), 음성으로 조정하고 안되면 손가락으로라도 터치는 할 수 있겠다 싶어서, 휴대폰을 구했습니다. 그러나 환자 네명, 간병인 네명 도합 여덟명이 좁은 병실에 커튼을 치고 난민촌처럼 살기에, 음성 조종으로 뭔가 작업을 하는 것은 가능하지 않았습니다.

막상 휴대폰을 열어보니, 신용카드 만기가 되어 구글메일은 정지되어 있고, 멤링고 서버는 삭제된지 오래였습니다. 수차례 독촉메일조차도 못보고 지나친 것이죠. 홀라당 날아갔습니다. 서버가 아닌 구글드라이버에 저장된 초기 설계문서 몇개와 발표자료만 살아 남아 있었습니다.

올해(2023.04)초 집가까운 요양병원으로 옮겨오자, 재활운동 시간이 줄어 여유시간도 생기고, 무엇보다도 3인실로 공간도 좀 넓고 좀 시끄러워도 서로 신경쓰지 않는 분위기라, 뭔가 일을 도모해볼 수 있게 되었습니다.

때마침 페이스북에서 마소리스(김가람)님이 건강상의 이유로 칩거생활을 한다기에 당장 연락했습니다. 휴대폰 화면을 통해 마소리스의 컴퓨터 화면을 보면서, 말로 설명해주면 마소리스가 타이핑하면서 개발하는 식으로 멤링고를 처음부터 새로 만들어 보자고 하니, 마소리스가 의외로 선뜻 승락했습니다.

마소리스 역시 칩거중에 컴퓨터 관련 공부를 해오던 터라, 예상보다 진도는 훨씬 빠르게 나갔습니다. 1년6개월 가량 걸릴 것이라 추산했는데, 채 4개월이 안되어 목표범위까지 개발되었습니다. 외주로 줘서 개발해 놓았던 디자인이 살아 있어서 그럴싸하게 옷도 입혔습니다.

문제는 에스페란토 음성이었습니다. 명색이 언어 학습기인데, 정확한 발음으로 읽어주지 못하면 안되겠지요. 구글 음성생성기(TTS)가 에스페란토를 지원하지 않기 때문에, 폴란드어 음성생성기에 폴란드어에서 통하는 문자로 에스페란토 문장을 전사(transcribe)해 주는 방식으로 음성생성기를 만들었습니다. 오류가 많고 특히 에스페란토식 액센트가 잘 표현되지 않아, 수천개 항목에 대해 일일이 재차 삼차 들어보고 발음을 교정하는 것에 가장 많은 시간이 걸렸습니다. 아직도 1% 정도 발음오류가 남아 있는데, 폴란드어 음성생성기를 해킹하는 방식으로는 더이상 해결하기 어려워 보입니다.

예상보다 훨씬 일찍, 올해(2023) 한국대회 즈음에, 한국어/영어/일본어/중국어/베트남어 사용자를 대상으로 멤링고 앱을 정식으로 오픈했습니다.

언어 학습기에서 최적의 간격으로 반복해서 암기효과를 극대화시켜주는 방식(SRS)이 있습니다. 멤링고는 학습자 개개인의 진도를 기억하기 때문에, 학습자는 수련하듯 매일매일 5분 10분 정도 짧게 짬이나는 대로 이용하는 것이 좋습니다.

멤링고 앱에는 기본 세개의 코스가 있습니다. A코스는 초급 학습자를 위한 Zagreba Kurso에 나오는 1300여 표현들을 학습하는 것이고, B코스는 중급학습자를 위한 Jen nia IJK! 텍스트에 나오는 1100여 표현들을 학습하는 것입니다. C코스는 어휘력을 증진시키고자 하는 학습자를 위한 것으로 각종 소스에서 채집한 6000개의 어휘를 난이도별로 정렬한 코스입니다. 앞부분이 너무 쉽다싶으면 50%는 스킵하고 중간부터 학습할 수도 있습니다.

현재는 A, B, C코스 외에, 오프라인 강습을 하시는 분들의 교재를 이용해 별도 코스를 만들고 있습니다. 이중기 선생님의 "인터넷 시대의 에스페란토 입문" 교재에 나오는 문장들을 이용해, 한국어판에 별도 코스를 추가하여, 문화원 강좌에서 활용할 수 있게 하였습니다. 중국 자오좡 대학에서 에스페란토 강의하시는 박기완 선생님의 강습교재도 데이터를 일차로 정리하였으며, 교정후 에스페란토 음성으로 녹음하면 중국어판에 반영될 것입니다. 일본 야스오 다부치(Yasuo Tabuchi) 선생이 쓴 교재 "Hej, Amikoj!"도 데이터 교정이 끝나고 일본어판에 올라갈 것입니다.

여기까지 온 것만 해도 놀랍습니다. 마소리스 님도 나도 심신이 원활하지 않은 두사람이 예상시간보다 훨씬 앞당겨 출시하게 되어 매우 기쁩니다. 이자리를 빌어, 길고 지루한 데이터 작업도 한마디 불평없이 꼼꼼히 해준 마소리스 님에게 감사인사를 드립니다. 손재간도 좋아서, 요령있는 개발자와 짝프로그래밍 하는 느낌으로 좋았습니다.

사실 애초의 멤링고 부활 프로제트 목표는 이미 달성되었고, 자동번역을 이용해 십수개 이상의 언어로 확대하는 일만 남았습니다. 아시아 언어로는, 몽골어, 태국어, 말레이/인도네시아어, 타갈로그어(필리핀), 힌디어, 벵골어, 우르두어, 펀자브어, 마라티어, 텔루구어, 타밀어, 네팔어, 파르시어(이란), 아랍어, 히브리어 등이 후보이고, 유럽어인 불어, 독일어, 스페인어, 포르투갈어, 폴란드어, 러시아어, 우크라이나어, 아프리카 언어로는 스와힐리어 등이 포함될 수 있습니다.

ChatGPT가 나온 이 시점에 여기서 멈춰서는 않되겠지요. ChatGPT 인공지능을 활용하여 말하는 것에 촛점을 맞춘 학습코스를 추가로 만들 예정입니다.


주)

멤링고 앱 주소: http://memlingo.esperanto.or.kr/

Memlingo - Learn Esperanto by Examples

memlingo.esperanto.or.kr


멤링고 접속 QR코드: