일본 IBM 야마토 연구소

728x90

일본 IBM 야마토 연구소는 지난 1982년 설립되어, 올해로 창립 26주년을 맞은 IBM 소속의 연구소이다. 이 야마토 연구소는 도쿄 남서쪽에 위치한 카나가와(神奈川) 현의 야마토(大和)시에 위치하고 있다. 때문에 정식 명칭은 ‘도쿄기초연구소’ 이지만, 통상 명칭은 ‘야마토 연구소’ 가 되었다.

이 연구소는 흔히 대외적으로 ‘야마토 연구소’ 라고 불리지만, 이 야마토 연구소 안에는 도쿄 기초 연구소(東京基礎硏究所)와 야마토 시스템 개발 연구소, 소프트웨어 개발 연구소 등 다양한 연구소가 존재하고 있다. 모두 각각 개별적인 프로젝트와 연구 과제 등을 수행하며 인류공영에 이바지할 기술들을 개발하고 있다.

지난 6월 20일, IBM의 핵심 연구소 중 하나라고 할 수 있는 야마토 연구소를 찾았다. 흐린 날씨 가운데 2시간 이상 걸려 연구소에 도착한 필자를, 일본 IBM의 홍보 담당자인 나미오카 나오코(波岡ジューン直子)씨와, 야마토 연구소의 홍보를 담당하는 나가부치 타카후미(長渕貴史)씨, 그리고 전략 담당자인 후지타 유우코(藤田裕子)씨가 맞아 주었다.

▲ 야마토 연구소 전략 담당 후지타 유우코씨

야마토 연구소가 연구하는 분야는 무척 다양하기 때문에 모든 분야를 한꺼번에 취재하기란 사실상 불가능했다. 따라서 이번 취재는 야마토 연구소의 소개와 텍스트 마이닝(Text Mining), 마지막으로 센서&액추에이터 솔루션 순으로 이루어졌다. 뒤에 언급한 두 가지 소재는 웹 서비스와 자동차 산업, 유비쿼터스 시티 등 한국에서도 중시되는 사안들과 관련이 깊은 내용들이다.

야마토 연구소의 개요

현재 IBM이 가지고 있는 기초 연구소는 총 8개이며, 그 중 하나가 바로 야마토 연구소이다. 이 야마토 연구소는 소프트웨어와 하드웨어를 모두 다룬다는 점에서, IBM이 보유한 연구 개발 시설 중에서도 상당히 특이한 곳이다. 이 야마토 연구소는 크게 나누어 네 가지 조직을 가지고 있다.

1) 도쿄 기초 연구소
2) 야마토 시스템 개발 연구소
3) 마이크로 일렉트로닉스 사업부
4) 소프트웨어 개발 연구소

본래 야마토 연구소는 제조와 개발을 연구하는 곳으로 1985년에 설립되었다. 도쿄기초연구소의 전신인 도쿄 과학 연구소(Tokyo Scientific Lab.)는 지난 1970년에 설립되었다. 이 도쿄 과학 연구소가 도쿄 기초 연구소라는 명칭을 얻은 것이 1986년이며, 이 도쿄 기초 연구소는 올해로 창립 26주년을 맞았다.

이 도쿄 기초 연구소는 하드웨어와 소프트웨어를 연구 개발하는 그룹으로 나뉘어 있으며, 브랜드는 일본 IBM의 브랜드를 사용하고 있다. 따라서 일본 IBM 뿐만 아니라 IBM의 글로벌 브랜드와도 제휴하여 업무를 진행하고 있다.

또한 야마토 시스템 개발 연구소는 고객에게 하드웨어 관련 솔루션을 제공하며, 소프트웨어 개발 연구소에서는 IBM에서 제공하는 각종 소프트웨어 제품들에 대한 개발을 진행하고 있다. 이외에도 기술 지원과 각종 제조를 담당하는 조직들이 있다.

지금은 레노버(Lenovo)로 생산권이 넘어간 노트북 제품인 싱크패드(ThinkPad)도 이 야마토 연구소에서 태어난 역작이다. 그러나 IBM의 전략 변화에 따라, 2005년 이래 현재 싱크패드는 레노버의 제품이 되었다. 하지만 관할 회사가 바뀌었을 뿐, 연구 조직은 여전히 야마토 연구소의 부지 안에 존재한다고 한다.

또한 일본 IBM의 관점에서는 이 야마토 연구소가 제품의 제조와 개발을 담당하는 핵심적인 연구소로서, 단지 제품을 개발만 하는 것이 아니라 고객에게 종합적인 솔루션을 제공한다는 데에 큰 의의가 있다. 또한 기초 연구와 소프트웨어/하드웨어 연구 개발 이외에도, IBM이 개발한 다른 제품들을 포함한 다양한 제품을 중심으로 한 연구 서비스를 고객에게 제공하는 것이 특징이다.

이 과정에서 핵심이 되는 것이 바로 야마토 연구소 안에 존재하는 비즈니스 추진 부서인데, 이 부서는 고객이 어떤 제품을 원하는지를 전달하고, 고객에게는 야마토 연구소가 가진 기술을 제공하는 일종의 가교 역할을 담당하고 있다. 그럼 이제부터 연구소 각 부서별로 수행하는 업무 등에 대해 간략히 살펴보도록 하겠다.

1. 도쿄 기초 연구소

도쿄 기초 연구소는 이름에서 알 수 있듯이 기초적인 연구를 수행하는 조직이다. 하지만 단순히 연구를 하는데에 그치지 않고, 현재는 고객에게 어떤 비즈니스를 제공할 수 있을 것인가를 고려할 것인가를 고려하는 방향으로 이행하고 있다. 즉, 사회나 고객에게 도움이 될 수 있는 연구를 통해 고객과 파트너 관계를 맺고, 이를 통해 비즈니스 가치를 만들어 낸다는 전략을 추진하고 있는 것이다.

일례로 올해 6월에는, 교토 대학과 공동으로 도시의 교통 상황을 시뮬레이션 하는 교통 멀티 에이전트 시스템을 개발한 바 있다. 이 시스템은 100만개의 에이전트를 이용해 도시의 복잡한 교통 상황을 시뮬레이션하는데, 교토 대학은 운전사의 역할을 수행하는 에이전트에 대한 연구를 수행하고, 도쿄 기초 연구소는 이러한 시뮬레이션의 토대가 되는 프레임워크(Framework)를 제공했다.

도쿄 기초 연구소의 강점 중 하나인 시뮬레이션을 이 프로젝트에 제공한 것이다. 또한 집적도가 높고 소비 전력이 낮은 반도체를 만드는데 사용되는 광 상호 접속(Fiber Interconnect) 기술에 대해 연구중이다. 뿐만 아니라 지난 2007년에는 미국의 미디어텍(MediaTek)사와 함께 밀리파를 이용해 많은 용량의 데이터 파일을 무선으로 전송하는 기술을 선보이기도 했다.

여러 성과 가운데에서도 도쿄 기초 연구소의 강점이자 자랑인 바는 독특한 부문에서 나왔다. 연구소 관계자들이 가장 손꼽는 핵심적인 조직은 인더스트리 솔루션(Industry Solution) 이다. 일본에는 세계 유수의 전자 회사와 자동차 회사가 존재하며, 이들 고객에게 어떤 솔루션을 제공할 것인지에 대해 연구하는 조직이 바로 인더스트리 솔루션이다.

이를 위해 모델링 기반의 시스템 엔지니어링(Model-Driven System Engineering)에 대한 연구를 진행하고 있다. 현재 자동차에는 많은 양의 ECU(전자 제어 장치)가 쓰이고 있는데, 이 ECU를 어떻게 모델링해서 높은 성능의 제품을 믈 것인가에 대한 연구이다. 이 모델링 기반의 시스템 엔지니어링은 IBM이 제공하고 있는 오픈 소스 기반의 개발툴인 이클립스(Eclipse)를 이용한다.

또한 각종 장애를 겪는 사용자들을 위한 액세서빌리티(Accessibility)에 관한 연구도 진행되고 있다. 한국에서도 사회공헌 차원에서 연구되는 글자를 음성으로 읽어주는 TTS(Text-To-Speech)에 대한 연구는 1990년대 초반부터 진행되었고, 실제로 IBM의 OS/2에도 이러한 소프트웨어들이 기본적으로 제공된 바 있다.

바로 이러한 연구 분야가 연장된 것이 액세서빌리티에 대한 연구이다. 지난 2007년 3월에는, 글자 뿐만이 아니라 각종 멀티미디어 데이터도 음성으로 읽어주는 기술을 선보이기도 했다.

2. 야마토 시스템 개발 연구소

야마토 시스템 개발 연구소(System Development Lab.)는 하드웨어의 개발과 기술 지원을 담당하고 있다. 현재 야마토 시스템 개발 연구소가 중점을 두고 있는 분야는 바로 테이프를 이용한 저장장치이다. 이 연구소에서 개발한 LTO(Linear Tape-Open) 방식의 드라이브는 지난 2007년 11월에 10주년을 맞아, 올해 5월에는 100만대 이상을 출하하는 성과를 올렸다.

이외에도 하드웨어를 개발 중인 해외의 다른 연구소와 협동으로, 서버와 저장장치, 슈퍼컴퓨터를 이용한 딥(Deep) 컴퓨팅도 함께 연구하고 있다. 뿐만 아니라 블레이드(Blade) 서버 하드웨어나 기타 하드웨어의 펌웨어 개발도 진행중인데, 이는 다른 하드웨어 개발 조직과 연계해서 진행중이다.

3. 마이크로 일렉트로닉스 사업부

마이크로 일렉트로닉스 사업부의 가장 대표적인 제품은 알려진 것은 바로, 소니와 도시바 등 3사가 합동으로 만들어낸 '셀 브로드밴드 엔진(Cell Broadband Engine)'이다. PS3에 탑재되어 있는 바로 그 칩이다.

이 칩의 개발은 텍사스의 오스틴(Austin)에서 이루어지고 있지만, 이 칩을 고객들에게 어떻게 제공해야 하는가에 대한 연구소는 이 사업부에서 진행중이다. 소니, 닌텐도 등의 게임 콘솔 이외에도, 가전기기에 사용되는 반도체 역시 각 고객들과 파트너 관계를 맺어 개발을 진행중이다.

흔히들 이 셀 브로드밴드 엔진이 게임기에만 쓰이는 것으로 알고 있는 사람들이 많은데, 사실 이 칩은 여러 복잡한 연산을 수행하는데에도 위력을 발휘한다고 한다. 일례로 미국의 메이요 병원(Mayo Clinic)과 IBM이 설립한 의료 영상 처리 연구센터에서는 셀 칩을 이용해 고해상도의 3D 영상을 보다 빨리 처리할 수 있는 방법을 연구중이다. 이를 통해 영상 처리 속도가 최대 50배까지 높아졌다고 한다.

4. 야마토 소프트웨어 개발 연구소

야마토 소프트웨어 개발 연구소(Yamato Software Lab.)는 야마토 연구소의 양대 핵심 중 하나인 소프트웨어를 담당하는 연구소이다. 이 곳에서는 IBM의 각종 소프트웨어, 특히 Information Management(데이터 베이스 등)에 관련된 제품의 개발과 기술 지원, 솔루션 제공에 초점을 두고 있다.

그 중 하나가 올해 5월부터 활동을 시작한 인포메이션 온 디맨드 센터 오브 엑셀런스(Information on Demand Center of Excellence)이다. 이 곳에서는 데이터베이스, 문서 파일 등 많은 양의 정보 중, 사용자가 원하는 가치있는 정보를 분석/추출하는 솔루션을 제공한다. 야마토 연구소 내에도 이 센터가 존재한다.

이외에도 RFID 솔루션, 연구소의 엔지니어가 직접 서비스를 제공하는 소프트웨어 브랜드 서비스 등의 사업을 추진중이다.

5. 시스템 테크니컬 서비스 센터

시스템 테크니컬 서비스 센터(System Technical Service Center)에서는 소프트웨어 제품에 대한 기술 지원 서비스를 제공하고 있다. 소프트웨어 제품을 구입했을 때 얻을 수 있는 이득에 대한 안내는 물론, 유지보수도 함께 제공한다.

이 센터에 소속된 조직 중 하나인 고가용성 센터(High Availability Technical Center)에서는, 대규모 금융권 시스템의 안정화나 소프트웨어/하드웨어의 기술시연, 품질 관리등을 수행한다. 또한 각종 소프트웨어의 업그레이드시 이를 검수하는 작업도 수행한다.

통합 시스템 공학 연구소(Integrated System Engineering Lab.)에서는 신제품에 적용된 기술들이 다양한 플랫폼에서 작동하는지 확인하고 검수하는 업무를 수행한다.

6. 제조

이외에 제조를 담당하는 조직이 있는데, 현재 일본에 대규모의 제조를 담당하는 조직은 없다고 한다. 하지만 일본 내의 고객들을 위해 제품을 출하해야 하거나, 필요에 따라 여러 자재들을 조합해야 할때 필요한 서비스 센터의 기능을 담당한다.

아울러 매뉴얼 등의 번역도 이 곳에서 담당하고 있으며, 과거에는 일본어 뿐만 아니라 중국어, 한국어 지원도 담당했다고 한다. 하지만 현재는 일본어만을 대상으로 각종 번역이 수행되고 있다.

7. 기타 연구 분야

현재 IBM 전사적으로 수행하는 프로젝트인 프로젝트 빅 그린(Project Big Green)의 데이터 센터 2.0에도, SDL의 하드웨어 관련이 참가하고 있다. 이는 소비 전력이 적고 효율적인 전력 관리가 가능한 데이터 센터를 만들기 위한 연구의 일환이다.

야마토 연구소에 있는 기술 개발 센터(Technical Development Center)에서 열 시뮬레이션이나 전지판 시뮬레이션에 대한 연구를 진행중인데, 이 기술 개발 센터와 공동으로 데이터 센터의 상황은 어떻고, 열 흐름은 어떤지, 또한 온도는 어떤지 확인해서 이상적인 데이터 센터의 배치 상황등을 종합적인 솔루션으로 제공하는 프로젝트이다.

대표적인 결과물로는 산요와 함께 개발한 리어 도어 시스템이 있으며, 고객 서비스를 제공하는 글로벌 테크놀로지 서비스(Global Technology Service)와 소프트웨어 기술 서비스(Software Technology Group)이 협동으로 소비 전력이 적은 데이터 센터를 만들기 위한 활동을 진행하고 있다.

이 데이터 센터 2.0은 현재 IBM의 데이터 센터에 우선적으로 적용되어 있으며, IBM의 고객들도 많은 관심을 갖고 있다고 한다. 이산화탄소 배출권 등, 환경 관련 규제는 날로 엄격해지고 있으므로 이 데이터 센터 2.0은 미래의 관점에서 상당히 중요한 역할을 차지하는 셈이다.

텍스트 마이닝과 타쿠미(TAKMI)

뒤이어 텍스트 마이닝 기술에 대한 설명을 들었다. 사진은 프레젠테이션에 동석한 요시다 이세이(吉田一星), 타쿠마 다이스케(宅間大介), 이나가키 이와오(稻垣巌)씨.

텍스트 마이닝이란, 대량의 텍스트 데이터에서 의미 있는 정보를 추출하는 기술이다. 이를테면 아래 그림처럼 날짜, 차종, 주행거리 등 등 일상적으로 사용하는 자연어로 만들어진 텍스트가 있다고 하자. 이러한 텍스트에는 ‘주행중 엔진이 멈췄다’ 라는 문장이 포함되어 있다.

통상적인 정보 분석 방법으로는 이러한 문장(주행중 엔진이 멈췄다)을 분석할 수 없지만, 여기에서 ‘단어 추출’ 이라는 방법을 이용해 ‘주행’, ‘엔진’ ‘멈췄다’ 등 단어를 하나씩 추출해 낸다. 그 다음 ‘구문(Phrase) 추출’ 이라는 방법으로 ‘엔진 멈췄다’ 와 같이 2개 이상의 단어로 구성된 문장을 추출한다.

이렇게 추출한 데이터들은 데이터베이스와 인덱스를 통해 아래 그림처럼 통계 처리가 가능해진다. 위 그림을 보면 여러가지 단어가 나열되어 있는데, 이를 통해 특정한 차종에서 어떤 고장이 가장 많이 일어나는지 확인 가능하다. 이것이 바로 이것이 바로 텍스트 마이닝의 한 예이다.

이 텍스트 마이닝은 크게 나누어 1)분류, 2)발견적 분석 이라는 분야에서 쓰이고 있다. 먼저 분류는, 특정한 주제에 해당하는 문서를 검색 조건을 통해 자동적으로 걸러내는 작업을 말한다. 물론 이러한 검색 조건을 만드는 데는 어느 정도 사람의 손이 필요하지만, 그러한 작업을 효율적으로 지원하는 것이 텍스트 마이닝의 목표이다.

실제적인 사례로서는 먼저 콜 센터 등에서 사용되는 ‘고장과 문제 추적’ 이 있다. 콜센터에서는 ‘엔진이 멈췄다’ 는 특정한 문제의 발생 건수가 늘었는지, 혹은 줄었는지를 판단하기 위해 이에 해당하는 문서를 걸러내야 한다. 이때 텍스트 마이닝 기술은 주어진 조건에 맞는 문서를 빠짐없이 걸러내 문제 해결이나 파악에 도움을 준다.

다음으로 들 수 있는 것이 ‘위험 문서의 감지’ 이다. 예를 들어 콜 센터에 접수된 상담 건수 중, “제품에서 불이 났다” 라든지, 불만을 제기한 사람이 블랙 리스트에 오른 사람이거나 폭력단원이라든지, 고객이 상당히 화를 낸 경우가 있다고 하자. 이런 정보들은 높은 위치의 책임자들이 반드시 확인해야 하는데, 이를 가리켜 ‘위험 문서’ 라고 한다. 텍스트 마이닝 기술은 이러한 위험한 정보를 담은 문서들을 자동적으로 걸러낸다.

분류 사례 중 마지막으로 들 수 있는 것이, 최근 일본에서 화제가 되고 있는 ‘보험금 미지급’ 문제이다. 보험금 지급을 위한 심사에 필요한 문서는 최종적으로 심사를 맡은 담당자가 읽고 판단을 내리게 되는데, 텍스트 마이닝이 이러한 사람들을 지원하는 경우에 속한다.

특히 보험에는 암 특약 등 여러 특약이 있기 마련인데, 이러한 심사도 사람이 하는 일인 이상 특약에 해당하는 사례인데도 보험금을 받지 못하는 일이 생길 수 있다. 따라서 텍스트 마이닝 기술은, 보험 가입자의 상태가 현재 이러한 특약에 해당되는지 텍스트 분석을 통해 미리 기계적으로 처리해서 담당자에게 도움을 준다.

이와 같은 작업들은 얼핏 보기에는 단순한 검색 기능으로도 처리가 가능해 보이지만, 텍스트 마이닝은 아래와 같은 몇 가지 조건에서 차별화를 꾀한다. 분류 업무의 핵심은, 먼저 1) 빠짐없이 문서를 걸러내야 한다는 것과, 2) 걸러낸 결과가 어떻게 변화하는지 등에 대한 분석이 가능해야 한다는 것이다.

위에서 밝힌 위험문서를 예로 이를 설명해 보자. 가장 먼저 검색 사전에 ‘불’, ‘연기’, ‘화재’ 등 떠올리기 쉬운 단어를 설정하면, ‘차에서 불이 났다’ 라는 문장이 포함된 문서가 검색될 것이다. 여기까지는 일반적인 검색 기능으로 처리 가능하다.

하지만 이렇게 검색된 문서들을 보면, 아래 그림처럼 ‘소방서’ 라는 단어가 자주 등장하는 것을 확인할 수 있다. 이 ‘소방서’ 라는 단어를 다시 사전에 추가하고 검색을 수행하면, ‘화재로 자동차가 반파되었다. 소방서에 연락했다’ 라는 문장이 담긴 문서까지 검색이 가능하다.

또한 이렇게 다시 검색된 결과에서 눈에 띄는 단어를 추가하면 다시 검색이 이루어지고, 이러한 과정을 반복하면서 데이터에 대한 빠짐없는 검색이 가능해지는 것이다. 이러한 동작은 일반적인 검색 기능으로는 처리 불가능하며, 이것이 바로 텍스트 마이닝이 지닌 강점이다.

다음으로 들 수 있는 것이 ‘텍스트 마이닝을 통한 발견적 분석’이다. 발견적 분석의 예 중 하나로, 사람의 눈으로는 찾기 힘들지만 자주 발견되는 문서(사례)들을 찾아내는 작업을 들 수 있다. 예를 들면 콜 센터에 자주 들어오는 질문들을 모아서 이를 FAQ나 매뉴얼로 만들 수 있다.

발견적 분석의 또 다른 예는 바로 미지의 결함들을 찾아내는 작업이다. 신제품을 출시한 경우 기존 제품에 없던 문제점이 나타날수 있는데, 그러한 문제점들을 조기에 발견해서 대처한다는 개념이다.

이를테면 아래 그림처럼, 자동차의 고장을 분석한 사례가 있다고 하자. 가로 축에는 고장에 관련된 일본어의 여러 가지 단어 중 빈도가 높은 단어들, 세로 축에는 자동차의 차종이 나열되어 있다. 여기에서 6번 차종의 자동 변속기(AT) 부분이 빨갛게 표시되어 있는데, 이것을 보면 6번 차종의 자동 변속기에 어떤 결함이 있다는 것을 쉽게 파악할 수 있다.

텍스트 마이닝은 이 외에도 여러 가지 용도로 쓰이고 있지만, 특히 분류와 발견적 분석에서 효과적인 결과를 보여준다고 한다. 이러한 텍스트 마이닝을 지원하는 기술은 크게 나누어 세 가지를 들 수 있다. 가장 먼저 1) 인간의 언어를 처리하는 자연어 처리 기술, 2) 이런 인간의 언어에서 질문이나 분노 등의 감정을 추출하는 기술을 들 수 있다.

또, 텍스트 마이닝에서 다루는 데이터는 매우 특수한 형태의 데이터이므로, 사람이 이런 데이터를 인터랙티브하게 검색하기 위한 색인(Indexing) 기술도 필요하다. 이러한 기술들을 갖추고 있는 것이 타쿠미의 강점이라고 한다.

뒤이어 일본의 국토교통성에서 제공하고 있는 1만 8천건에 이르는 데이터를 바탕으로, 이러한 텍스트 마이닝 기술이 어떻게 쓰이는 지에 대한 실연을 볼 수 있었다. 이 실연에 쓰인 데이터는 현재 웹 상에 공개된 실제 데이터를 바탕으로 만들어진 것이며, 국토교통성이 이러한 텍스트 마이닝 기반의 서비스를 제공하는 것은 아니다.

이번 실연에 쓰인 데이터는 국토교통성에서 제공하는 약 1만 8천건의 자동차의 결함 데이터베이스를 바탕으로 한 것이며, 각 문서마다 차종, 운전자의 성별, 상세한 내용이 기록되어 있다. 그리고 이러한 문서에서 추출된 단어에 대한 정보도 함께 포함되어 있다.

예를 들어 아래 화면에서는 ‘페달에 걸리는 감이 있다’ 는 구문 정보가 검색되어 있다. 이러한 정보들이 모두 색인화 처리되어 있어서, 실제로 이러한 정보들도 체계적으로 검색이 가능하다.

이처럼 특정한 단어를 통해 색인화된 단어가 실제로는 어떻게 보일까? ‘명사’를 선택하자 ‘카테고리’ 라는 항목 아래에, 색인으로 걸러낸 단어들이 표시된다. 그리고 단어 오른쪽에는, 이러한 단어를 포함하고 있는 문서가 데이터베이스 안에 몇 건이나 존재하는지 표시된다.

물론 이렇게 나열되는 단어만으로도 어떤 고장이 가장 많은지 파악할 수 있지만, 검색한 문서 안에서 이러한 단어들이 몇 번 나오는지 좀 더 상세하게 파악하는 것도 가능하다. 이러한 작업은 색인 기술을 통해 가능하다.

예를 들어 ‘불이 났다’ 는 건수 중에서 ‘연기’ 라는 단어로 검색하자, 조금 전과는 다른 키워드들인 ‘연기’, ‘하얀 색’, ‘본네트’ 등이 함께 표시된다. 이러한 키워드들은 ‘연기’ 라는 단어로 검색된 365건의 문서 중에서, 빈번히 등장하는 단어들을 자동적으로 보여주고 있는 것이다.

이러한 검색 결과를 좀 더 확장해서, ‘불이 났다’ 는 표현과 관련된 ‘불’, ‘소방서’ 를 체크하고, 이 단어들 중 어떤 것이라도 포함되면 검색되도록 OR 조건을 주고 검색하자 550건의 문서가 검색되었다.

명사들 뿐만 아니라 ‘불이 난다’ 라는 표현과 관련된 ‘동사’ 에 대해서도 같은 조건을 적용하자, 맨 처음에는 365건에 불과했던 검색 결과가 663건으로 두 배 가까이 확장되었다. 이러한 방법을 적용해 찾고자 하는 문서를 빠짐없이 걸러내는 것이 가능하다.

일반적인 검색 엔진에서는 사용자가 ‘연기’ 라는 단어를 스스로 입력해야 하지만, 텍스트 마이닝에서는 ‘연기’ 와 관련된 키워드를 자동적으로 사용자에게 제시해서 고르게 한다. 텍스트 마이닝은 이를 통해 분류 업무를 지원해 주는 것이다.

이와 같은 분류 업무 외에 발견적 분석에 대한 실연도 함께 볼 수 있었다. 아래 화면을 보면 세로 축에는 차종과, 가로축에는 명사가 표시된다. 또한 표 안에는 관련성이 높은 것으로 보이는 단어의 검색 건수가 표시되어 있다.

이 표를 보면 가로축(화면 아래쪽)의 1604라는 차종과, 세로축의 '공회전' 이라는 항목이 빨간 색으로 표시되어 있다. 이것을 보면 1604라는 차종에는 공회전과 관련된 문제가 있다는 것을 파악할 수 있다.

또한 위 화면에는 나오지 않았지만, 3494라는 차종은 자동변속기(AT) 항목에 빨간색 표시가 되어 있었다. 이 빨간색 항목을 클릭하면, ‘3494’ 라는 차종과 ‘자동변속기’ 라는 단어를 포함한 52건의 데이터가 함께 표시된다. 이를 통해 차량의 결함을 사전에 파악하는 발견적 분석이 가능하다.

이 외에도 ‘증감 그래프’ 기능을 이용하면, 어떤 문제의 발생 건수가 언제 줄고 언제 늘어났는지도 함께 파악 가능하다. 이를 통해 보다 동적인 분석이 가능해진다.

기능 설명과 시연이 끝난 후, 간단한 인터뷰 순서가 있었다. 이 때 오간 이야기들을 정리해 보았다.

질문) 타쿠미(TAKMI)라는 명칭은 어떤 의미를 담고 있는가?

답변) ‘Text Analysis and Knowledge Mining’ 이라는 영문 약자를 딴 것이다. 일본어에서 ‘숙련자’, ‘장인’ 이라는 의미를 가지는 ‘타쿠미(巧み)’의 의미도 함께 담고 있다.

질문) 현재 타쿠미를 실제로 활용하는 곳은?

답변) 타쿠미는 10년 이상 연구된 기술이다. 단순히 고객이 “타쿠미를 달라” 고 해도 줄 수 있는 것은 아니다(웃음). 2006년에 옴니파인더 아날리스틱 에디션(OmniFinder Analystic Edition)이라는 제품이 출시되었는데, 이 제품에 타쿠미가 적용되어 있다.

구체적인 이름은 밝힐 수 없지만, 이 옴니파인더 아날리스틱 에디션은 현재 콜 센터에서 가장 많이 쓰이고 있다. 콜 센터에서 고객들의 의견을 모아 여러 가지 형태로 활용하는 것이 주된 용도이다.

고객들의 의견을 모은다고 해도, 그 결과를 활용하는 형태로 문제 발견이나 고객의 의견 반영 등 여러가지 형태가 있을 수 있다. 하지만 기본적으로는 고객의 의견을 분석하는 용도로 많이 쓰이고 있다.

질문) 타쿠미는 일본 전용으로 설계되었는가? 또, 이 타쿠미를 사용 가능한 환경에 대해 알려달라.

답변) 타쿠미가 탑재된 옴니파인더 아날리스틱 에디션은 현재 일본어와 영어를 지원하고 있다. 따라서 일본 이외에는 영어를 일상적으로 사용하는 미국과 캐나다, 영국 등지에서 판매하고 있다. 현재 다른 언어는 지원하지 않는다. 또, 타쿠미를 사용 가능한 환경은 윈도우, 리눅스(레드햇) 이외에 AIX가 있다.

질문) 감정의 표현을 어떻게 해석하느냐에 대한 이야기가 나왔는데, 이러한 감정 표현에는 일본어와 영어 사이에 차이가 있다고 본다. 이런 차이를 어떻게 처리하고 있는가?

답변) 현재 제품이 가지고 있는 언어처리 기능을 가지고 보면 영어 이외의 다른 언어도 지원은 가능하다. 하지만 의미 파악의 문제가 있다.

예를 들어 일본어의 “감사합니다()” 라는 말에 대해, 일본인이라면 누구나 감사의 의미를 담고 있다는 것을 알 수 있다. 영어로 “Thank you” 라는 말에 대해, 마찬가지로 감사의 의미를 이해할 수 있다. 하지만 이탈리아어나 독일어가 된다면 둘 중 어느 것에도 해당하지 않는다. 말이 달라지기 때문이다.

따라서 언어 해석에 대한 노력은 하고 있지만, 그 언어가 담고 있는 의미 분석(Semantics)에 관련돤 부분은 각국의 지사에서 대응하지 않으면 구현이 불가능하다. 또한 일본어와 영어 이외에 다른 언어에 대해서도 지원은 기술적으로 가능하다. 하지만 그것을 실제로(비즈니스적인 관점에서) 하느냐, 하지 않느냐는 전혀 다른 문제이다.

질문) FAQ를 자동적으로 작성 가능한 기능은 있는가?

답변) 그러한 기능은 없다. 단, “~입니까?” 라는 질문을 뽑아내는 것은 가능하므로, 여기에 대답을 연관지어 FAQ를 만드는 것은 가능하다. 즉, 필요한 정보를 추출하는 것은 가능하지만 버튼 한번만 클릭한다고 자동적으로 FAQ가 작성되는 것은 아니다.

그러나 고객에 따라 제품의 용도가 다른 것도 사실이므로, 만약 FAQ 작성 기능이 필요하다는 고객이 있다면 제품으로 개발해서 제공할 수도 있을 것이다.

질문) 일반 사용자가 무료로 사용할 수 있는 옴니파인더 야후 에디션(OmniFinder Yahoo! Edition)에도 텍스트 마이닝 기술이 포함되어 있는가?

답변) 옴니파인더 야후 에디션은 일반 사용자를 위한 제품이며 단순히 검색만 가능하다. 텍스트 마이닝 기능이 포함된 제품은 옴니파인더 아날리스틱 에디션 뿐이다.

이벤트를 비즈니스로, '센서 & 액추에이터'

텍스트 마이닝에 대한 설명이 끝나고, 야마토 연구소 안에 마련된 브리핑 센터로 이동해서 위치 경보(Location Aware) 서비스에 대한 실연과 브리핑이 이어졌다. 이번 순서에서는 사카모토 시로(坂本史郞)씨와 타니바야시 마코토(谷林眞)씨가 수고해 주셨다.

아래 사진에 보이는 RFID 태그는 안에 전지가 들어 있어 전파를 내보낼 수 있는 능동형(Active) 태그이다. 이러한 태그나, 태그에서 나오는 전파를 수신하는 안테나는 서드 파티나 협력사들이 만들고 있으며. IBM은 이러한 태그나 안테나를 통해 수집되는 정보를 처리하는 미들웨어를 제공하고 있다.

이번 실연은 RFID 자체의 동작을 보는 것이 아니라, 이처럼 IBM이 개발/제공하는 미들웨어(Middleware)의 동작을 보기 위함이다. 이 미들웨어의 역할은 누가 어디있는지를 모니터링하거나, RFID를 통해 발생한 이벤트를 외부 어플리케이션에 넘겨서 처리하는 것이다. 그동안 이런 종류의 기술로 근태 정보 등 시간 기반 이벤트 로그만 체크된 데 비해, 한 걸음 더 나아간 것이다.

또한 이런 미들웨어의 화면에서 각 지역에 대한 관리가 가능하다. 실제로 미들웨어에 지도를 탑재하면 복잡한 좌표를 설정하지 않아도 간단하게 지역을 설정 가능하다. 뿐만 아니라 아래 사진에는 문제의(?) 47번 태그의 소유자에 대한 이름이나 회사 명등 속성이 표시되는데, 이런 속성들을 사내에서 쓰이는 디렉토리 서버(Directory Server)에서 가져와 보여주는 것이 가능하다.

실연이 이루어진 브리핑 센터 안에는 여러 가지 규칙(Rule)이 설정되어 있었다. 아래 사진은 미들웨어 내에 설정된 브리핑 센터의 지도이다. 가장 먼저, 위 사진의 빨간색 구역에 47번 태그를 가진 사람이 들어가면 경보가 발생하는 장면을 볼 수 있었다. 타니바야시씨가 태그를 달고 해당 구역에 들어가자 아래 사진과 같이 녹색 아이콘이 빨간색으로 바뀌었다.

이 외에, 여러가지 복잡한 규칙을 설정하는 것도 가능하다. 화면에 설정된 1) 녹색 장소에 2) 47번 태그를 가진 사람이 3) 10초 이상 머무를 경우 경보가 발생하는 룰을 설정한 결과, 역시 아래 사진과 같이 경보 표시가 떴다.

이러한 규칙들은 공장에서 생산하는 제품들이 미리 설정한 스케줄에 따라 움직이고 있는지 점검할때 매우 유용하게 사용된다. 또한 이러한 규칙들은 사용자의 용도에 따라 다양하게 커스터마이징이 가능하다.

또한 단순히 경보만 보여주는 것이 아니라, 미들웨어상에서 각 RFID 태그가 어떻게 움직였는지, 어떤 지역에 시간대 별로 누가 들어가고 나왔는지를 표시하는 리포트(Report) 기능도 사용할 수 있다고 한다. 이렇게 시연이 끝나고 브리핑 룸으로 자리를 옮겨서, RFID 관련 솔루션에 대한 설명을 들었다.

IBM에서는 RFID라는 용어를 쓰기보다는, '센서 & 액추에이터(Sensor & Actuator)'라는 용어를 쓰고 있다. 센서에는 온도 센서나 모션 센서 등 여러 가지 센서가 있으며, 액추에이터는 움직이는 사물이나 동작을 가리킨다. 건물에 들어갈 때 카드를 터치해서 문을 여는 것도 액추에이터의 일종이라 볼 수 있다.

실연에서 보았던 위치 경보(Location Aware) 서비스는 위치 정보에 기반을 둔 서비스이다. 이러한 형태의 서비스는 원래 공장 자동화(Factory Automation)에서 많이 사용되어 그다지 새로운 감은 없다.

하지만 IBM에서는 이러한 데이터를 모아서, 어떤 이벤트가 일어났을 때 그것을 비즈니스에 활용하는 역할을 맡고 있다. 이처럼 센서와 액추에이터에서 발생한 이벤트를 비즈니스로 연결하는 구조가 센터&액추에이터 프레임워크(Framework)이다.

IBM에서는 이러한 프레임워크에 기반해서 여러 가지 제품을 만들고 있고, 실연에서 볼 수 있었던 위치 경보 서비스도 그 중 하나이다. 이처럼 실제 세계에서 발생한 위치 정보나, 어떤 공정이 어디까지 진행되었나 하는 정보를 모아서, 여러 이벤트에 적용되는 규칙을 적용한 다음 이러한 데이터를 응용프로그램을 이용해 비즈니스 프로세스로 연결하는 과정에서 일정한 가교 역할을 하는 것이 바로 중간자적 역할을 수행하는 '미들웨어(Middleware)'다.

앞서 본 사례에서 참고할 수 있었던 그림에서 알 수 있듯이, 이 미들웨어는 실제 세계에서 발생한 물리적인 이벤트에 관련된 정보를 최종적으로 IBM이 지향하는 SOA(서비스 지향 아키텍처)로 연결하는 역할을 맡고 있다. 단순히 시간 흐름에 따른 기록 정도에서 벗어나 이제는 해당하는 센서 & 액추에이터를 지닌 사람의 행동양식까지 데이터로 축적할 수 있게 된 셈이다.

이 위치 경보 서비스는 여러가지 복잡한 규칙을 이벤트에 적용하는 것이 가능하다. 이를테면 이벤트 A가 일어난 뒤 B가 일어났다면 이러한 상관관계를 이용해 이벤트 C를 배제한다는 식이다. 하지만 여러 센서나 태그에서 발생하는 이벤트에도 쓸모없는(Garbage) 이벤트가 있기 마련이므로, 여기에서 필요한 정보를 골라내고, 이러한 정보 속의 상관 관계를 비즈니스에 활용하는 것이 가능한 구조이다. 실연에서 볼 수 있었던 경보 기능도 최종적으로는 미들웨어를 거쳐 최종적으로 응용프로그램에 전달된다.

실제 시연에서 보았던 위치 경보 서비스는 단순한 경보 이외에 또 다른 활용 분야를 가지고 있다. 그것이 바로 자산관리 기능이다. 예를 들어 PC를 관리하는 응용프로그램과 이벤트를 연결해서, 누가 어떤 장비를 가지고 있는지, 혹은 누가 무엇을 어디에서 어디로 옮겼는지에 대한 위치 정보를 자동적으로 전달하는 것이 그 좋은 예다.

어떤 특정한 지역에 들어가면 경보가 발생하거나, 어느 장소에 몇 초동안 머무르면 경고가 발생하는 기능도 다양한 활용이 가능하다. 이를테면 방문객을 안내할 때 일정 간격 이상으로 거리가 멀어진 상황이 10초/30초 이상 지속될 경우 경고를 울리는 등 여러 이벤트를 복합적으로 처리하는 것이 가능하다.

이러한 위치 경보 솔루션은 원래 안전과 안심이라는 개념에서 시작되었다. 해외의 정유공장에서는 작업자들을 관리하는데 이러한 솔루션을 사용하고 있다. 피난 장소에 전원이 들어왔는지, 혹은 특정한 자격이 없으면 들어갈 수 없는 위험한 지역에 무단으로 들어간 사람은 없는지 파악할 수 있는 솔루션을 IBM이 제공하고 있다고 한다.

센서 & 액추에이터에 관한 프레젠테이션이 끝난 후, 다뤄졌던 내용에 대해 다음과 같이 간단한 질의응답이 오갔다. 내용을 정리했다.

질문) 오늘 소개한 솔루션이 실제로 적용된 사례가 있다면?

답변) 공장이나 창고에서 자산관리, 혹은 안전관리를 위해 사용되고 있다. 해외라면 병원에서 페이스 메이커나 AED(자동심실제세동기)에 RFID 태그를 붙여서, 장비가 어디있는지 파악한다. 또한 사물에 RFID 태그를 부착해서 물건을 둔 장소를 찾아내는 데도 사용하고 있다.

또한 해외의 한 자동차 업체에서는, 어느 자동차가 어디에 있는지 파악하기 위해 RFID 태그를 붙여서 현재 자동차가 위치한 레인(Lane)을 파악하는데 응용하고 있다. 이러한 RFID 태그의 가격은 상당히 높았지만, 최근 가격이 상당히 낮아졌다. 때문에 실시간으로 장소를 파악해서 어떠한 동작을 일으키는 솔루션을 채용하는 곳이 늘고 있다.

질문) RFID 태그의 가격은 어느 정도 내려갔는가?

답변) 현재 우리들이 사용하는 RFID 태그의 가격은 그다지 내려가지 않았다고 생각한다. 어느 정도 내려갔는지는 답변하기 어려운 면이 있다. 일본의 시장에는 ‘100엔의 벽’ 이라는 것이 있다. 일례로 전파를 발신하지 않는 패시브(Passive) 타입의 RFID도 100엔, 50엔 정도이며, 실연에서 사용했던 형태의 액티브 타입은 가장 싼 것이라 해도 2000엔 정도이다.

이런 액티브 타입의 RFID 태그라 해도 예전에는 5천엔에서 1만엔 정도가 들었다. 하지만 지금은 2천엔 정도로 내려갔기 때문에, 지금까지 비용 문제로 (액티브 타입의 RFID 태그를) 도입하지 않았던 기업들도 한 번쯤 도입을 고려하는 시점까지는 내려와 있다.

질문) 오늘 소개받은 솔루션은 독자적인 솔루션인가?

답변) 그렇다. 지금까지 장소 감지와 관련된 기술은 일본의 회사와 기업에서 연구되어 왔다. 여러 규칙을 적용하거나, 응용 프로그램과 연계시키는 데 필요한 기초 기술의 연구는 대학에서 이루어지고 있다고 생각한다.

우리들(IBM)은 여러 형태의 RFID 태그를 만들지 않으므로, 고객의 용도와 환경에 맞는 제품을 찾아서 제공하고 있다. 전파가 발생시키는 이벤트를 비즈니스 솔루션으로 연결시키는 것이 IBM의 역할이라고 생각한다.

질문) 복잡한 룰의 설정이 가능하다고 했는데, 실제로 몇 개의 룰을 중첩한다면 최대 한계는?

답변) 이를테면 은행의 현금카드로 돈을 찾는 경우를 생각해 보자. 제가(사카모토) 츄오린칸 역의 ATM에서 본인의 현금카드로 돈을 찾는 것은 전혀 문제 없는 이벤트이다. 하지만 바로 그 현금카드를 이용해 30분 뒤에, 오사카(大版)에 있는 ATM에서 돈을 찾는 경우는 문제이다. 비록 본인의 카드에다 비밀번호도 정확하다고 해도, 이 곳(야마토 연구소)에서 오사카까지 30분만에 이동하는 것은 불가능하기 때문이다.

이런 식으로 여러가지 이벤트에 복잡한 규칙을 적용하는 것이 가능하다. 정확한 답변은 할 수 없지만, 어떠한 이벤트가 차례대로 일어나는 경우에 이를 처리하는데는 특별한 제한은 없다. 하지만 여러가지의 이벤트가 동시에 일어날 경우는 어느 정도 제한이 있을지도 모른다.

IBM 연구소 취재를 마무리하며...

흔히들 ‘연구소’라는 단어를 들으면 일상 생활과 동떨어진 최첨단 기술이 가장 먼저 떠오르기 마련이다. 하지만 IBM의 야마토 연구소에서는 텍스트 마이닝, RFID 기반 솔루션 등 우리의 일상 생활과 상당히 연관이 깊은 기술도 연구하고 있었다. 일례로 현대인이라면 누구나 한 번쯤은 고장난 전자제품때문에 고객 센터에 전화해 본 적이 있지 않은가?

보통 IBM 하면 가장 먼저 싱크패드가 떠오르며, 각종 거대한 서버도 떠오르기 마련이다. 하지만 IBM에서는 이러한 하드웨어 못지 않게, 하드웨어 위에서 돌아가는 각종 소프트웨어와 솔루션에도 높은 비중을 두고 사업을 전개하고 있음을 이번 취재를 통해 새삼 깨달았다.

사실 야마토 연구소의 연구 분야는 무척 방대하며, 이번에 소개한 내용은 그야말로 빙산의 일각에 불과하다. 그럼에도 이번 기사가 야마토 연구소를 이해하는데 어느 정도나마 도움이 되었으면 하는것이 필자의 바람이다. 이번 취재 성사를 위해 오랜 기간동안 사전 조율에 수고하신 한일 양국의 담당자 여러분들께 감사드리며 글을 맺는다.

728x90

저작자표시 비영리 (새창열림)

Cadenza

일본 IBM 야마토 연구소

티스토리툴바