본문 바로가기

SemanticWeb

[스크랩] Semantic Web

시맨틱 웹. 새로운 인터넷인가 아니면 아직 사용처를 찾지 못해 떠도는 복잡한 기술일 뿐인가?


이 질문은 이번주 개최된 시맨틱 기술 컨퍼런스에 참가하는 지지자들이 공통적으로 해결했으면 하는 문제다. 표준 옹호자, 벤처 캐피탈, 컴퓨터 과학자, 기술 임원 등이 시맨틱 웹의 기업용 애플리케이션 분야를 논의하기 위해 이번 주 3일간의 컨퍼런스를 가지게 된다.


시맨틱 웹은 계속 늘어나고 있는 W3C의 프로토콜 모음이다. 이 프로토콜들은 웹을 통해 새로운 정보의 보고에 접근하고 재사용할 수 있도록 설계되고 있다.


널리 퍼진 회의론을 잠식시키기 위해 표준 옹호자들은 대형 첨단 기술 기업들에 의한 시맨틱 웹 프로토콜의 최신 실행 사례가 인터넷의 차세대 혁명 단계의 도래를 알린다고 주장하고 있다.


첫 번째 웹 프로토콜을 창시한 공로로 지난해 기사 작위를 받기도 했던 영국인인 W3C 이사 팀 버너스 리가 이끄는 시맨틱 웹의 지지자들은 현재를 10년 전 웹의 태동기에 비유하면서 강력한 지지의사를 보내고 있다. 웹이 하이퍼링크에 관한 혁신적인 시스템에 덧붙여 현존하는 인터넷 기술을 포괄했던 것처럼, 시맨틱 웹도 전세계 컴퓨터 네트워크들의 정보들을 취합하는 데 있어서 보다 강력한 방법을 산출해낼 것이라는 주장이다.


그러나 이러한 주장은 개인 프라이버시와 기술적 복합성 등에 관한 우려에 반하는 것이다. 아울러 시맨틱 웹 활동이 W3C 컨소시엄을 ‘이미 충분히 좋은’ 체계적인 웹 프로토콜을 유지하는 임무에서 벗어나도록 하는 ‘그림의 떡’과 같은 인공 지능 연구라는 인식에도 반하고 있다.


여기서 더 나아가 W3C의 작업을 밀접하게 수행하는 일부 애널리스트와 기술론자들조차 수년 간 몇몇 문서가 작업·출판됐음에도 불구하고 여전히 시맨틱 웹이 무엇인지 모르겠다고 말하고 있다.


버튼 그룹의 피터 오켈리는 “웹에서 보다 복잡한 지식 관리를 한다는 시도 그 자체에 반대하는 것이 아니다”라고 일단 선을 그었다. 그러나 그는 “이들이 해결하려는 문제가 어떤 것인지 명확하게 인식되지 않는다. 오늘날 우리가 갖고 있는 웹의 단순함과 정력적인 속성은 현재까지 상당히 성공을 거둔 작업 중 하나다. 시맨틱 웹은 현존하는 기술들처럼 광범위하게 적용할 수 있는 성질의 것이 아닐 것이다. 팀 경의 주장에도 경의를 표하지만 웹에는 이미 많은 사람들이 인지하는 것처럼 수많은 영역이 남겨져 있다”라고 말했다.


버너스 리는 인터뷰에서 시맨틱 웹 활동을 둘러싸고 있는 혼돈의 ‘안개’는 이미 친숙한 내용이라고 말했다. 그는 “몇 년 전 특히 업계에 있는 사람들에게 웹 문제를 설명하려고 노력할 때 받았던 응답들과 닮았다”라며 “식별기를 지닌 보편적인 정보 공간과 단방향 링크는 패러다임의 변화였다. 지금은 매우 당연하게 여겨지고 있는 것들이지만 당시 우리는 웹을 일반적으로 표현할만한 용어를 갖지 못했다. 시맨틱 웹도 마찬가지 상황”이라고 옹호하는 주장을 펼쳤다.


일단, 알려야 한다

이번 주 개최된 컨퍼런스는 부분적으로 시맨틱 웹에서 사용되는 용어를 좀더 친숙하게 만들며 기업 소속 청중들에게 이 프로토콜을 사용한 애플리케이션이 현재 가능할 뿐만 아니라 어도비, HP, IBM, 노키아, 오라클 등 여러 기업들에서 이미 사용중이라는 사실을 알리기 위해 기획된 것이다.


컨퍼런스에 참가한 패널들은 “e커머스 실현자로서의 시맨틱 중개자”와 “존재론적 시맨틱 인식 데이터 측정 및 비즈니스 인텔리전스” 등의 영역에 분포돼 있다. 기업 및 정부 사례 연구 또한 제시될 예정이다.


시맨틱 웹 프로토콜은 컴퓨터들이 다른 종류의 데이터를 구별할 수 있도록 하는데 목표를 두고 있다. 이런 식별 기능이 갖춰지면 애플리케이션은 예를 들어 온라인 주소록과 휴대폰과 같은 기기들 간에 정보 교환을 보다 자동적으로 수행할 수 있게 된다. 그리고 웹사이트 또한 특정 방문객의 필요에 따라 자신을 자동적으로 재설정할 수 있다. 검색 엔진도 보다 뛰어난 정확도로 결과들의 폭을 좁힐 수 있다.


W3C 시맨틱 웹 활동을 주도하고 있는 에릭 밀러는 지난 8일 가진 기조연설에서 “이는 데이터를 그 정의와 맥락으로 연결시키는 것에 관한 것이다”라고 표현했다. 그는 뒤이어 “우리는 문서의 웹에서 데이터의 웹으로 움직이고 있는 것”이라고 선언했다.


W3C는 시맨틱 웹이 채우려고 설계하고 있는 부분의 일부가 이미 현존 기술로 채워지고 있다는 점을 인식하고 있다. 이 중 하나는 상당히 묘사적이고 컴퓨터에 친숙한 마크업 언어를 만드는 것으로 바로 컨소시엄이 XML 언어를 추천하는 것이다. 다른 것들은 급속도로 진화하고 있는 데이터베이스 관리 시스템에 있다.


그러나 신기술 개발에 참여하고 있는 버너스 리와 다른 이들은 데이터가 웹에 노출되는 방식에 있어 대혁신이 일어날 것이라고 주장한다.


리는 “대기업에서 수많은 데이터베이스 도식과 XML 도식 등을 설계할 때 설계자들은 정확히 시스템을 어떻게 구축할 것인가에 대해 비합리적인 설계 선택을 하고 있다”라고 말했다. “이러한 선택은 실제 애플리케이션에는 실질적인 연결이 전혀 없는 상태지만, 시스템으로는 통합된다. 데이터를 활용하는 사람이라면 누구나 이런 결정이 무엇인지 알아야 한다”라고 그는 덧붙였다.


시맨틱 웹 개발자들의 핵심 목표에는 데이터의 재활용과 이른바 ‘재조합 효과’라 불리는 것 등이 포함된다.


이들은 컴퓨터가 맥락·의미-인공 지능 비판론자들의 화를 돋을만한 단어다-등에 관한 정보를 혼합하고 교환함으로써, 데이터가 최초 발생 시스템에서 생존해나가 마치 브라우저가 수십억 웹페이지를 가로지르는 것처럼 서로 다른 애플리케이션을 손쉽게 가로지를 수 있기를 바라고 있다. 이런 데이터가 자신 스스로의 가상 삶을 시작하기 때문에 예견되지 않고 또한 예상 밖의 수익이 나는 방법으로 활용되거나 결합될 수 있다.


리는 “정말 재미있는 것은 여러분이 여러분 자신의 데이터를 애플리케이션들 사이에서 합병할 수 있다는 것이 아니다. 이는 여러분 자신의 웹사이트에 있는 링크와도 같다”라며 “그것은 바로 다른 이들이 자신의 데이터를 합병할 수 있는 형식을 갖고 있으며 이를 유용하게 만들 때 발생한다. 이런 공적 정보가 합병할 수 있게 되면 우리는 웹 진화에 있어서 다음 단계, 그리고 매우 명확한 단계에 있게 된다”라고 말했다.


언제나 문제는 보안

이런 상호 교환 가능한 데이터의 저돌적인 새로운 시대는 밀러의 표현을 따르자면 “문서, 서버, 그리고 데이터베이스 등에 숨겨져 있는 데이터를 노출하는 것”이며, 부상 중인 프로젝트의 비평가들로부터 회의론과 경고를 동시에 자극하고 있다.


이 중 한 우려 사항은 시맨틱 웹 사항을 지닌 비즈니스의 경우 정보를 의도하지 않은 공유에서 방지하는 데 있어서의 새로운 골치거리를 안을 수도 있다는 점이다.


이에 대해 버튼 그룹의 오켈리는 “모든 것이 모든 그룹이 접근할 수 있는 것이 되는 보편적인 지식 네트워크를 갖길 바라는 것이 아니다. 기업들은 공표에 대해 주의 깊을 필요가 있다”라고 말했다.


기업·개인 프라이버시에 대한 우려를 인지하고 있는 W3C는 정보 공유에 대한 시맨틱 웹 규정 시스템을 계획하고 있다고 말했다. 컨소시엄은 오는 4월 27~28일 워싱턴 D.C에서 개최되는 상호운용성의 규정 언어에 대한 워크숍에 대해 3월 18일까지 설명서를 요청하고 있는 상태다.


비록 핵심 프로토콜은 아직 아이디어 단계에 있지만 W3C는 웹의 차세대 대규모 진화가 이미 시작됐다고 주장하고 있다.


W3C의 밀러는 “시맨틱 웹의 출현”이란 명칭의 기조 연설에서 현재 개발됐거나 또는 주요 기업에 의해 채택된 시맨틱 웹 기술의 현존 사례들 소개에 상당 부분 할당했다.


노키아는 예를 들어 장기적인 자체 시맨틱 웹 활동을 유지하고 있으며, 윌버(Wilbur)로 알려진 자체 시맨틱 웹 툴킷을 만들어 냈다. 이는 오픈소스 개발 사이트인 소스포지(SourceForge.net)에서 이용할 수 있다.


밀러는 노키아가 시맨틱 웹 사양, 특히 RDF(Resource Description Framework)을 시리즈 60 휴대폰과 자체 개발 포럼에서 활용한 것을 공개적으로 치하했다. 밀러의 사례 중 하나를 살펴보면, RDF 메타데이터, 또는 데이터에 관한 데이터는 휴대폰이 얼마나 많은 주파수를 보유하고 있는가에 관해 웹과 의사소통할 수 있도록 허용했다.


다른 사례에서 RDF는 노키아가 특정 휴대폰 대상의 특정 애플리케이션 개발자들에게 개인적으로 맞춰진 페이지에 서비스를 자동적으로 제공하도록 했다.


밀러는 또한 다른 사례도 인용했다. 싱가포르 정부의 온라인 교육 리소스를 구축하는 작업에 있어서 HP의 시맨틱 웹 기술의 활용, 특히 생명과학 분야에 있어서의 IBM 인터넷 기술 그룹의 시맨틱 웹 애플리케이션 개발, 어도비의 ‘크리에이티브 스위트’ 내에 RDF 기반의 XMP(eXtensible Metadata Platform)의 삽입이 바로 그것이다. 특히 어도비의 경우 70만대 이상의 컴퓨터에 장착돼 있다고 주장하고 있다.


그리고 오라클의 올해 하반기로 예정돼 있는 오라클 데이터베이스 10.2에서의 RDF 네트워크 데이터 모델의 포함 등도 여기에 해당된다.


밀러는 또한 시맨틱 웹에 관한 믿음을 확산시킬 계획을 수립했다. 그는 W3C 회원들에게 시맨틱 웹 교육 및 커뮤니케이션 분야에 헌신하고 있는 실무 그룹들을 후원해 줄 것을 요청할 것이며, 또한 아직 장소는 결정되진 않았지만 서해안 부근에서 6월 22~24일 사이에 CTO와 CIO를 대상으로 한 시맨틱 웹 심포지엄을 계획하고 있다.


수년간 구름 속을 헤매는 듯한 인공지능 퇴행이라 불리는 시간 이후, 시맨틱 웹 지지자들은 명백한 만족 상태로 실제 세계에서의 이런 실행사례들을 칭송하고 있다.


버너스 리는 “시맨틱 웹이 이제 이륙을 시작하는 중”이라며 “아직 개발이 완료되지 않았으므로, 실행자들은 아직 관련된 일을 하는 사람들과 지속적으로 부딪히는 중이다. 우리는 아직 예견되지 않은 방법으로 서로를 연결하는 애플리케이션 영역의 장점을 실제로 보고 있지 않은 상태다”라고 말했다.


뒤이어 리는 “하지만 특정 영역에서는 비판적인 대중은 지나간 상태다. 최근의 시맨틱 웹 및 생명과학 워크숍에서, 게놈학, 프로테오믹스(proteomics), 임상 흔적, 그리고 전염병학 데이터, 기타 등등의 생명과학 원칙들을 가로질러 통합하는 데 사용될 수 있는, 의미 있는 개가가 있었다”라고 지적했다. @


Paul Festa ( CNET News.com )