Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)
Korean Institute of Information Scientists and Engineers (KIISE)
- Semi Annual
- /
- 1598-5164(pISSN)
Domain
- Information/Communication > Information Processing Theory
2005.07b
-
최근 웹 검색 분야에서는 검색 질을 높이기 위한 기법들이 많이 연구되어 왔으며, 대표적인 연구로는 제한 검색, focused crawling, 웹 클러스터링 등이 있다. 그러나 제한 검색은 검색 범위를 의미적으로 관련된 사이트들로 제한할 수 없으며, focused crawling은 질의 시점에 클러스터링하기 때문에 질의 처리 시간이 오래 걸리고, 웹 클러스터링은 많은 웹 페이지들을 대상으로 클러스터링하기 위한 오버헤드가 크다. 본 논문에서는 검색 범위를 특정 커뮤니티로 제한하여 검색 하는 커뮤니티 제한 검색과 커뮤니티를 구하는 방법으로 cluster crawler를 제안하여 이러한 문제점을 해결한다. 또한, 커뮤니티를 이용하여 PageRank를 2단계로 계산하는 방법을 제안한다. 제안된 방법은 첫 번째 과정에서 커뮤니티 단위로 지역적으로 PageRank를 계산한 후, 두 번째 과정에서 이를 바탕으로 전역적으로 PageRank론 계산한다. 제안된 방법은 Wang에 의해 제안된 방법에 비해 PageRank 근사치의 오차를
$59\%$ 정도로 줄일 수 있다. -
스트림 데이터를 생성하는 응용의 증가로 스트림 데이터 처리에 대한 연구가 활발히 진행되고 있다. 이러한 응용의 예로 센서네트워크, 모니터링, Selective dissemination of information(SDI)등이 있다. 특히 SDI와 같은 웹 환경의 응용은 XML을 기반으로 스트림 데이터 처리에 대한 연구를 진행하고 있다. XML은 웹상의 데이터 교환의 표준으로 웹 응용의 증가로 인해 스트림 데이터 처리 분야에서도 XML을 사용하는 스트림 데이터 처리 시스템에 대한 연구가 많이 진행되고 있는 실정이다. 하지만 XML을 기반으로 하는 기존의 시스템들은 정적인 질의계획을 사용하여 스트림 데이터를 처리하기 때문에 동적으로 변하는 스트림 데이터에 적응력있게 대처할 수 있다. 이와 달리 관계 데이터 모델을 사용하는 스트림 데이터 처리 시스템은 동적인 질의 계획과 질의 처리 연산자의 라우팅(스케쥴링) 기법을 사용하여 적응력있는 질의처리를 지원한다. 본 논문에서는 관계 데이터 모델을 사용하는 시스템의 적응력있는 질의처리 모델을 XML을 기반으로 하는 시스템에 적용하는 기법들에 대하여 설명한다. 그리고 XML을 기반으로 하는 기존의 대표적인 시스템인 YFilter[7]와 본 논문의 제안하는 시스템과의 질의처리 성능을 비교 평가한다.
-
온톨로지 언어를 기반으로 하는 시맨틱 웹 상에서 온톨로지 데이터에 대한 질의를 효율적으로 처리하기 위해서는 질의 처리에 효과적인 저장 스키마의 구축이 필요하다. 본 논문에서는 온톨로지 데이터의 검색을 위한 효과적인 저장 스키마 구축 기법을 제안하고자 한다. 아울러 본 논문에서 제안하는 저장 스키마를 위한 질의 기법을 제안하고자 한다. 온톨로지 데이터를 추출할 때에는 계층 구조를 기반으로 질의 수행을 해야 한다. 따라서 본 논문에서는 계층 정보를 유지하기 위해 별도의 XML 문서를 기존의 넘버링 기법을 기반으로 생성하여 하위 정보의 추출을 효과적으로 지원하고자 한다. 실험을 통한 질의 처리 성능을 통해서 본 논문에서 제안하는 저장 스키마 기법과 질의 처리 기법이 효과적임을 보인다.
-
웹 서비스는 소프트웨어 컴포넌트의 재사용 및 상호 운용을 지원하여 서비스의 통합을 가능케 하는 기술이다. 웹 서비스 기술을 이용하여 기존에 존재하는 서비스를 통합하여 새로운 서비스를 제공해주는 것이 가능하다. 서비스 조합을 위해 정확한 서비스 탐색은 필수적이다. 본 논문에서는 서비스 조합을 효율적으로 제공하기 위해 오퍼레이션 중심의 시맨틱 웹 서비스 탐색 방법을 제안한다.
-
P2P(Peer-to-Peer) 시스템은 대용량의 데이타를 공유하는데 유용하며, 네트워크 구조에 따라 중앙 집중형, 구조적 분산형, 그리고 비구조적 분산형으로 분류된다. 이 중 Gnutella와 같은 비구조적 분산형 P2P 시스템은 확장성과 신뢰성 측면에서 장점을 갖지만, 참여하는 노드의 수가 증가함에 따라 원하는 자원을 액세스하는 비용도 증가하는 문제를 가진다. 데이터 중복을 이용해 이러한 문제를 해결할 경우 중복된 데이타들의 일관성 유지를 위한 기법이 필요하다. 본 논문에서는 특정 노드가 갱신한 데이타를 중복된 사본을 저장하고 있는 다른 노드에 전파하기 위한 하이브리드 push/pull 기반의 갱신 전파 기법을 제안한다.
-
We show how to rapidly build a framework supporting weak code mobility by using Active XML [I]. Weak code mobility is important in mobile applications area by offering functionality at a low bandwidth cost and with little overhead imposed to the user peer architecture. Starting from already known principles involving code nobility, we give a new definition for the functionality transfer p개cess and we materialize it in a working prototype.
-
현재 그리드 컴퓨팅에 관한 연구는 그리드 컴퓨팅 인프라의 성공적인 구축과 함께 그리드 컴퓨팅의 응용분야가 확대됨으로써 그리드 컴퓨팅이 제공하는 고성능 연산 자원뿐만 아니라 대용량의 저장장치와 데이터베이스를 이용하기 위한 데이터 그리드에 관한 연구도 활발히 이루어지고 있다. 하지만 데이터 그리드를 이용하는 응용에서 파일을 이용할 기회가 더욱 많음에도 불구하고 데이터베이스에 관한 연구에 비해 파일 데이터에 관한 연구가 미비한 실정이다. 따라서 본 논문에서는 그리드 컴퓨팅 미들웨어의 표준으로 자리 잡고 있는 OGSA물 기반으로 한 그리드 파일 시스템을 설계한다. OGSA 기반 그리드 파일 시스템은 크게 전통적인 파일 시스템과 같은 단일 뷰를 가능케 하는 명명 공간 서비스, 여러 개의 같은 파일을 단일 파일로 보이게 하는 복제 파일 관리 서비스, 파일의 메타 데이터 정보를 관리하는 파일시스템 정보 서비스, 마지막으로 사용자들과 개발자들이 동일한 접근 방식을 이용하도록 하는 서버
${\cdot}$ 클라이언트${\cdot}$ 파일 제공자 인터페이스로 구성된다. -
이동 컴퓨팅 환경에서 통신 네트워크가 갖는 무선 채널 대역폭의 협소함과 이동 단말기의 에너지 제약으로 인해, 다수의 이동 클라이언트들에게 데이터를 전달할 때에는 다수의 클라이언트들의 동시 데이터 접근을 지원하는 브로드캐스트 방법을 사용함으로써 제약점들을 보완할 수 있다. 본 논문에서는 클라이언트의 에너지와 데이터에 대한 접근시간(access time)의 효율을 높이기 위해 데이터의 접근빈도(access frequency)를 고려한 브로드캐스트 방법과 브로드캐스트 인덱스를 추가하는 방법을 함께 반영한 OAF(Data Access Frequencies)브로드캐스팅 기법을 제안한다. DAF브로드캐스팅 기법은 데이터의 접근빈도를 고려한 인덱스를 교차하여 추가함으로써 접근빈도가 높은 데이터를 원하는 다수의 사용자에 대한 접근시간을 줄임으로써 모든 사용자의 평균 접근시간을 줄이는데 목적이 있다. 수학적 분석을 통해 DAF브로드캐스팅 기법을 평가하고 기존의 브로드캐스트 방법과 DAF브로드캐스팅 기법의 성능을 비교 분석한다.
-
시맨틱웹의 목적은 메타데이터의 개념을 적용하여 웹문서에 시맨틱 정보를 덧붙여, 웹에 있는 정보를 컴퓨터가 이해할 수 있도록 하는 것이다. 이를 가능하게 해주는 핵심 기술로 웹 온톨로지 언어 (OWL : Ontology Web Language)를 들 수 있다. 그러나 온톨로지 언어가 표현하는 객체들과 그들 사이의 관계는 복잡한 논리들로 얽혀 있어 언어에 익숙하지 않은 사람에게는 온톨로지 개발이 쉽지 않다. 본 논문은 개념 모델링을 위한 방법으로 가장 잘 알려진 EER 모델링만으로 복잡한 논리적 구조로 인해 작성하기 어려운 OWL 코드를 자동 생성하는 편집 도구를 설계한다. 특히 전자 카탈로그 도메인에 특화하여 자주 요구되는 특수한 개념들에 대한 모델링 요소를 추가하여 표현할 수 있게 하였다. 이는 온톨로지 개발자들의 시간과 어려움을 크게 감소시킬 것이며, 상품온톨로지 제작에 특히 유용할 것이다.
-
EPCglobal은 RFID와 관련된 다양한 분야의 표준화를 주도하고 있으며, 응용 표준으로써 Tag 정보의 운용을 위한 RFID 미들웨어(Savant)를 제시하였다. 특히, Savant의 RIED는 Tag 정보를 저장하고 다양한 질의 저리를 제공하는 MMDBMS이다. 그러나 RIED는 User-Driven 방식만 지원하므로 연속
${\cdot}$ 질의를 저리하기 위해 주기적으로 질의를 수행하게 된다. 따라서 주기적인 질의 수행으로 인한 심각한 성능 저하가 발생하며, 실시간 처리를 요구하는 질의를 수행하지 못한다. 이 논문에서는 RFID 미들웨어의 질의 처리 문제를 해결하기 위하여 연속 질의에 적합한 질의 색인 구조를 제시한다. 이 색인은 질의를 색인의 데이터로, 데이터를 색인의 질의로 Swap하여 데이터에 독립적인 검색 성능을 보장한다. -
GPS및 PDA의 발달로 인해서 위치 기반 서비스(LBS), 차량항법장치(CNS), 지리정보시스템(GIS)등 공간 데이터를 다루는 응용프로그램들이 급속하게 보급되었다. 이러한 응용프로그램은 높이 균등 색인 기법을 사용하여 원하는 데이터에 대한 색인을 제공하였다. 그러나 모든 공간 객체는 서로 상이한 접근 빈도를 가지고 있음에도 불구하고 기존의 공간색인 기법은 접근 빈도를 고려하지 못하는 단점을 가지고 있었다. 또한 기존의 빈도수만을 고려한 공간 객체의 색인 방법은 접근 빈도에 따른 편향성(skewed)은 제공하지만 공간 객체에 대한 지역성을 반영하지 못한다. 본 논문에서는 밀집되어 있는 공간 객체의 접근 빈도를 반영해서 편향된 색인 트리를 생성하는 기법을 제안한다. 이형 클러스터링으로 분포되어 있는 전체 영역에 대해서 Zahn의 클러스터링 알고리즘을 변형시켜서 다단계 세부영역을 구분한다. 이렇게 구간된 세부영역에 대해서 거리적 인접성과 접근 빈도수의 합을 이용해서 색인 트리를 생성한다. 다단계로 구성된 전체영역에 대해서 하향식 방식으로 편향된 색인 트리를 생성함으로써, 접근 빈도가 높은 공간 객체에 대해서 빠른 탐색이 가능하게 한다.
-
데이터 스트림 처리에 관한 연구들은 최근 컴퓨터 과학 분야에서 가장 않은 관심을 가지고 있고 흥미있는 이슈 중 하나이다. 이러한 경향은 다양한 어플리케이션의 출현으로 질의 저리에 대한 효율적인 방법과 새로운 데이터 스트림의 모델을 필요로 하기 때문일 것이다. 본 논문은 그 중에서도 데이터 스트림 분야의 가장 중요한 부분으로 생각되는 스케줄링, 적절한 질의 처리, 부하 분산, 근사화, 분산 데이터 모니터링에 대한 연구 분석을 도모하였다.
-
본 논문에서는 기존의 밀도 기반 전지 클러스터링 알고리즘의 성능을 개선한 밀도 기반 클러스터링의 근사적 접근법을 제안한다. 기존의 밀도 기반 전지 알고리즘은 다차원 색인의 많은 검색 공간을 빠르게 전지하면서도 원하는 클러스터를 정확히 찾아내는 특징을 가지고 있다. 그러나 기존 알고리즘은 전지를 위한 한계 값 설정을 위하여 단말 영역들의 밀도 값을 사용함으로써, 내부 영역에 속한 단말 영역들 간의 밀도 편차가 큰 경우 전지 여부에 대한 판별이 빨리 이루어지지 않는다. 또한, 최악의 경우에는 모든 단말 페이지를 검색하여야 하고, 이에 따라 성능이 저하될 수 있다. 반면에 제안하는 근사적 접근법에서는 한계 값 설정을 위해 단말 영역이 아닌 내부 영역의 밀도 값을 사용한다. 일반적으로, 내부 영역들 간의 밀도 편차는 단말 영역들 간의 밀도 편차보다 크지 않으므로, 근사 밀도 기반 전지 알고리즘에서는 더욱 많은 검색 공간의 전지 여부의 빨리 판별할 수 있게 된다. 성능 평가 실험을 수행한 결과, 제안한 알고리즘은 기존의 알고리즘과 비교하여 정확성 측면에서는 큰 차이가 없는 반면 수행 시간 측면에서는 최대
$17\%$ 의 성능 향상 효과가 있는 것으로 나타났다. -
RFID(Radio Frequency Identification)는 자동 인식 데이터 수집 장치의 한 분야로써 GPS장치를 장착한 차량과 같이, RFID 태그(전자태그)를 상품에 부착하여 인식, 추적할 수 있다. 이러한 전자태그 객체는 시간에 따라 경로 정보가 누적되는 이동체와 유사한 특성을 가진다. 그러나 기존의 이동체 색인과 달리 태그 객체의 위치는 판독기의 위치로 인식되며 위치보고가 판독기의 인식영역 안에서만 이루어지므로 보고 주기를 예측할 수 없다. 기존의 이동체 색인에서 전자태그의 특성을 표현하기 힘들기 때문에 전자태그의 특성을 고려란 색인이 필요하게 되었다. 최근 전자태그의 특성을 고려한 색인인 TPIR-Tree(Time parameterized Interval R-Tree)가 발표되었다. 그러나 이 색인은 기존 공간 색인에서의 균등분할 기법을 사용하여 위치보고가 시간의 순서를 가지는 전자태그의 특성을 고려하지 못하여 과거노드의 저장효율이 좋지 못하다. 이 논문에서는 TPIR-Tree의 저장효율 및 검색 성능 향상을 위해서 시간의 순서에 따라 위치를 보고하는 전자태그 객체의 특성을 고려하여 분할축 선정 기법 및 시간축 분할시 비균등 분할정책을 제안한다.
-
XML 스키마의 수가 급증함에 따라 동일한 도메인에 속하는 유사한 스키마를 통합하는 방법에 대한 관심이 증가하고 있다. 일반적으로 XML 스키마 통합 과정은 스키마 클러스터링과 통합 스키마 추출의 두 단계로 구성된다. 본 논문에서는 통합 스키마의 추출을 위한 효율적인 방법을 제안한다. 제안된 방법은 공통 구조 추출, 스키마 통합, 그리고 최적화의 세 단계로 이루어진다. 실험결과, 제안된 방법은 처리시간 및 정확도 측면에서 우수란 결과를 보였다.
-
기존의 다차원 색인 기법들이 고차원의 특징 벡터를 갖는 멀티미디어 컨텐츠 검색 분야에서 만족할 만한 성능을 보이지 못하므로, 이를 해결하기 위해 VA-File, LPC-File 등의 벡터 근사 방법이 개발 되었다. 이러한 방법들은 데이터의 접근에 소요되는 시간이 전체 검색시간의 대부분을 차지하는 경우에 효과적으로 사용할 수 있다. 그러나 고차원의 멀티미디어 데이터 검색에서 객체간의 거리 계산 시간은 데이터 접근 시간에 비해 무시할 만큼 작지 않으므로 이 방법들을 그대로 적용하기는 어렵다. 본 논문에서는 객체간의 거리 계산 시간을 줄이기 위한 새로운 색인 기법을 제안하고 실험을 통해 이 방법이 기존의 방법들에 비해 우수한 검색 성능을 가진다는 것을 보인다.
-
시간의 흐름에 따라 그 위치가 빈번히 변화하는 이동 객체의 특성으로 인해 실시간으로 증가하는 이동객체의 연산 정보를 효과적으로 관리할 수 있는 효율적인 연산 기법이 요구된다. 따라서 본 논문에서는 이동 객체의 시공간 연산을 위해 기존에 제안되었던 HR 트리의 성능을 개선시킬 수 있는 확장된 HR-트리(Extended HR-Tree : EHR-Tree)를 제안한다. 기존의 HR 트리는 삽입, 삭제, 갱신과 같은 연산이 빈번한 경우에 단말 노드 및 비단말 노드를 새로 생성해야 함으로 인하여 성능이 떨어지고, 공간의 낭비가 있게 된다. 이 문제를 해결하기 위해 본 논문에서 제안하는 EHR-트리는 연산이 발생할 때마다 새로운 HR-트리를 생성하는 것이 아니라 시간 구간을 두어서 새로 발생한 연산이 같은 시간 구간에 있을 경우 그 단위시간에 생성된 HR-트리에 그대로 삽입, 삭제, 갱신과 같은 연산을 수행하게 된다. 따라서 기존 HR-트리에서 단말 노드 및 비단말 노드를 새로 생성해야함으로 발생되던 많은 저장 공간 요구를 감소시킴으로, 즉 전체 연산 크기를 작게 하여 디스크 I/O수를 감소시킴으로써, 시공간 질의의 처리 속도를 향상시켜 효율적인 질의가 가능하도록 한다.
-
XML이 웹 정보 시스템의 데이터베이스로 활용되면서 공유 부분에 대한 데이터 처리의 높은 효율성을 제공하고자 최소 단위의 접근제어 모델에 대한 연구가 판독 모드 측면에서 활발히 진행되었다. 질의 처리 연구에서는 XML 데이터베이스에 대한 갱신 질의 표준화 작업이 진행되고 있다. 본 논문은 갱신 질의 연산을 최소 단위 접근제어 모델의 연산 모드로 추가함으로써 발생하는 보이지 않는 조상 문제를 정의한다. 이를 해결하기 위한 고려 사항으로 보이지 않는 조상 노드들을 포함하는 XML 문서에 대한 갱신 연산 시 고려해야 할 특성을 갱신의 비밀성, 갱신의 무결성, 그리고 갱신의 일관성으로 정의하고 갱신 연산 수행 시 발생될 수 있는 특성 위배 상황을 정리한다.
-
유비쿼터스 환경이 도래함에 따라 데이터 흐름이 신속하고 연속적으로 변화하고 있다. 이러한 스트림형태의 데이터는 데이터의 치명적 변화, 자주 발생하지 않는 패턴 등의 관점에서 데이터 분석을 필요로 하고 있다. 본 논문에서는 다단계의 추상화 데이터 분석이 용이한 다차원 분석에 기반하여 고정적인 공간활용만이 가능했던 기존 방식을 살펴본 후 이를 유동적으로 보완하여 공간 비용을 최소화 하면서 평균응답시간을 줄여주는 방법에 대해 논의한다. 또한 제안 방법의 시공간 비용을 수식으로 증명하고 기존 방법과의 비교 실험을 통하여 성능을 평가해 본다.
-
센서 네트워크를 구성하는 센서 디바이스 상에서 보안을 유지하는데 있어서 가장 까다로운 점은 센서 노드상에서 활용할 수 있는 대역폭, 에너지 저장용량 등과 같은 리소스가 다른 컴퓨팅 장비보다 월등히 적다는 점이다. 따라서 공격자는 센서 네트워크의 위와 같은 약점을 활용하는 다양한 공격을 시스템에 가할 수 있는데 그중 대표적인 방법이 시스템에 침투한 내부공격자에 의해서 변경된 가비지 데이터를 전송하게 항으로써 정상적인 노드들의 리소스를 낭비하게 하는 공격 방식이다. 따라서 본 논문에서는 기존의 연구됐던 보안 방식들이 내부공격자에 의한 전송계층상에서 취약한 정이 있음을 발견하고 접근 제어(access control)를 이용해서 이를 보완할 수 있는 방안을 제시한다. 이렇게 제시된 방안을 기존의 종단간 보안 프로토콜과 조합하면 아주 적은 양의 추가적인 오버헤드만으로 내부공격자에 대한 내구성을 더욱 강하게 할 수 있음을 실험을 통해 검증할 수 있다.
-
본 논문에서는 수평 분산 데이터베이스에서 각 로컬 데이터베이스의 세부 데이터를 유출하지 않는 순차패턴 마이닝 기법을 제안한다. 데이터 마이닝은 대용량 데이터베이스에서 유용한 지식을 추출하는 기법으로서 각광을 받고 있다. 그러나 분산 데이터베이스를 대상으로 마이닝을 수행하는 경우, 데이터 공유에 따른 개인 혹인 집단의 프라이버시가 유출될 수 있다는 문제점이 존재한다. 따라서 본 논문에서는 프라이버시 보호를 위하여 각 로컬 데이터베이스의 세부 데이터를 보호하면서도, 마이닝 결과의 정확성을 보장할 수 있는 새로운 순차 패턴 마이닝 기법을 제안한다. 제안된 기법에서는 우선, 세부 데이터의 유출을 방지하기 위하여 마이닝의 대상이 되는 항목과 항목간의 시간 선후 관계의 성립 여부를 벡터로 표현한 후, 이들 벡터간의 스칼라 프로덕트 연산을 수행하여 얻어진 결과를 패턴의 지지도로 활용하는 방안을 제안하였다. 또한, 연산 결과에 영향을 미치지 않는 벡터를 미리 제거하여 스칼라 프로덕트 연산에 따른 비용을 감소시키는 방안을 제안하였다.
-
한국과학기술정보원(KISTI) 바이오인포매틱스센터(CCBB)에서는 생명과학 관련 주제별 Open Archiving Community의 구성과 운영을 통한 연구자들 간의 정보교환을 유도하고, 더불어 논문뿐만 아니라 세미나, 연구노트 등의 최신의 연구 정보를 공유할 수 있도록 생명과학 Open Archiving Community 시스템을 구축하여 운영하려고 한다. 본 community에서 수집, 구축, 서비스할 점보의 종류는 아티클, 학위논문 연구보고서, 발표자료, 연구노트, 실험데이터, 전자자료 등이다. 그러므로, 전 세계적으로 많이 활용되고 있는 Dublin-core, Marc21, MODS를 비교 분석하여 MODS 메타데이터를 기준으로 아티클과 같은 문헌정보 뿐만 아니라 실험결과, 연구노트 등의 비문헌정보도 유연성 있게 적용할 수 있는 생명과학 관련 주제별 Open Archiving Community를 위한 메타데이터 스키마를 설계하였다.
-
본 논문에서는 기 구축된 전자 카탈로그를 의미적 연결 관계에 기초한 확장된 전자 카탈로그로 변환하는 방법을 제안한다. 이를 통해 구축된 확장된 전자 카탈로그에서 의미적 태깅에 의한 확장된 어휘 인덱스 구축 방안과, 이를 이용한 검색 성능 향상 기법을 제안한다. 기존의 전자 카탈로그는 상품 정보가 분류별로 생성된 테이블에 저장되고 저장된 테이블로부터 생성된 키워드 인덱스로부터 검색이 이루어 졌다. 이러한 검색은 상품이 가지는 정보를 데이터베이스에 구축된 테이블에만 한정하게 되어 전자 카탈로그에 포함된 상품이나 분류간의 의미적 연결 관계들을 충분히 이용하지 못하였다 전자 카탈로그에 내재된 의미적 요소를 충분히 활용하기 위해서는 전자 카탈로그를 의미적 연결 관계에 기초한 모델로 구성할 필요가 있다. 본 논문에서는 의미적 모델 기반 전자 카탈로그 시스템으로의 전환 과정을 XML형태의 명세를 이용해 반자동적으로 전환할 수 있는 툴을 구현하며, 단순 키워드 어휘 인덱스 구축이 아닌, 어휘 인덱스의 의미적 확장을 제안하고, 이를 위한 태그 요소로써 어휘에 대한 형태소 분석 결과, 수치 환산 및 확장 요소, 속성간의 도메인 정보 등을 제시하였다. 이를 기반으로 최적의 검색 결과를 얻어 내도록 하는 인접도 평가 함수에 적용하는 방법을 제시한다.
-
지금까지의 이동체 인덱스에 대한 연구는 주로 인덱스 구성 후에 발생하는 질의 처리 효율성에 두고 있다. 다수의 이동체 인덱스에서 이동체 데이터의 갱신 연산에 의한 인덱스 재구성에 대한 디스크 접근 오버헤드를 고려하지 않았다. 이동체 데이터 처리를 위한 대표적 인덱스 구조인 R-tree는 이동체에 대한 갱신 연산 비용이 많이 든다. 이런 R-tree의 단점을 보완하기 위해 이동체가 가지는 MBR값이 동적으로 변화하는 환경에 맞추어 R트리의 갱신 비용을 절감하여 처리하는 LUR-tree가 제안되었다. 본 논문에서는 마른 데이터 생성 속도에 적합하도록 디스크 접근 오버헤드를 고려해서 LUR-tree를 관리할 수 있는 현재 인덱스에 대한 다량 삽입 기법을 제안한다. 이 기법에서는 다차원 인덱스 구조에서의 다량 삽입 기법을 위한 간단한 버퍼링 기법을 사용한다. LUR-tree의 단말 노드 정보를 관리하는 보조 인덱스를 추가하여 갱신 연산에 따른 노드의 분할과 합병을 예측한다. 예측된 결과를 바탕으로 노드의 변화를 최소화하는 방향으로 데이터의 갱신 순서를 정하여 데이터 갱신에 따른 노드의 분할과 합병을 최소화한다. 실험을 통해 제안한 기법을 이용한 다량 삽입이 기존의 다량 삽입 기법들과 비교해 인덱스의 갱신 비용을 감소시키는 것을 알 수 있다.
-
지금까지 제안된 구조조인 알고리즘들은 하나의 XML 문서에 대해 복잡한 질의를 빠르게 처리할 수 있다는 장점이 있다. 하지만, 다중 문서를 처리할 때 각 문서에 부여된 문서식별자에 의해 문서별 질의 처리를 하기 때문에, 문서의 수가 증가한다면 질의 처리 시간도 길어진다는 문제점이 발생한다. 이 논문에서는 이 문제를 해결하기 위해 XML 문서를 XMAS 트리로 병합한 뒤 전역적으로 인코딩을 하는 기법을 제안한다. XMAS 트리는 각 문서의 구조 정보를 유지한 채 공통된 부분을 공유하는 트리이다. 이 공유에 의해서 질의 처리시에 성능 향상을 얻을 수 있다. 실험 결과, 선형 질의에 대해 수백 배, 가지모양 질의에 대해 수십 배 빠르게 질의를 처리할 수 있었다.
-
생명정보 분야의 발전과 더불어 과거 축적되어 온 방대한 양의 생물학 데이터들이 이질적인 형태로 데이터베이스화 되어있다 특히, 인간게놈프로젝트의 완료 후에 유전자 및 단백질의 기능을 밝히기 위한 지노믹스 및 프로테오믹스 연구가 활발해졌다. 새로운 생물학적 과정을 탐색하기 위해서는 기존에 존재하는 생물학 데이터베이스의 데이터를 수집하기 위한 기술적인 검색 능력이 필요하다. 전산지식이 부족한 대부분의 생물학자들은 공개용 데이터베이스로부터 필요한 정보를 획득하는데 어려움을 격고 있다. 각 분야의 생물학자들이 공개용 데이터베이스로부터 자신의 분야에 관련된 데이터를 검색?추출하는 작업을 수월하게 해 줄 검색 시스템이 필요하다. 따라서, 에이전트를 이용하여 공개용 데이터베이스로부터 정보를 수집하는 사용자 중심의 개인용 검색시스템을 제안하고자 한다. 또한, 검색시스템을 이용하여 생물학자가 지노믹스와 프로테오믹스의 실험적인 접근을 위해 원하는 많은 양의 특정 도메인의 데이터를 검색하고 질의된 결과를 개인 컴퓨터에 2차 데이터베이스를 만들어 저장한다. 사용자에 의해 생성된 특정 분야의 도메인인 2차 데이터베이스를 통해 데이터의 접근의 편리성과 생물학 정보의 분석의 용이성을 얻을 수 있다.
-
공간 데이터 웨어하우스 구축기는 운영 데이터베이스의 데이터를 추출하여, 공간 데이터 웨어하우스 서버에 적재하는 과정을 효율적으로 관리하는 시스템이다. 구축기는 적재로 인한 서버의 부하를 줄이기 위하여 적재할 데이터를 임시 저장하는데, 기존 기법은 적재할 데이터를 하나의 저장 공간에 관리한다. 따라서 서버가 특정 차원 테이블에 대한 실시간 질의처리를 위해 특정 차원 테이블의 즉시 적재를 요청할 경우, 구축기는 이를 위해 임시 저장한 모든 데이터를 검색하므로 처리비용이 증가한다. 또한, 하나의 저장공간에 적재할 데이터를 유지하여 서버에 데이터 적재 시, 저장을 위해 혼합된 데이터를 분석하는 비용이 증가한다. 본 논문에서는 공간 데이터 웨어하우스 구축기에서 추출된 데이터의 효율적인 적재를 위한 테이블 단위의 데이터 관리 기법을 제안한다. 제안 기법은 운영 데이터베이스로부터 추출한 데이터를 서버에 적재할 차원 테이블 단위로 구축기에서 각각 다른 저장 공간에 관리한다. 따라서 테이블 단위의 데이터 관리로 실시간 질의처리를 위한 특정 차원 테이블의 즉시 적재 비용이 감소하며, 테이블 단위의 병렬전송이 가능하여 전송비용이 감소한다. 또한, 서버로 전송된 데이터는 테이블 단위의 벌크 삽입이 가능하여 적재시간이 감소한다.
-
시맨틱 웹의 등장에 따라 RDF와 RDF Schema(RDF/RDFS)로 표현되는 웹 데이타의 양이 증가하고 있다. 이에 웹 데이타를 효율적으로 저장, 검색할 수 있는 인덱스 구조의 필요성이 높아지고 있다. 본 연구에서는 기존의 트리 모델을 위한 소수 레이블 기법(prime number labeling scheme)을 발전시켜, RDF/RDFS 인덱스 구조를 표현할 수 있는 그래프 모델을 위한 소수 레이블 기법을 제안한다. 제안한 기법은 기존의 소수 레이블 기법을 그래프에 적용하여 구조 질의(Structural Query)를 효율적으로 처리할 수 있고, 데이타 갱신 시에 인덱스를 재구성하지 않아도 되는 장점을 가지고 있다. 그리고 이전의 RDF/RDFS 인덱스 구조에서 효율적으로 처리하기 힘들었던 순환 방향성 그래프에 대한 질의도 쉴게 처리할 수 있다.
-
메인 메모리 데이터베이스 시스템은 디스크 기반 데이터베이스 시스템에 비해 디스크 접근을 줄임으로써, 좀 더 빠른 트랜잭션 처리를 보여주고 있다. 그러나 전원 차단과 같은 장애 발생 시, 메모리의 휘발성으로 인한 데이터 손실에 항상 대비를 해야 한다. 증권, 통신사와 같이 실시간 서비스가 이루어지고, 시스템 장애가 큰 손실로 이어지는 곳에서는 장애 발생 시 데이터의 빠른 복구를 필요로 하게 된다. 본 논문은 메인 메모리 데이터베이스 시스템에서 백업 시에 인덱스의 최대키 값을 따로 저장하는 추가 작업을 통하여, 병렬처리가 가능한 CST-트리(Cache Sensitive T-tree)의 인덱스 복구 알고리즘을 제안한다.
-
전자정부 사업이 추진되면서 정부의 각급기관은 전자적으로 기록물을 생성 및 유통하고 있다. 각급기관에서 생성된 전자기록물은 관리 및 열람
${\cdot}$ 활용을 위해 자료관시스템으로 이관되며, 준영구 이상의 전자기록물은 영구보존을 위해 국가기록원으로 이관되어 보존된다. 전자기록물을 효과적으로 영구보존 및 활용하기 위해서는 여러 종류의 메타데이터가 필요한데, 이를 위해 외국에서는 전자기록물 메타데이터를 표준화하여 사용하고 있다. 본 논문에서는 전자기록물 영구보존 메타데이터 요소를 정의한 ISO 15489와 호주 빅토리아주의 메타데이터 및 우리의 메타데이터를 분석하여 우리의 현실에 맞는 메타데이터를 제안하고자 한다. -
대용량 데이타에 대한 복잡한 질의 처리가 요구되는 응용에서 빠른 시간 안에 응답을 돌려주기 위해, 데이타를 작은 크기로 근사하여 질의를 처리하는 방법이 연구되고 있다. 빠른 응답을 위해 주어진 저장 공간의 제약 하에서 얼마나 원본 데이타와 유사하게 근사할 수 있는지가 데이타 근사의 성능을 결정한다. 본 논문에서는 데이타 근사에서 유사도의 척도 중 하나인 최대 상대 오차를 줄이기 위하여 Haar 웨이블릿을 변형한 조화 웨이블릿 기법을 제안한다. 조화 웨이블릿은 데이타 변환 과정 중 조화평균을 이용하여 상대 오차 정보를 손쉽게 얻어낼 수 있어 근사 데이타의 상대 오차를 최소화하는 데 적합한 기법이다.
-
XML 문서를 저장할 때 XML 데이터의 구조적인 검증을 위해서 DTD나 XML Schema를 같이 저장하는 방식이 사용된다. 그러나 스키마의 갱신이 발생할 경우는 기존 저장방식에서는 그 자체에 유효성을 검증하기 위한 메커니즘을 가지고 있지 않기에 파일로 추출하여 수정 후 XML Parser로 검증하고 다시 저장하는 비효율적인 과정을 거쳐야 하였다. 또한 스키마의 변경에 따라 이와 연계된 XML 데이터도 유효성을 보장할 수 없는 문제점이 발생하였다. 본 논문에서는 DBMS에 저장되어 있는 XML Schema를 갱신 할때 파일로 추출할 필요없이 SQL문에 의해 갱신이 되는 그 자체로 유효성을 보장할 수 있고, 이와 연결된 XML 데이터의 유효성 검증이 같이 이루어질 수 있는 효율적인 갱신기법을 설계한다. XML Schema 검증은 관계형 데이터베이스의 여러 제약 조건들에 의해서 이루어지고, XML 데이터는 스키마 갱신 내용에 따라 검증작업 필요성을 먼저 확인 후에 각 스키마 타입에 따라 유효성을 확인하는 갱신이 이루어지도록 설계되어 불필요한 작업에 의한 오버헤드를 사전에 방지하였다.
-
전력산업이 전력회사 중심에서 고객 중심의 비즈니스 서비스로 변함에 따라 고객의 요구 충족을 위한 고기능 전력정보서비스 제공의 필요성이 점차적으로 증대되고 또한 데이터 중심에서 정보, 지식 등 특화된 분석정보 제공은 필수불가결한 요소가 되고 있다. 따라서 효율적 활용과 공용을 전제로 검침데이터에 대한 실시간 처리와 효율적 통합관리기술이 필요하다 하겠다. 본 논문은 전력산업 부가가치를 높일 수 있는 무한한 잠재력을 지닌 전략적 자산으로서 검침데이터에 대한 정확한 처리와 효율적 지원으로 고객서비스의 질을 한 차원 높이는 동기를 마련하는 한편, 검침데이터의 활용과 이용효율성을 극대화하는 방안을 제시하며, 현재 적극적으로 추진되고 있는 전력부가서비스 산업의 활성화에 효과적으로 이용될 것으로 기대한다.
-
인터넷 환경에서의 B2B Market Place의 출현은 판매자와 구매자와의 다자간 거래를 가능하게 하였다. 이러한 기반에서 상품정보를 포함하는 전자 카탈로그의 활용은 나날이 증가하고 있다. 그러나 동일한 상품에 대한 분류체계와 기준이 다르므로 전자카탈로그에 대한 재분류는 고비용을 초래하는 필수 불가결한 문제로 남게 되었다. 본 연구에서는 이러한 문제를 해결하기 위해 기계학습 기법을 이용한
$Na\ddot{i}ve$ Bayesian classifier 모델을 사용하였다 학습 데이터를 생성해야 하는$Na\ddot{i}ve$ Bayesian 알고리즘 적용 시 전자 카탈로그는 일반 문서보다 상대적으로 학습 정보가 적으므로 데이터 모델의 확장을 통해 학습 정보를 생성하여 이러한 단점을 보완하였다. 전자 카탈로그 자동분류에 있어서 효과적이고 풍부한 양의 학습 데이터를 생성하는 것이 분류 정확도 향상에 중요한 영향을 미침을 실험을 통해 확인하였다. -
공공 부문이나 대기업에서 운영하는 웹 사이트의 규모가 커지면서 분야별로 사이트가 나누어지게 되는데, 사이트를 이동할 때 마다 로그인을 다시 해야 하는 불편이 있다. 따라서 최근 이용자들의 불편을 줄이기 위하여 SSO (Single Sing-On) 통합인증 체제를 도입하는 사례가 늘고 있다. 통합 인증 시스템을 구축하면서 다수 웹 사이트의 회원을 통합하고 이에 대한 회원 정보 DB를 구축하여야 하는데, 빠른 인증서비스를 위해서 LDAP(Lightweight Directory Access Protocol)를 사용하는 것이 일반적이다. 이때 회원정보 DB와 LDAP의 정보에 대한 동기화 문제와 웹 사이트를 통한 회원가입과 동시에 적용되어야 하는 요구사항을 만족시키기 위해 본 논문에서는 회원 정보 DB와 LDAP의 정보 사이의 동기화 방법을 제안하고 구현하여 그 성능을 분석하였다.
-
XML is situating a standard fur data exchange in the Web. Most applications use database to manage XML documents of high-capacity efficiently. Therefore, most applications create label that expresses structure information of XML data and stores with information of XML document. A number of labeling schemes have been designed to label the element nodes such that the relationships between nodes can be easily determined by comparing their labels. With the increased popularity of XML data on the web, finding a labeling scheme that is able to support order-sensitive queries in the presence of dynamic updates becomes urgent. XML documents that most applications use have many properties as their application. So, in the thesis, we present the most efficient updating methods dependent on properties of XML documents in practical application by choosing a representative labeling method and applying these properties. The result of our test is based on XML data management system, so it expect not only used directly in practical application, but a standard to select the most proper methods for environment of application to develop a new exclusive XML database or use XML.
-
비즈니스 프로세스를 연구하는데 있어 최근의 이슈는 비즈니스 프로세스가 복잡화되고 대량화됨에 따라, 비즈니스 프로세스를 좀더 효율적으로 개선하고자 하는 데에 맞춰져 있으며, 이러한 동향에 힘입어 워크플로우 마이닝이라는 연구분야가 생겨나게 되었다. 이에, 본 논문에서는 워크플로우 패턴을 기반으로 한 워크플로우 마이닝 기법에 관하여 연구하고, 기술한다. 첫째로, 기본적으로 워크플로우 마이닝 기술과 그의 근원이 되는 워크플로우 로그에 관하여 간략히 설명한다. 그리고, 패턴기반 워크플로우 마이닝을 하기 위한 기본적인 워크플로우 패턴에 관하여 기술하고, 패턴 기반 워크플로우 마이닝을 하기 위한 기법으로 몇 가지 알고리즘을 제시한다.
-
현재의 급변하고 있는 비즈니스 환경은 기업 내부의 인트라적인 업무 처리 뿐만 아니라, 기업과 기업간의 상호교환을 통한 업무 수행을 요구하고 있으며, 이러한 요구 사항에 적절하게 대응할 수 있는 전략 개념이 프로세스 상호운용성이다. 본 논문에서는 현재의 비즈니스 시장에서 이슈화되고 있는 프로세스 상호운용성을 실제적으로 구현하고자 하는 과정의 일환으로 워크플로우 표준 단체인 WfMC(Workflow Management Coalition)에서 제안하는 상호운용성 표준 메시지 프로토콜인 Wf-XML 2.0을 지원하는 프로세스 엔진의 시스템 아키텍쳐를 구성하고자 하며, 기반이 되는 프로세스 엔진은 자체 연구 제작된 e-chautauqua라는 워크플로우 시스템을 이용하여 프로세스 상호운용성이 가능할 수 있도록 확장 설계하고자 한다.
-
본 논문은 원자력발전소 비상디젤발전기의 신뢰도 및 성능변화 추이를 감시하고, 이에 필요한 데이터를 관리하는 비상디젤발전기 신뢰도 프로그램 개발에 관하여 기술하였다. 이 프로그램은 인트라넷 기술을 이용하여 신뢰도 감시, 성능 감시, 그리고 관련정보로 크게 3가지 모듈로 구분하여 개발하였다. 현재 이를 통하여 원전 비상디젤발전기의 운전 및 정기점검 데이터를 입력 관리할 수 있도록 서비스를 개시하였으며, 이미 기존에 입력된 데이터를 이용하여 신뢰도 및 이용 불능도를 계산할 수 있고 또한 성능변화 추이를 감시할 수 있다.
-
본 논문은 모양 특성을 이용한 효과적인 식물 잎 이미지 검색 시스템을 제시한다. 잎 이미지의 더 효과적인 표현을 위해 개선된 MPP 알고리즘을 제안하고, 매칭에 소요되는 시간을 줄이기 위해 기존의 Nearest Neighbor(NN) 검색을 수정한 동적인 매칭 알고리즘을 제시한다. 특히, 더 나은 정확율과 효율성을 위해, 잎 모양과 잎차례를 스케치하여 질의할 수 있도록 하였다. 실험에서는 제안한 알고리즘과 기존의 알고리즘인 Fourier Descriptor, Moment Invariants, MPP와 비교하였다. 1000여개의 식물 잎 이미지를 통한 실험결과는 제안한 방법이 기존의 기법보다 더 좋은 성능임을 보였다.
-
최근 LBS(Location Based Service) 밑 텔레매틱스 응용의 효과적인 지원을 위해, 도로, 철도와 같은 공간 네트워크 데이터베이스에 관한 연구가 활발히 수행 중에 있다. 한편 공간 네트워크 데이터베이스에 대한 효율적인 접근을 위해, 공간 네트워크 자체의 데이터, POI 데이터, 이동 객체 데이터를 효율적으로 저장 및 색인하는 구조가 설계되었다[1]. 따라서 본 논문에서는 설계된 공간 네트워크 데이터베이스를 위한 저장/색인 구조를 구현하고 이를 공간 네트워크 자체의 데이터 검색, POI 데이터 검색, 이동 객체 궤적 검색 관점에서 성능평가를 수행한다. 아울러 기존에 연구되었던 접근 기법과 검색 성능을 비교한다.
-
지난 20년 동안 공간 데이터베이스에서 유클리디언(Euclidean) 공간 기반의 연구가 활발히 진행되어 왔으며, 최근에는 실제 응용에 적용하기 위해 도로 네트워크 기반의 질의 처리 알고리즘의 연구가 활발히 수행중이다. 본 논문에서는 도로 네트워크에서 제시된 기존 범위 질의처리 알고리즘의 성능을 향상시키기 위해, Materialization 기법을 이용한 효율적인 범위 질의 처리 알고리즘을 제안한다. 아울러 성능 평가를 통하여 Materialization 기법을 이용한 제안하는 알고리즘이 기존 알고리즘보다 검색 성능이 우수함을 보인다.
-
최근 LBS(location-based service) 및 텔레매틱스(telematics) 응용의 효과적인 지원을 위해, 이상적인 유클리디언(Euclidean) 공간 대신, 실제 도로나 철도와 같은 공간 네트워크(network)를 고려한 연구가 활발하게 수행중이다. 본 논문에서는 공간 네트워크를 고려한 기존 k-최근접 질의 처리 알고리즘의 문제점을 제시하고, 공간 네트워크 데이터베이스에 보다 효율적인 새로운 k-최근접 질의 처리 알고리즘을 제안한다. 제안하는 질의처리 알고리즘은 순서정보 및 Materialization 기법에 근거하며 기존 방법의 검색 성능을 향상시킨 방법이다. 마지막으로 제안하는 k-최근접 알고리즘을 기존의 알고리즘과 성능 비교를 수행한다.
-
다차원 온라인 분석처리 시스템(MOLAP)에서 집계 연산은 중요한 기본 연산이다. 기존의 MOLAP 집계 연산은 다차원 배열구조를 기반으로 한 파일구조에 대해서 연구되어 왔다. 다차원 배열구조는 편중된 분포를 갖는 데이터에서는 잘 동작하지 못한다는 단점이 있다. 본 논문에서는 편중된 분포에도 잘 동작하는 다차원 파일구조를 사용한 MOLAP 저장구조의 물리적 설계기법을 제안한다. 실험결과에 의하면 이차원 파일구조의 경우 집계 연산처리를 위한 저장구조의 성능이 일곱 배 이상까지 향상됨을 확인하였다. 삼차원 이상의 파일구조에 대해서는 더욱더 큰 성능향상이 예상된다. 이러한 성능의 향상은 제안된 MOLAP 저장구조의 물리적 설계기법이 매우 유용함을 나타내는 것이다.
-
현재 웹을 사용하는 사람, 디지털 컨텐츠, 정보의 생성이 계속적으로 증가하여 오고 있다. 최근 웹 데이터는 멀티미디어 데이터(비디오, 오디오, 웹TV, 이미지 등)라고 말해도 무방할 것이다. 이런 방대한 멀티미디어 데이터의 검색은 사용자들에게는 아주 중요한 작업이 되었으며, 효과적인 멀티미디어 검색 시스템의 필요성이 대두되고 있다. 최근까지의 멀티미디어 데이터 검색은 내용
${\cdot}$ 주석기반의 검색이 주를 이루고 있다. 하지만 내용${\cdot}$ 주석 기반 검색은 의미${\cdot}$ 추론적 검색에서는 부족함을 보여주고 있는 실정이다. 따라서 본 논문에서는 검색 방법 중에서도 주석 기반 검색에서 가지는 문제점을 살펴보고 그에 대한 해결 알고리즘과 프레임워크를 제안한다. -
무선인터넷의 발달과 더불어
$ad\_hoc$ 네트워크 응용이 점차 늘어나고 있다. 본 연구에서는 PDA를 이용하여$ad\_hoc$ 네트워크 환경을 구축하고 데이터를 공유하며 동기화하는 응용으로 골프 플레이어간의 스코어를 공유하는 응용을 구축하였다. 기존의 골프 점수 관리 프로그램들은 골프장 정보, 플레이어 정보 등을 클라이언트/서버 환경으로 PC에서 다운받거나 유무선 인터넷, 적외선 통신으로 골프 게임에 관련된 정보를 관리하였다. 본 논문의 골프 스코어 관리 응용 프로그램은 블루투스를 이용하여 무선 네트워크를 구축함으로써 실시간$ad\_hoc$ 환경에서 고정 서버의 도움 없이 골프 스코어 공유를 가능하게 하였다. -
AVASWI 시스템이 기존의 아바타 시스템과 다른 점은 아바타를 표현하기 위하여 GIF나 Flash등을 이용하지 않고 W3C의 2D 그래픽 표준인 SVG를 이용하는 것이다. SVG는 XML의 서브셋으로서 SVG를 저장하기 위해서는 XML을 위한 저장소를 이용할 수 있으나, SVG는 기존의 다른 XML과 다르게 속성과 그에 대한 값이 매우 중요한 역할을 수행한다. 이에 본 논문에서는 SVG를 효과적으로 저장하기 위하여 기존의 Shared-Inlining방법을 확장한 Extended-Inlining방법을 설계, 구현하였다.
-
전자메일이 일상의 연락수단일 뿐만 아니라 여러 가지 목적의 업무처리에 있어서도 중요한 통신수단으로 이용되고 있다. 이에 따라 전자메일의 중요도를 자동적으로 판정하는 문서 필터링 방법이 연구되고 있다. 본 논문은 수신된 메일문서에서 송신처, 제목, 문서유형, 시간제한 둥의 다중속성을 조합하여 구조적인 지식을 생성하여 전자메일을 자동으로 필터링하는 시스템을 구현한다.
-
모바일 컴퓨팅 환경에서 Invalidation Report(IR)의 사용은 무선대역폭과 배터리 사용 측면에서 효율적인 방법임이 증명되어 왔다. 그러나, IR기반의 방법은 긴 응답시간과 낮은 캐쉬 가용성을 가지며, 또한 클라이언트가 충분한 캐쉬를 가지고 있다고 해도 짧은 응답시간을 요구하는 응용프로그램에는 적합하지 않다는 단점을 가진다. 본 논문에는 이러한 문제를 해결하기 위해 효율적인 캐쉬 사용이 가능한 프로토콜을 제안하였다. 제안한 기법에서 클라이언트는 수동적으로 IR을 기다려 캐쉬를 사용하지 않고 보다 능동적으로 캐쉬를 사용한다. 이러한 기법을 통해 우리는 필요 없는 응답시간 지연을 야기하는 " false alarm"를 제거 할 수 있었다. 제안된 한계치 기반 방법을 통해 우리는 약간의 데이터 현재성을 손해 보았지만, 응답시간을 최적화 할 수 있었다. 제안한 기법을 평가하기 위한 시뮬레이션 결과는 우리가 제안한 기법의 아주 적은 현재성 손해를 보지만. 응답시간을 크게 줄일 수 있다는 것을 보여준다.
-
오늘날 XML이 디지털 정보교환의 표준으로 자리잡은 후 XML문서를 데이터베이스에 저장하고 원하는 정보를 효율적으로 질의하기 위한 연구가 활발히 진행되고 있다. 특히 XML질의어를 RDBMS 상에서 처리하기 위해 그리고 XML문서정보를 정확하게 추출하여 효율적으로 관리하기 위해 다양한 기법을 동원한 XML 인덱스 Table의 연구가 계속 되고 있다. 하지만 아무리 설계가 잘 된 XML인덱스 table이라 할지라도 이에 저장될 정보들을 XML문서로부터 빠른 시간에 파싱하여 관계형 테이블에 로드하기가 쉽지 않다. 이에 본 논문에서는 RDMS환경에서 XML문서를 관리하고 질의를 처리할 수 있도록 XML 인덱스 table을 디자인하였으며 이에 정확한 값이 좋은 성능을 가지면서 저장되도록 XML문서의 데이터 정보를 추출하는 XML Analyzer를 설계 및 구현하였다. 우선 Analyzer를 구현하기 위해서는 XML Parser를 사용해야 되는데 본 장에서는 이벤트 기반 방식인 SAX를 통해 XML문서를 파싱하여 데이터를 추출하고 그 결과값을 RDMS상의 XML 인덱스 Table에 저장한다. 마지막으로 이를 실제 구현하고 Test한 내용을 근거로 하여 본 장에서 소개하는 XML Analyzer가 다른 방식보다 성능면에서 훨씬 우수하다라는 사실을 입증한다.
-
오늘날 HTML을 대체하기 위해 등장한 XML은 디지털 정보교환 형식의 표준으로 자리 잡은 후 XML 문서를 데이터베이스에 저장하고 원하는 정보를 효율적으로 질의한 후 결과를 출력하는 연구가 활발히 진행되고 있다. 본 논문에서는 XML 문서를 미리 설계되어진 Analyzer를 이용해서 관계형 테이블에 저장한 후 사용자가 XQuery를 사용하여 질의를 한다. 변환기에 의해서 SQL로 데이터베이스에 질의를 하게 되고 그 결과는 테이블에서 다시 XML 형태로 재생성하여 사용자는 XML 형태의 결과를 볼 수 있다. 본 논문에서는 XQuery로 질의한 결과를 다시 XML로 재생성하는 기법에 대한 설명과 관련 테이블의 구조와 구현 과정을 비롯하여 접기서 제시한 재생성 기법을 recursive function으로 구현한 경우와 반복문으로 구현한 경우를 테스트하여 recursive function으로 구현한 경우가 반복문으로 구현한 경우보다 재생성하는 시간이 빠르다는 것을 확인하고 보다 효율적이라는 결론을 제시한다.
-
XML은 데이터 교환을 위한 표준으로서 데이터를 효과적으로 조직하고 표현 할 수 있다. 본 논문에서는 XML 데이터를 무선방송하기위한 스트림을 생성하는 시뮬레이션 시스템을 설계하고 구현한다. 구현한 시스템은 서버 모듈과 클라이언트 모듈로 구성되는데 서버 모듈은 XML 데이터에 대하여 스트림을 생성하는 역할을 하고 클라이언트 모듈은 생성된 스트링에 대해서 질의를 수행하고 생성된 스트림으로부터 XML 데이터를 복구하는 역할을 한다. 질의 수행에 대한 결과로 결과 XML 데이터가 출력되고 성능 평가요소로 질의를 수행하는 동안 걸린 수행시간을 측정할 수 있다.
-
본 논문에서는 단일 색인을 사용하는 정규화 변환 지원 서브시퀀스 매칭 방법을 제안한다. 기존의 정규화 변환 지원 서브시퀀스 매칭 방법은 질의 시퀀스 길이가 커질수록 성능이 저하되고, 이를 해결하기 위하여 여러개의 색인을 사용하는 방법을 취하였다. 본 논문에서는 하나의 색인을 사용하면서도 다양한 길이의 정규화 변환 지원 서브시퀀스 매칭을 수행하는 효율적인 방법을 제시한다. 이를 위하여, 본 논문에서는 정규화 변환의 정의를 확장하여 일반화 정규화 변환 개념을 제시한다. 또한, 이러한 일반화 정규화 변환 개념을 기존 서브시퀀스 매칭 방법들에 적용하는 방안에 대한 이론적 근거를 각각의 정리로서 제시하고 증명하였다. 그리고, 이들 방안을 구현하기 위한 색인 구성 알고리즘 및 서브시퀀스 매칭 알고리즘을 각각 제시하였다. 본 논문에서 제안한 정규화 변환 지원 서브시퀀스 매칭은 다른 변환을 지원하는 서브시퀀스 매칭으로 일반화 될 수 있는 우수한 연구결과라 사료된다.
-
전자상거래에서 전자카탈로그는 중요한 컴포넌트이다. 전자카탈로그를 상품 온톨로지 기반으로 표현하면 다양한 관계표현으로 인해 더 풍부한 정보 및 관계표현이 가능해진다. 본 논문에서는 전자카탈로그 도메인에서의 상품 온톨로지 모델을 구현, 운용하는 시스템에서 제공되어야 하는 질의를 분석 정리하였다. 이를 위해 상품 온톨로지 기반의 전자상거래 시스템의 다양한 응용 프로그램에서 상품 카탈로그를 보여주기 위해 필요한 질의와 상품 정보 및 온톨로지 관리를 위해 필요한 질의를 포함한다.
-
ROLAP 시스템에서는 다차원 OLAP 큐브를 관계 데이터베이스 내에 여러 집계 테이블을 사용하여 저장하며, 관계 DBMS 기능을 그대로 이용하므로 구현이 간단하다. 이들 집계 테이블들은 대용량의 소스 데이타(즉, 사실 테이블)를 정렬한 후 이에 대한 집계 값을 계산하므로 큐브를 생성하는데 많은 시간이 소요된다. 이러한 다차원 큐브를 효율적으로 생성할 수 있는 여러 가지 방법이 제안되었다. 이들 방법들은 큐브 생성 시간이 사실 테이블을 정렬하는데 주로 소요되므로 이 횟수를 줄이는 기법을 주로 제안하였다. 그러나 이러한 큐브 생성 알고리즘의 성능은 실제 DBMS 상에서 평가되지 않았다. 이 연구에서는 기존의 큐브 생성 알고리즘들을 관계 DBMS 상에서 그 성능을 비교 평가하였다.
-
워크플로우 관리시스템(Workflow Management System)은 업무 프로세스를 실행하기 위해 사전에 정의된 룰에 따라 태스크들을 수행하는 시스템으로, 프로세스 정의를 interpreter하고 워크플로우 참석자들과 상호작용하며 해당 응용 프로그램을 invoke할 수 있는 시스템이다. 정의된 업무를 수행하기 위해서는 사전에 프로세스 정의 및 모델링이 필요하다. 프로세스 모델링이란 조직의 목표 달성을 위해 다양한 비즈니스 규칙에 의해 정의된 상호연관이 있는 작업들의 수행과정을 정의하는 것으로 본 논문에서는 업무 프로세스를 모델링하고 관리하기 위한 비즈니스 프로세스 모델링 도구를 설계하고 구현하였다.
-
The method find powerful patent or patent information analysis system using patent citation analysis산업이 발전함에 따라 지적재산권에 대한 가치는 점점 중요해지고 있고, 기업의 흥망성쇄를 결정짓는 가장 큰 요인중 하나로 자리잡고 있다. 엄청난 비용을 투자하여 사업화하고 있던 세계 굴지의 기업들도 경쟁회사의 핵심특허 단 몇 건만으로 순식간에 몰락하는 경우도 발생하고 있다. 이제 지적재산권은 살아남기 위한 유일한 방어수단이자 공격수단이 되었다. 이와 같은 급박한 상황하에서 각 기업은 경쟁회사의 지적재산권을 분석하고, 이를 통해 자사의 연구개발 전략을 수립하기 위해 노력하고 있다. 그러나 이와 같은 분석작업은 다수의 전문가 일지라도 상당한 시일이 소요되는 방대한 작업이며, 이를 자동으로 실행하기 위해 많은 소프트웨어 회사들은 특허분석용 툴을 개발하였다. 그러나 이들 종래의 특허분석용 툴들은 대부분 외형적인 정량분석 정보만을 제공할 뿐, 실제 필요로 하는 정성적인 정보는 거의 제공하지 못하였다. 즉, 종래의 특허분석용 툴에서는 자사 및 경쟁사의 특허에 대한 가치가 어느 정도이며, 경쟁회사 특허에 대해 자사 제품의 칭해 가능성은 어느 정도이며 회피할 수 있는 전략은 무엇인지, 자사 특허에 대한 경쟁사 제품의 침해 가능성은 어느 정도인지 등을 제공하지 못하였다. 이에 본 논문에서는 특허 출원시 인용했던 선행특허들의 인용 관계를 분석하여 특허간 관계를 규명하고, 각 기술 분야에서 영향력이 높은 특허를 찾는 방법과 시스템을 제시하고자 한다.
-
센서 네트워크에서 집계(aggregation) 연산은 센서 네트워크를 데이터베이스로 구현하는데 있어서 중요하게 제공되어져야 하는 서비스이다 현재 연구되고 있는 것으로 집계 연산을 센서 네트워크의 특징상으로 분류하여 근접한 결과값을 받는 것을 허용하고 집계 값을 자식노드가 부모노드로 보내는 기간을 부모노드가 자식노드에게 나누어 할당하여 센서 네트워크상에 적절히 구현하는 것에 대해 알아보고 집계 그루핑을 하는 과정에서 데이터웨어하우징 연구의 최신기술인 점진적인 덜 관리 기법을 통해 센서노드들의 평균값에 대해 새로운 값이 추가될 때 다시 모든 값을 계산하기 않고 변경된 값만 적용하여 계산함으로 좀더 에너지 효율적으로 확장하는 것을 제안하였다.
-
검색된 정보의 정확성과 검색 속도는 정보 검색 시스템의 성능 평가에 있어서 매우 중요한 요소이다. MPEG-7 시각 정보 기술자는 예제 기반 이미지/비디오 검색 시스템을 구성할 때 사용할 수 있는 저급 수준시각 정보에 대한 표준화된 기술을 의미한다. 제안된 기술자는 검색 결과의 정확성에 대해서는 검증을 받은 상태이지만, 고차원 데이터이거나 시간 복잡도가 큰 매칭 함수를 가지고 있어 순차 검색을 할 경우 매우 많은 검색시간을 필요로 한다. 일반적으로 이러한 문제를 해결하기 위해 인덱스 정보를 구성하여 검색에 적용하는 방법이 주로 사용된다. 본 논문에서는 MPEG-7 시각 정보 기술자중 이미지 검색 시스템에 이용할 수 있는 색상 기술자와 텍스쳐 기술자, 그리고 외형 기술자를 인덱스 정보 구성 관점에서 분석하였다.
-
XML 문서의 검색을 위한 질의 언어인 XQuery는 다양한 데이터 소스로부터 가져온 고유한 구조를 가진 질의 결과로 구성할 수 있도록 설계되어 XML질의 언어의 표준이 되었다. 현재 XQuery는 반복문 등을 포함하는 과다한 검색기능을 지원하도록 함으로써 질의 표현이 상대적으로 복잡한 형태를 취한다. 따라서 일반적인 SQL처럼 XQuery에 명시적인 group by절을 도입한 질의 표현기법을 모색하여 XML데이터의 재구성과 집계함수 처리론 위한 그룹화를 보다 쉽게 구성할 수 있도록 하고자 하였다.
-
Jeong Chang-Hoo;Choi Yun-Soo;Seo Jeong-Hyeon;Jin Du-Seok;Kim Kwang-Young;Joo Won-Kyun;Lee Min-Ho 181
다양한 응용 분야에서 점차 증가하고 있는 XML 문서를 효과적으로 저장하고 검색하는 방법에 대한 연구가 많이 이루어지고 있다. XML 문서의 정보를 데이터베이스에 저장하는 방법으로 분할 저장 방식과 비분할 저장 방식이 있는데, 본 논문에서는 두 가지 방법의 중간자적인 형태를 취함으로써 문서의 구조적인 정보를 효과적으로 표현하고, 검색 결과 재구성 시에 발생하는 오버헤드를 제거할 수 있는 시스템에 대해서 설명하도록 한다. 복잡한 계층 구조의 XML 문서를 서비스의 목적에 따라서 중요하다고 판단되는 단편노드의 단위로 구분하고 단편노드 안에 존재하는 세부 엘리먼트 및 속성에 대해서 별칭을 사용하는 검색 필드를 미리 구성해 놓음으로써, XML 문서의 구조적 특성을 명확하게 알지 못하거나 질의어 작성에 익숙하지 못한 사용자에게 보다 사용하기 편리한 XML 문서 검색 서비스를 제공할 수 있다. -
본 논문에서는 국가 출연연구소에서 수행하고 있는 연구과제들의 기본적인 정보와 각 연구과제에서 산출된 다양한 연구결과(논문, 세미나, 지적재산권 및 기술이전) 정보를 수집/관리하고 이를 다양한 형태의 정보로 기관 정보 관리자, 연구자, 일반 대중물 대상으로 서비스하는 시스템에 대해 소개하고자 한다. 본 시스템을 구축하여 서비스함으로써 산발적으로 수행되어 오던 연구개발 정보를 통합 서비스할 수 있는 기반이 마련될 수 있고, 이로 인해 다양한 연구 분야의 결과를 보다 입게 접할 수 있어 연구결과의 효과적인 전파 및 새로운 융합기술연구 유도에 도움을 줄 수 있게 될 것이다. 또한 체계적인 정보 수집 방안을 마련하고 수집된 정보에 대한 검색 및 조회 서비스, 연구 성과 통계제공, 기관별 연구 성과 비교 등의 서비스를 제공함으로써 향후 국가차원의 연구개발 정책 추진 및 지원에 필요한 보다 객관적인 근거를 제공할 수 있게 될 것이다.
-
인터넷 및 분산 환경에서 XML은 애플리케이션 간의 자료 저장 및 자료 교환을 위한 표준으로써, XML 문에 대한 연구가 활발히 진행되고 있다. 따라서 이기종 관계형 데이터베이스 시스템들 간의 메타데이터 및 데이터 교환을 위해 W3C에서 제안한 XML Schema를 사용한다. XML Schema는 평면적 구조인 관계형 데이터베이스 시스템의 메타데이터 및 데이터를 계층적 구조인 XML 문서형식으로 나타낼 수 있는 메커니즘을 가지고 있으며, 다양한 원시 데이터 형식을 지원하여 관계형 데이터베이스 시스템이 제공하는 데이터형식을 충분히 반영할 수 있는 구조를 가지고 있다. 또한 기존의 이질적인 전자상거래 플랫폼을 사용하므로 인해 발생하는 시스템간의 상호 호환 및 운영의 어려움이 있다. 그러나 분산 환경에서 이질적인 특성을 해결하기 위해서 XML을 기반으로 하는 쇼핑몰들의 통합된 정보를 검색할 수 있는 사이트가 등장하고 있어 고객들이 구매하고자 하는 상품에 대한 정보를 보다 쉽게 검색할 수 있도록 각종 쇼핑몰 사이트를 연결하여 통합하는 과정이 진행 중이다. 따라서 상품을 검색할 때 메타데이터를 이용하여 선택에 필요한 정보를 고객에게 제공함으로서 상품을 효율적으로 검색할 수 있다. 따라서 XML기반으로 분산된 이 기증의 시스템들을 온톨로지(Ontology)기반의 메타데이터를 이용하여 상품을 검색할 수 있는 시스템을 제안하고, 온톨로지 기반의 메타데이터 XMDR(eXtended MetaData Registry)을 이용한 상품 검색 시스템을 효율적으로 검색하기 위한 온톨로지 서버 구축에 관한 방법을 제안한다.
-
현재 기업 내의 정보 시스템들은 개별적이고 다양한 형태의 데이터베이스를 활용하여 업무적으로 발생하는 대량의 데이터를 저장하고 관리하고 있다. 이렇게 개별적으로 존재하는 데이터베이스에 저장된 데이터들을 교환 위해 기업들은 EAI, 데이터웨어하우징 등의 기술을 활용하고 있다. 하지만 이러한 기술들은 도입 비용 및 유지관리에 많은 비용을 요구할 뿐만 아니라 각 벤더들마다 요구하는 환경이 상이하다는 문제점을 가지고 있다. 본 논문에서는 기존 기술들의 이러한 문제점을 해결하기 위해 기업 내에 분산되어 존재하는 관계형 데이터베이스간의 데이터를 교환하기 위한 방법으로 웹 서비스 기반의 RDB간의 데이터 교환 시스템을 설계한다. 웹 서비스를 사용함으로써 기업들은 기존의 웹 환경을 활용할 수 있으므로 도입 비용 및 유지관리 비용을 절감할 수 있고 XML 포맷을 사용함으로 플랫폼 및 시스템 환경, 사용언어에 독립적으로 데이터를 교환할 수 있다.
-
서브시퀀스 매칭은 주어진 질의 시퀀스와 변화의 추세가 유사한 서브시퀀스들을 시계열 데이터베이스로부터 검색하는 연산이다. 본 논문에서는 크기 효과로 인한 서브시퀀스 매칭의 심각한 성능 저하 현상을 정량적으로 관찰하여, 하나의 윈도우 크기를 대상으로 만든 단 하나의 인덱스만을 이용하는 것은 실제 응용에서 만족할만한 성능을 제공할 수 없다는 것을 규명하였다. 또한, 이러한 문제로 인해 다양한 윈도우 크기를 기반으로 다수의 인덱스들을 구성하여 서브시퀀스 매칭을 수행하는 인덱스 보간법의 응용이 필요함을 보였다. 인덱스 보간법을 응용하여 서비시퀀스 매칭을 수행하기 위해서는 먼저 다수의 인덱스들을 위한 윈도우 크기들을 결정해야 한다. 본 연구에서는 물리적 데이터베이스 설계방식을 이용하여 이러한 최적의 다수의 윈도우 크기들을 선정하는 문제를 해결하였다. 이를 위하여 시계열 데이터베이스에서 수행될 예정인 질의 시퀀스들의 집합과 인덱스 구성의 기반이 되는 윈도우들의 크기의 집합이 주어질 때, 전체 서브시퀀스 매칭들을 수행하는 데에 소요되는 비용을 예측할 수 있는 공식을 산출하였다. 또한, 이 비용 공식을 이용하여 전체 서브시퀀스 매칭들의 성능을 극대화 할 수 있는 최적의 윈도우 크기들을 결정하는 알고리즘을 제안하였으며, 이 알고리즘의 최적성과 효율성을 이론적으로 규명하였다. 끝으로, 실험에 의한 성능 평가를 제안된 기법의 우수성을 제시하였다.
-
최근 GIS는 털러 분야에서 다양하게 운용되고 있다 최근에는 인터넷을 통한 정보 시스템의 요구가 급증하고 있으며, 웹 환경에서의 지리정보의 공유로 활용방안에 대한 연구가 활발히 이루어지고 있다. 특히, 지리정보의 활용을 위해 웹 지도 서비스의 요구가 증대되고 있다. 이를 위해 OGC(Open GIS Consortium)에서는 WMS(Web Map Service) 명세를 제시하고 있다. 그러나, 현재 제시되고 있는 WMS 명세만으로는 최근 발전하고 있는 모바일 환경에서의 적용이 어렵기 때문에 WMS의 인터페이스의 확장이 필요하다. WMS 확장을 위해 본 논문에서는 기존의 WMS를 분석하고 이를 바탕으로 모바일 환경에 적합한 WMS 확장 인터페이스의 방안을 제시한다. 또한, 확장 인터페이스를 바탕으로 모바일 환경을 위한 WMS 구조를 설계하고 개발한다. 본 논문에서 제안하는 WMS의 확장 인터페이스 및 이를 기반으로 하는 WMS 구조는 사용자들의 요구에 적합한 WMS 개발에 기초 자료로 사용될 것으로 기대된다.
-
유비쿼터스 환경의 시발점인 홈 네트워크 기술은 홈서버를 중심의 댁내 모든 가전기기들을 하나의 네트워크로 연결함으로써 사용자가 언제 어디에서 단말 기기를 이용하여 댁내의 상황을 모니터링하고 모든 기기들을 제어할 수 있게 해주는 기술이다. 홈 네트워크의 핵심인 홈서버는 다양한 가전기기로부터 다량의 멀티미디어 콘텐츠를 저장하며, 다른 홈서버 또는 모바일 단말을 이용하여 검색과 공유가 가능하다. 그러나, 홈서버와 각 모바일 단말이 가지는 콘텐츠에 대한 메타데이터는 일관성을 가지지 않기 때문에 콘텐츠 검색이 용이하지 않고, 사용자가 직접 메타데이터 간의 유사성을 파악해야하는 문제점이 있다. 또한 메타 데이터간의 이질성으로 인해 이종 기기들 간의 콘텐츠의 검색, 공유 또한 힘들다. 따라서 홈서버들 간의 일관적인 데이터 입력과 공유를 위하여 멀티미디어 콘텐츠에 일반적으로 적용되는 Mepg-7 기반의 메타데이터 레지스트리 설계를 제시한다. 또한 이질적인 메타데이터를 지니는 홈서버-모바일 단말 간의 콘텐츠 공유를 위하여 워드넷 기반의 온톨로지 설계를 본 논문에서 제시한다.
-
상품 온톨로지는 온톨로지 (Ontology) 구성요소인 개념 (Concept) 과 속성 (Property)이 상품 도메인에 특화된 온틀로지이다. 본 논문에서는 대용량을 특징으로 하는 상품 온톨로지를 표현함에 적용되어 질 수 있는 Hyperbolic Tree, Cluster Map, 그래프 비주얼라이제이션을 살펴보고, 계층을 갖는 개념을 표현하는 데 좋은 Hyperbolic과, 속성을 잘 표현 할 수 있는 Cluster Map을 상품 온톨로지에 유리한 비주얼라이제이션으로서 제안한다.
-
기존의 추천 시스템들은 사용자 수가 증가함에 따라 추천시간이 증가하는 확장성(Scalability) 문제가 있으며, 새로운 고객의 경우 선호도 정보가 부족하여 추천 정확도가 저하되는 희박성(Saparsity) 문제가 있다. 본 논문에서는 고객의 기본 프로파일 정보 중 가장 변별력이 있는 성과 나이에 대한 그룹을 생성하고 클러스터링 함으로써 집단 내 선호 상품을 우선적으로 추천하는 1단계 클러스터링 방법을 사용하여 새로운 고객의 희박성 문제를 해결 했으며, 추천결과에 따른 피드백을 받아 시간 흐름에 따른 선호 경향을 클러스터링 하는 시간스키마 방법을 적용한 2단계 클러스터링 방법을 사용함으로써 확장성 문제를 해결함은 물론 예측 정확도를 높일 수 있는 방법을 제안한다.
-
웹에서의 검색을 수행하기 위해 다양한 연구가 수행되었으나, 일반적으로 키워드 검색 방식이 주를 이루고 있다. 이는 검색 대상에 대한 정보가 충분한 경우에는 원하는 검색 결과를 찾아내기 친우나, 그렇지 않은 경우에는 사용자로 하여금 원하는 검색 결과를 추출하기 위친 여러 번의 검색을 추가로 수행하는 수고로움을 요구하곤 한다. 이러한 문제를 해결하기 위하여 어휘 간의 관계에 기반을 둔 확장 검색 방식을 제안한다. 시소러스를 바탕으로 유의어 그룹을 정의하고, 사용자의 검색 키워드 정보를 이용하여 어휘 간의 관계 및 그룹 간의 관계를 정의한다. 정의된 관계를 바탕으로 키워드를 확장하고, 확장된 키워드의 사용 빈도와 프리시젼을 이용하여 사용할 어휘를 선별하여 검색을 수행한다.
-
최근의 위치 측위 기술과 무선 통신 기술의 발전에 따라 위치 기반 서비스에 대한 관심이 크게 증가하고 있다. 기존의 단일 노드 기반 시스템으로는 처리하기 힘든 휴대폰 사용자와 같은 대용량의 객체를 처리하기 위해 제시된 클러스터 기반 분산 컴퓨팅 구조로 GALIS 아키텍처가 제안되었다. 본 논문에서는 제시한 프로토타입은 그동안 구현된 기존 GALIS 프로토타입보다 개선된 구조로 SLDS에서 Global
$Cell\_ID$ 를 적용하여 노드의 분할 합병 시 발생할 수 있는 처리 비용을 감소시켰다. 또한 LLDS에서는 필터링을 통해 손실들 수 있는 위치 데이타 정보를 보다 신뢰할 수 있는 데이타로 만들기 위한 기능을 추가하여 질의 시 발생할 수 있는 여러 가지 상황을 대비할 수 있게 되었다. -
데이터 웨어하우스에서는 데이터를 다양한 관점으로 분석하기 위해 데이터를 다차원 형태로 유지한다. 이 다차원 데이터를 간단하고 편리한 형태로 사용자에게 표현하기 위해 피벗 테이블이 이용된다. 피벗 테이블은 데이터에 대한 요약된 정보를 제공하는데 널리 사용되는 편리한 표현 방법이지만, 실제 값이 열의 제목으로 나오기 때문에 많은 개수의 열을 가질 수 있다. 이러한 피벗 테이블을 그대로 저장할 경우 관계 DBMS의 테이블 컬럼 수에 제약을 받게 되며, 데이터 저장 및 질의 처리에 성능이 떨어질 수 있다. 이 논문은 관계 데이터베이스의 테이블을 이용하여 피벗 테이블을 효율적으로 저장하는 방법을 제안한다. 이때, 피벗 테이블에 대한 질의물 저장된 형태의 테이블에 적용 가능하도록 질의를 변환시켜야 한다. 따라서 이 연구에서는 피벗 테이블에 대한 관계 연산자들(실렉션, 프로젝션, 합집합, 차집합 카디션 곱)을 효율적으로 변환하는 질의 변환 방범을 제안한다.
-
정보의 단순한 연결을 표현하는 현재 웹 환경의 한계를 보완하기 위해 차세대 웹으로서 평가되고 있는 시맨틱 웹에서는 정보 리소스의 의미와 개념적 관계를 정의하는 메타데이터와 온톨로지의 역할이 무엇보다 중요시되고 있다. 따라서 RDF와 RDF 스키마와 같은 표준 언어로써 표현되는 메타데이터와 온톨로지의 효과적인 저장과 검색의 방법이 필요하다. RDF와 RDF 스키마는 그래프 모델로서 표현이 가능하고 다양한 질의의 형태가 그래프 형태에서 추출 가능한 경로 형식으로 표현들 수 있기 때문에 보다 효율적인 질의 처리를 위해서는 경로 정보의 저장에 대한 연구가 필요하다. 따라서 본 논문에서는 관계형 데이터베이스를 기반으로 RDF와 RDF 스키마의 기본적인 정보와 특정 클래스, 프로퍼티, 리소스로 시작하는 경로 정보를 함께 저장할 수 있는 저장 구조를 제안한다.
-
XQuery는 계층적 구조를 가지는 XML 문서를 검색하기 위한 질의 언어이다. 이에 관한 연구들로는 XML SPY, Stylus studio와 같은 여러 XML 기반 XQuery 지원 툴들이 상용화 되어 있다. 하지만 보다 쉽고 직관적으로 XQuery를 작성하고 적용 시킬 수 있는 툴들은 미흡한 것이 사실이다. 이 논문에서는 XML을 문서를 직관적인 구조로 표현해주며 최종 사용자의 관점에 맞추어 XQuery를 생성을 지원하는 시스템을 설계 구현하였다.
-
시맨틱 웹의 구현을 위한 수단으로 RDF 및 기타 기반 기술이 사용되고 있다. 이에 따라, 방대한 RDF 데이터의 효율적인 관리를 위한 연구들이 최근 활발하게 국내외에서 진행 중이다. 기존의 많은 연구들은 관계형 데이터베이스 시스템을 이용하여 트리플 형태의 RDF 데이터의 저장하는 방법을 제안하였다. 이러한 방법은 하나의 대규모 테이블상에 RDF 데이터를 저장하므로 데이터 관리측면에서 장점이 있으나 질의 처리 측면에서 볼 때 항상 테이블 전체를 접근해야 하므로 검색 성능이 저하될 수 있는 문제점이 있다. 본 논문에서는 질의 처리 성능을 높이기 위해 프로퍼티를 기반으로 RDF 데이터를 절러 개의 테이블로 분할 저장하는 기법을 제안한다.
-
Predicting the cellular location of an unknown protein gives valuable information for inferring the possible function of the protein. For more accurate Prediction system, we need a good feature extraction method that transforms the raw sequence data into the numerical feature vector, minimizing information loss. In this paper we propose new methods of extracting underlying features only from the sequence data by computing pairwise sequence alignment scores. In addition, we use composition based features to improve prediction accuracy. To construct an SVM ensemble from separately trained SVM classifiers, we propose specificity based weighted majority voting . The overall prediction accuracy evaluated by the 5-fold cross-validation reached
$88.53\%$ for the eukaryotic animal data set. By comparing the prediction accuracy of various feature extraction methods, we could get the biological insight on the location of targeting information. Our numerical experiments confirm that our new feature extraction methods are very useful forpredicting subcellular localization of proteins. -
본 논문에서는. 단백질은 도메인으로 모듈화 되어 있으며, 단백질 간 상호작용이 도메인간 상호작용의 결과라는데 착안, SVM을 이용하여 도메인 기반 단백질 상호작용을 예측하는 시스템을 구성하였다. 하지만, SVM 을 통한 실험은 정확한 예측 결과뿐 아니라 빠른 처리속도를 요구하게 되었다. 따라서 SVM을 병렬화하여 빠른 처리시간을 가지는 Parallel SVM을 적용, 도메인을 기반으로 한 단백질 상호작용을 실험하였으며, 이를 통해 정확성과 처리 속도를 측정, 비교함으로써 도메인 기반 병렬 단백질 상호작용 예측을 검증해 본다.
-
본 논문은 세포 내에 존재하는 방대한 단백질들 사이의 상호작용 관계 네트워크에서 생물학적인 의미 연관성을 가지는 부분 네트워크를 콤포지트로 추상화할 수 있는 방법을 제안한다. 이 추상화를 위해 네트워크에서 구조적으로 완전한 부분 네트워크, 개념적으로 인접한 부분 네트워크 그리고 두 조건을 모두 만족하는 부분네트워크를 탐색한다. 따라서, 사용자는 방대한 네트워크을 개념적인 관점에서 분석할 수 있으며, 특정한 의미을 가지는 부분 네트워크를 쉽게 검색할 수 있다.
-
마이크로 어레이(micro array)로 표현되는 유전자 발현 패턴(gene expression pattern)들과 해당 유전자의 upstream에 위치한 DNA 서열 요소(motif)들은 유전자 발현에 밀접한 관련을 맺고 있는데 이들간의 매핑관계를 알아내는 것은 생물전산학 분야에서 중요한 문제 중 하나이다. 본 고에서는 유전자 발현 패턴 데이터와 해당 DNA에 포함된 것으로 알려진 모티프 프로파일에 대해 대응분석(correspondence analysis)을 수행하고 2차원 평면에 매핑하여 특정 유전자 발현과 밀접하게 관련된다고 여겨지는 후보 모티프를 시각적으로 직관적으로 동정하는 방법을 제시한다. 또한 유전자 발현 패턴은 일정한 길이로 나누어 가능한 모든 패턴에 대해 클러스터링을 행하여 이에 대한 인덱스로 데이터를 표현하여 패턴의 인식성과 발현 순차성을 높이는 반면 복잡도를 줄이도록 하였다. 실험에서 두가지 형태의 모티프 프로파일과 효모 Saccharomyces cerevisiae 포자형성 데이터 집합에 대하여 대응 분석을 통한 시각화된 결과를 이용해 유전자 발현과 깊게 관련되는 것으로 알려진 모티프들이 대응 유전자 발현과의 상관성이 잘 동정되고 있음을 알 수가 있다.
-
유전자의 생물학적 기능을 밝히고 세포 내 상호작용을 이해하는 것은 post-genome era의 가장 중요한 작업 중 하나이다. 세포는 서로 다른 컴포넌트들의 상호작용에 의해 아주 복잡한 네트워크를 구성한다. 생화학적 네트워크에는 metabolic, regulatory, signal transduction과 같은 세포의 프로세스를 포함한다. 이러한 생화학적 네트워크들은 서로 다른 정보체계를 가지고 각기 다른 데이터베이스에 분산되어 저장관리 되고 있다. 따라서 생화학적 네트워크 데이터를 체계적으로 효율적으로 저장, 관리하기 위한 데이터베이스에 대한 필요성이 증대되고 있다. 본 논문에서는 기존의 생화학적 네트워크 데이터베이스의 장.단점을 분석하고 객체지향 방식에 입각한 새로운 생화학적 네트워크 데이터의 통합을 위한 시스템 모델을 제시한다. 제안된 시스템 모델은 생화학적 네트워크 데이터에 대한 생물학전 관계를 자연스럽게 표현할 수 있는 객체지향 모델을 사용하였다. 또한 생화학적 네트워크 모델을 묘사하기 위한 응용프로그램 사이의 데이터 교환의 표준언어인 SBML[2]스키마를 기반으로 하고 있다.
-
Horn et al.에 의하여 개발된 THRASH 알고리즘은 대표적인 단백질 질량분석 플랫폼으로써, 극초분해능(ultra high resolution) Fourier Transform 질량분석법을 통해 얻어지는 고집적 전기분무 (electrospray ionization ESI) 질량 스펙트럼 데이터를 분석하는데 이용되고 있다. 하지만 이 알고리즘은 속도 면에서 부족하여 실시간 분석에 한계점을 보이고 있다. 이를 보완하기 위해 본 논문에서는 THRASH알고리즘의 속도를 향상시키는 기법을 제안하고 실험 결과를 통하여 새로운 기법이 융합된 알고리즘의 수행 속도가 기존 THRASH알고리즘의 속도를 비약적으로 향상시킬 수 있음을 보인다.
-
상호작용하는 구조들을 하나의 클래스로 표현하는 데이터 마이닝 툴로서 이머징 패턴(EP)이 최근에 제안되었다. 기존의 클러스터링 알고리즘과 패턴 마이닝 알고리즘은 고차원의 유전자 발현 데이터 흑은 같은 변수들(e.g. genes)을 가지고 실험한 멀티 소스 데이터 분석을 다루기에 부적절하고, 실험 결과를 이해하는 데에 어려움이 있다. 그러나 EP는 분류 트리의 형태로 표현 가능하기 때문에, 다양한 형식의 데이터를 분류하는 패턴들을 빠르고 간단하게 구성하여 데이터 분석이 가능하도록 돕는다. 본 논문에서는 멀티 소스 바이오 데이터에서 분류 절차의 작업을 향상시키기 위하여 EP를 사용하는 간단한 스킴을 제안한다.
-
Cleavage Site 분석 및 예측은 바이러스 증식에 필요한 핵심 단백질인 Protease
$(3CL^{pro})$ 를 예측하게 하고, 예측한 Protease의 활성을 억제함으로써 바이러스 중식을 저지하게 된다. 본 연구에서는 신경망과 결정트리, 유전자 알고리즘을 이용하여 SARS-CoV의 cleavage site를 분석하고, 학습 결과에서 추출된 규칙(Rule)에 의해 cleavage site를 예측한다. 또한 신경망에서 학습된 지식(Knowledge)을 이용하여 유전자 알고리즘의 성능을 향상시키는 지식기반 유전자 알고리즘 (KBGA: Knowledge-Based Genetic Algorithm)을 제안한다. -
기존의 레이아웃 알고리즘은 경로의 가독성과 속도 등에 주안점을 두어 개발되었다. 따라서 이러한 시스템의 경우 노드수가 증가할수록 에지 크로싱이 기하급수적으로 증가하는 문제가 있는데, genome scale에서의 대사 경로를 연구하기 위해서는 대사 경로 그래프 레이아웃 상에 나타나는 에지 크로싱을 줄이는 것이 시각화의 매우 중요한 부분이다. 대사 경로는 효소에 의한 화합물 간의 변화를 보여주는 네트워크로서, 대부분 척도 없는 네트워크 구조를 갖는다는 것이 알려져 있다. 이러한 대사 경로의 구조적 특징을 고려하여 에지 크로싱을 최소화하는 대사 경로 레이아웃 방법을 제안하고, 그 결과 노드수의 증가에 따른 에지 크로싱의 급격한 증가현상이
$37\~40\%$ 의 감소된 결과를 나타냈으며, 노드수가 증가하더라도 에지 크로싱이 오히려 감소하는 경우도 관찰되었다. -
DNA 연산 과정의 열역학적 통계 물리학적 예측 모델을 기술한다. 온도를 천천히 내리는 시험관에서의 DNA string 들의 결합은 Metropolis 알고리즘과 진화 연산의 일종인 simulated annealing 알고리즘으로 설명될 수 있다 본 논문에서는 정리 증명 문제를 통해 위의 통계 물리학적 모델이 DNA 연산에 적용될 수 있음을 보인다. 여섯 종류의 DNA 가닥들의 시뮬레이션 결과와 온도에 대한 실험적인 fluorescence intensity의 비교를 통해 이 모델이 유효함을 보인다. 또한 목표 DNA 개수를 시뮬레이션으로 예측하고 그 결과를 electrophoresis gel image 와 비교하였다.
-
올리고뉴크레오타이드 서열의 디자인은 일반 분자 생물학 뿐만 아니라 DNA 컴퓨팅 분야에서도 중요한 문제이다. DNA나 RNA와 같은 생체 물질간의 화학반응을 이용하여 계산을 수행하는데 사용되는 염기 서열의 품질은 계산의 정확도에 큰 영향을 미치기 때문에, 문제의 특성에 따른 요구 조건에 안는 염기 서열을 디자인 하기위한 방법에 대해 여러 가지 연구가 있어왔다. 기존의 DNA 컴퓨팅을 위한 염기서열 디자인은 주어진 녹는점의 범위에서 단순히 서로 독립적인 염기서열들의 집합을 디자인 하거나, 분자생물학 실험에 사용되는 올리고 프로브나 프라이머 셋을 디자인 하는 것을 중심으로 이루어졌다. 반면, 본 논문에서는 세포에서 추출된 DNA/RNA 분자가 섞여있는 환경에서 어느 DNA/RNA 분자와도 흔성화 반응물 하지않는 범용 올리고뉴클레오타이드 태그를 디자인하는 간단한 유전 알고리즘을 제시하며, 이를 이용해서 디자인된 염기서열 결과를 제시한다.
-
수천개의 Gene Expression Measurement를 생성해 내는 DNA Microarray 연구는 조직과 세포의 표본으로부터 진단에 유용한 Gene Expression 정보를 모으게 된다. 이런 종류의 Data를 분석하기 위하여 SVM(Support Vector Machine)을 사용한 새로운 방법이 연구되어왔다. 본 논문에서는 Gene Expression Data에 대한 고유벡터(Eigen Vector)를 이용하여 SVM의 성능을 향상시키고 질병진단에 유용한 Gene을 찾아 내는 알고리즘을 기술한다. 고유벡터를 통하여 Gene을 선택적으로 SVM Learning에 참가 시키고 분류의 결과를 통하여 추가된 Gene이 질병 진단에 미치는 영향력을 알아냄으로써 질병에 대한 Gene 역할을 파악 하는데 활용할 수 있다.
-
MicroRNA는 약 22 nucleotide 길이로, 세포질에서 유전자의 전사 후 조절 기능을 맡는 small RNA의 한 종류이다. MiRNA는 긴 전사체인 pri-miRNA에서 Drosha에 의해 절단 되어 핵 밖으로 나가 최종 Dicer에 의해 성숙된다. 하지만, 아직까지 이 효소들이 pri-miRNA를 잘라내는 3차 구조상의 메커니즘을 이해하지 못하고 있다. 본 연구에서는 완숙한 miRNA 이중나선이 약 2 회전을 이루게 된다는 정보를 바탕으로, Drosha가 붙는 miRNA stem구조의 dinucleotide step 파라미터를 유전 알고리즘을 이용하여 추정한다. 추정된 파라미터로부터 실제 miRNA들의 3차구조를 예측할 수 있으며, 3차 구조상의 Drosha의 절단 메커니즘을 이해하는데 도움을 줄 것이다.
-
DNA 컴퓨팅은 분자 수준(molecular level)에서 연산을 수행한다. 따라서 일반적인 실리콘 기반의 컴퓨터에서와는 달리, 순차적인 연산 제어를 보장하기 어렵다는 특징이 있다. 그러나 DNA 컴퓨팅은 화학반응에 기초한 연산이기 때문에, 실험자가 의도한 연산을 많은 수의 분자에 동시에 적용할 수 있으므로 실리콘 기반의 컴퓨터와는 비교할 수 없는 병렬 연산을 구현할 수 있다. 병렬 연산을 구현하고자 할 때, 일반적으로 연산에 사용하는 모든 DNA 분자들을 대상으로 연산을 구현할 수도 있다. 그러나 전체가 아닌 일부의 분자들을 상대로 연산을 수행하는 것 역시 가능하며 이 때 자연스러운 방법으로 사용할 수 있는 방법이 배깅(Bagging)이나 부스팅(Boosting)과 같은 앙상블(ensemble) 계열의 학습 방법이다. 일반적인 부스팅과 달리 가중치를 부여하는 것이 아니라 특정 학습자(learner)를 나타내는 분자들을 증폭한다면 가중치를 분자의 양으로 표현하는 것이 가능하므로 분자 수준에서 앙상블 계열의 학습을 구현하는 것이 가능하다. 본 논문에서는 앙상블 계열의 학습 방법 중 특히 부스팅의 효과를 DNA 컴퓨팅에 응용하고자 할 때, 어떤 방법이 가능하며, 표현 과정에서 고려해야 할 사항은 어떠한 것들이 있는지 고려하고자 한다. 본 논문에서는 규모를 사전에 한정할 수 없는 진화 가능한 그래프 구조(evolutionary graph structure)를 학습할 수 있는 방법을 찾아보고자 한다. 진화 가능한 그래프 구조는 기존의 DNA 컴퓨팅 방법으로는 학습할 수 없는 문제이다. 그러나 조합 가능한 수를 사전에 정의할 수 없기 때문에 분자의 수에 상관없이 동일한 연산 시간에 문제를 해결할 수 있는 DNA 컴퓨팅의 장정을 가장 잘 발휘할 수 있는 문제이기도 하다.개별 태스크의 특성에 따른 성능 조절과 태스크의 변화에 따른 빠른 반응을 자랑으로 한다. 본 논문에선 TIB 알고리즘을 리눅스 커널에 구현하여 성능을 평가하였고 그 결과 리눅스에서 사용되는 기존 인터벌 기반의 알고리즘들에 비해 좋은 전력 절감 효과를 얻을 수 있었다.과는 한식 외식업체들이 고객들의 재구매 의도를 높이기 위해서는 한식 외식업체의 서비스요인, 식음료요인, 이벤트 요인 등을 강화함으로써 전반적인 종사원 서비스 품질과 식음료품질을 높이는 전략을 취해야 한다는 것을 시사해주고 있다. 본 연구는 대구 경북소재 한식 외식업체만을 대상으로 하여 연구를 실시하여 연구의 일반화와 한식 외식업체를 이용하는 이용 고객들이 한식 외식업체를 재방문하는 재구매 의도가 발생하는데 있어 발생하는 과정을 설명하는 종단적 연구를 실시하지 못한 한계점을 가지고 있다.아직 산업 디자인이 품질경쟁력에 크게 영향을 미치는 성숙단계에 이르지 못하였음을 의미한다. (2) 제품 디자인에게 영향을 끼치는 유의적인 변수는 연구개발력, 연구개발투자 수준, 혁신활동 수준(5S, TPM, 6Sigma 운동, QC 등)이며, 제품 디자인은 우선 품질경쟁력을 높여 간접적으로 고객만족과 고객 충성을 유발하는 것으로 추정되었다. 상기의 분석결과로부터, 본 연구는 다음과 같은 정책적 함의를 도출하였다. 첫째, 신상품 개발과 혁신을 위한 포괄적인 연구개발 프로젝트를 품질 경쟁력의 주요 결정요인(제품의 기본성능, 신뢰성, 수명(내구성) 및 제품 디자인)과 연계하여 추진해야 할 것이다. 둘째, 기업은 디자인 경영 마인드 제고와 디자인 전문인력 양성을, 대학은 디자인 현장 업무를 통하여 창의력 증진과 기획 및 마케팅 능력 교육을, 정부는 디자인 기술개발 및 디자인 교육지원의 강화를 통하여 각각 디자인 경쟁력
$\righta -
본 논문의 목적은, 간단한 DNA를 기반으로 서로 상호 작용하는 인공미생물체를 위한 진화생태계를 구성하는 것이다. 여기서, 강화 신호를 사용한 신경 회로망의 학습을 통해 인공미생물체의 지능 린 진화과정을 모방해서 자신의 DNA 및 주변 환경에 따라 행동 패턴이 변화하도록 하였다. 또한, 미생물의 진화론적 관점에서 생식 과정에서 두 개체산의 유전자 교환 등이 일어날 수 있도록 하였다. 그리고 이렇게 만들어진 진화생태계의 응용 가능성에 대해 다룬다.
-
유전자 분석기술의 발전은 지놈 프로젝트(genome project)와 햅맵 프로젝트(hapmap project)를 가능하게 하였으며 이제는 맞춤형 진단 및 신약 개발 등 실제 사업의 구체화를 가져오게 하였다. 실제 사업에 적용시키기 위해서는 비용 절감의 문제를 해결해야 한다. 그래서 대용량의 유전자형(genotype)데이터를 정확하고 빠르게 일배체형(haplotype)으로 재구성해 줄 수 있는 시스템이 생물 산업 및 제약 산업에서 제기되어 지고 있다. 기존의 연구에서 비록 정확성이 높은 알고리즘들이 개발되어 있지만 기존의 방법들은 계산에 필요한 양이 크기 때문에 대용량 데이터에 대한 처리가 불가능하였다. 우리가 제안하는 시스템은 대용량 데이터를 유동적인 크기로 블록을 분할하여 대용량 데이터 처리 문제를 해결하였다. 또한 나누어진 블록에서 나타나는 모호한 이형접합체(heterozygote)의 위상(phase)의 결정 과정에 LD기반의 블록 분할 방법을 이용함으로써, 추론된 결과의 정확률을 높였다. 구현된 시스템의 성능평가는 ms로 구성한 인공데이터를 사용하여 수행하였다.
-
유전자 발현은 많은 전자조절인자에 의해서 조절된다. 이러한 조절인자들은 각각 DNA 상에 존재하는 특정한 모티프에 결합하여 그 기능을 수행한다. 따라서 DNA 상의 특정한 서열 정보가 유전자 발현과 직접적으로 연관되어 있다고 생각할 수 있다. 본 논문에서는 두 가지 서로 다른 데이터들에 대한 관계를 알아보기 위하여 사용되는 방법인 Kernel CCA를 이용하여 DNA 상의 특정한 모티프와 유전자 발현 사이의 관계를 알아보았다. 이를 이용한 실험 결과, 유전자 발현과 밀접하게 관련되어 있는 모티프들을 발견할 수 있었고, 기존에 중요한 것으로 알려져 있는 모티프가 실제로도 유전자 발현에 밀접한 영향을 미친다는 것을 알 수 있었다.
-
단백질들은 서로 다른 단백질들과 상호작용하거나 복합물을 형성함으로써 생물학적으로 중요한 기능을 한다고 알려져 있다. 때문에 대부분의 세포작용에 있어 중요한 역할을 하는 단백질들 간의 상호작용 분석 및 예측에 대한 연구는 여러 연구그룹으로부터 풍부한 데이터가 산출된 후게놈시대(post-genomic era)에서 또 하나의 중요한 이슈가 되고 있다. 본 논문에서는 효모에 대해 공개되어있는 단백질 상호작용 데이터들에서 속성들 간의 연관규칙 학습을 통해 잠재적 단백질 상호작용들을 예측하기 위한 연관규칙 기반의 상호작용 예측 방법을 제시한다. 단백질들 간의 상호작용 예측을 위해 고려되는 각 단백질의 다수의 속성차원은 정보이론 기반의 속성선택 알고리즘을 이용하여 효율적으로 줄이며 상호작용의 속성집합을 이용하여 신경망을 훈련시키고 이렇게 훈련된 신경망에서 속성들 간의 연관규칙을 디코딩하여 연관규칙 기반의 상호작용 예측에 활용한다. 연관속성 발굴을 통한 상호작용 예측을 위한 마이닝 방법으로는 연관규칙 발견 알고리즘을 사용하였으며 예측 정확도를 높이기 위하여 신경망 예측 모델의 학습 결과를 디코딩한 규칙들이 추가적으로 사용하였다. 논문에서 제안한 방법을 발견된 연관규칙을 통한 단백질 상호작용 예측문제에 있어 평균 약
$94.5\%$ 의 예측 정확도를 보였다. -
현재 국내외 적으로 많은 대사경로 재구축을 위한 소프트웨어들이 개발 보급되고 있다. 그러나 기존의 소프트웨어들은 유전자 서열의 주해 작업이 끝난 게놈에 대해서만 가능하다. 따라서 대사경로를 예측하고자 할 경우는 주해 작업이 선행되어야 하는 어려움이 있었다. 본 논문에서는 주해 작업이 완료되지 않은 유전자 서열로부터 유전자의 기능 예측뿐만 아니라 대사경로를 예측할 수 있는 시스템을 제안한다. 제안된 시스템은 Orthologous 데이터베이스를 활용하여 새롭게 밝혀진 유전자 서열을 대상으로 비교적 정확성이 높은 대사경로를 예측하는 기능을 제공한다. 이 방법을 통해 주해 작업이 완료되지 않은 유전자 서열을 이용하여 서열 내에 포함된 유전자의 기능을 예측할 뿐만 아니라 예측된 유전자 정보를 이용하여 대사 경로를 예측할 수 있다.
-
단백질들이 어느 세포내 소기관에 위치하는지에 대한 지식은 그들의 기능을 예측하는데 있어서 중요한 정보를 제공한다. 하지만 실험적으로 세포내 소기관 위치를 분석하는 작업은 않은 비용과 시간을 요구한다. 따라서 지금까지 단백질의 세포내 소기관 위치 예측을 위한 다양한 계산적 방법들이 개발되었으나, 효율적인 학습 데이터의 생성에 있어서 문제점을 가지고 있다. 본 논문은 기계학습 기법을 이용하여 주요 서열 구성을 선택함으로써 예측의 성능을 최대화 하는 방법을 제안하고자 한다. 실험은 효모의 단백질의 세포 내 소기관 위치 예측에 있어서 주요 아미노산 서열들을 선택함으로써 예측의 성능을 향상시키는 결과를 보이고 있다.
-
MicroRNA (miRNA)는 작은 크기의 RNA분자로서 동식물의 유전자 발현 과점을 직접적으로 조절하는 인자로 알려져 있다. MiRNA는 보통 목표 유전자의 3'-UTR 영역에 상보성을 갖고 결합함으로써 작용하며 특히 miRNA의 5'부분의 8 nt 정도가 seed로서 중요하다고 알려져 있다. 반면 최근의 연구에 따르면 seed 부분의 서열의 조성 및 양상이 변화함에 따라 특이도가 결정됨을 알 수 있지만 기존의 컴퓨터를 이용한 miRNA 목표 유전자 예측 방법들은 이러한 정보를 활용하지 못한다. 본 논문에서는 열역학적인 수치와 서열의 조성뿐 아니라 miRNA:mRNA pair의 위치에 기반한 정보들을 학습에 자질로서 포함하여 목표 유전자를 예측한다. 그 결과는 위치 기반 자질이 학습 성능 향상에 중요하게 기여함을 보여준다.
-
본 논문에서는 단백질 상호작용 네트워크를 효율적으로 구축하고 관리하기 위한 템플릿 기반 동적 관리 방법에 대해 제안한다. 기존의 단백질 상호작용 네트워크를 지원하는 대부분 시스템들은 각각의 단백질을 창조 데이터베이스에 대한 레퍼런스로 표현하고 있다. 따라서, 단백질에 상세한 정보를 가지고 분석하기 위해서는 참조 데이터베이스를 통해 상세한 정보를 얻어야 가능하다. 하지만, 방대하고 복잡한 상호작용 네트워크인 경우 분석에 많이 시간이 필요하며, 참조 데이터베이스의 레퍼런스가 변경된 경우 제대로 된 분석 결과를 얻을 수 없다. 본 논문에서 제시한 템플릿 기반의 동적 관리 기법은 다양한 사용자들이 자신의 요구에 맞는 단백질 상호작용 네트워크를 템플릿 검색을 통해 손쉽게 구축할 수 있도록 지원하며, 다중 사용자들이 서로간의 간섭없이 각자의 단백질 상호작용 네트워크 관리할 수 있다. 또한 참조 데이터베이스의 수정된 내용이 단백질 상호작용 네트워크에 지속적으로 반영할 수 있도록 한다.
-
대사증후군은 당뇨병, 고혈압, 복부 비만, 고지혈증 등의 질병이 한 개인에게 동시에 발현하는 것을 말한다. 미국에서는
$25\%$ 이상의 성인이 대사성 증후군인 것으로 알려져 있으며, 경제 여건의 향상 및 식생활 습관의 변화와 함께 최근 우리나라에서도 심각한 문제가 되고 있다. 한편 불확실성의 처리를 위해 많이 사용되고 있는 베이지안 네트워크는 사람이 분석 가능한 확률 기반의 모델로 최근 의학 분야에서 지식 발견, 데이터 마이닝을 위한 도구로 유용하게 사용되고 있다. 본 논문에 서 는 대사증후군을 예측하는 문제를 다루며, 베이지안 네트워크와 의학 지식을 이용한 대사증후군의 예측 모델을 제안한다. 제안하는 모델을 통해 1993년의 데이터를 가지고 1995년의 상태를 예측하는 분류 실험을 수행하였으며, 실험 결과 다층 신경망, k-최근접 이웃 등의 분류기 보다 높은$81.5\%$ 의 예측율을 보였다. -
CEC, 근접방어무기체계, 지휘통제체계 등에 사용되는 위협평가시스템은 자동위협평가, 방어구역 위협지수, 무기할당 등의 공통된 기능을 포함하고 있고, 시스템 환경의 변화 또는 성능 향상에 따라 수시로 업그레이드가 요구된다. 따라서 본 논문에서는 생산성 향상과 중복투자 방지로 인한 비용감소 효과를 거둘 수 있는 제품계열 방법론을 위협평가시스템 개발에 적용하는 방안을 제안한다. 위협평가시스템의 제품계열 방법론 적용을 위해 핵심자산 개발 프로세스를 수행하여 제품계열 영역지정, 핵심자산, 제품계획을 정의한다. 제품계열 영역지정은 Feature 모델링을 이용하여 공통점과 차이점을 식별하고, 핵심자산은 아키텍처 설계 중심으로, 그리고 각 핵심자산의 부착 프로세스를 종합하여 제품계획을 수립한다.
-
감리는 정보시스템의 품질을 향상시키기 위한 일련의 활동들 중 하나로 독립된 제3자가 정보시스템 구축 및 운영에 관련된 각종 위험 및 통제 상태를 점검하고 평가하여 개선이 필요한 사항을 권고하는 것이다. 그러나, 대부분의 평가가 감리인의 전문적 경험 및 주관적 판단에 의존한 정성적 방법으로 수행되고 있어 중요한 위험을 간과할 문제점을 내포하고 있다. 이에 따라, 본 논문에서는 다양한 비정형 산출물을 DTD와 스키마를 포함한 XML메타 모델인 표준포맷을 생성 후 단계별 필 통합적 방법으로 의미분석을 실시하여 자동으로 위험요소를 식별하고 평가할 수 있는 위험평가 프레임워크, 위험평가 모델, 위험평가 기준을 제안한다. 이와 같은 시스템화된 감리품질 개선기법을 통하여 추출된 결과는 감리인에게 사전에 전달됨으로써 감리노력과 일정을 절약할 수 있어 효율적인 감리수행 및 효과적인 감리결과가 보장된다.
-
최근 정보기술의 발전과 인터넷 서비스의 급속한 성장 둥으로 인하여 다양한 분야에서 웹 사이트가 운용중이며 품질의 중요성도 점차 인식되어지고 있다. 또한, 운용중인 웹 사이트 품질평가를 위해 적용할 품질모형 및 품질정가 프로세스는 평가대상 웹 사이트의 특성을 고려하여 선정이 요구된다. 따라서, 본 논문에서는 ISO/IEC 9126-4, WebQEM, 2QCV3Q, KNDU-SQEP를 적용하고, 미흡한 품질속성을 보완하기 위해 웹 사이트 품질평가를 위한 품질모형과 품질평가 프로세스를 제시하였다. 또한 웹 사이트 제품 평가 모델의 품질평가 점검표를 작성하여 포털 및 전문업무 사이트에 적용하고 WebQEM 모텔과 제안한 모델의 평가치를 비교하여 운용중인 웹 사이트에 대하여 평가가 가능한 것을 입증하였다. 향후에는 개발 중의 중간 산출물에 대한 품질평가 점검표의 개발을 통하여 전 수명주기에 대한 지원이 요구된다.
-
아키텍쳐(Architecture)는 프로젝트 초기에 결정된 설계 결정사항을 기재해 놓은 산출물이고 프로젝트 관련자(Stakeholder)간 의사소통의 수단이다. 아키텍쳐가 안정되어야 향후 진화(Evolution) 과정 중에 시스템을 이해하고 예측 관리하는 것이 쉬워지고 또한 기본 구조를 변경하지 않고 여러 가지 기능을 추가할 수 있다. 아키텍쳐 안정성(Architecture Stability)이란 진화과정 중에 발생하는 변경들을 견디는 정도를 말하고 변경은 적응변경(Adaptive Changes), 교정변경(Corrective Changes), 완전변경(Perfective Changes )을 포함한다. 그런데 진화 과정 동안에 변경들은 필연적으로 발생하게 되고 그로 인해 결정된 아키텍쳐는 본래의 모습을 그대로 유지할 수 없게 된다. 따라서 진화 과정시 아키텍쳐의 안정성을 측정하고 향후 변경에 대한 대비가 필요하다. 본 논문은 변경의 크기, 변경의 횟수, 변경의 종류와 아키텍쳐 불안정성의 관계를 버전별로 연구하고 그와 관련된 매트릭을 제안한다. 매트릭을 실제 프로젝트(Ant,JDT)에 적용하고 측정된 결과를 통해 아키텍쳐 안정성을 살펴봄으로써, 향후 안정성을 고려하여 아키텍쳐를 관리하고 개발하는데 도움을 줄 수 있을 것이다.
-
컴퓨터 성능의 향상으로 고비용의 수행을 요하는 뮤테이션 분석 기법의 적용 가능성이 커지면서, 객체지향 프로그램을 대상으로, 특히 자바 프로그램에 대하여, 뮤테이션 분석 기법에 관한 연구가 수행되었다. 자바의 경우, 바이트 코드를 이용한다면 소스코드 없이 오류 프로그램인 뮤턴트들을 생성할 수 있을 뿐만 아니라, 소스코드를 이용할 때보다 뮤테이션 분석을 빨리 수행할 수 있는 장점이 있다. 하지만 현재 이러한 장점을 효율적으로 활용할 수 있는 바이트 코드 수준의 연산자는 나와있지 않다. 본 논문에서는 자바 바이트 코드를 대상으로 하는 메소드 수준의 뮤테이션 연산자를 정의한다. 개발한 뮤테이션 연산자는 소스코드 수준에서 사용자가 범할 수 있는 오류만을 대상으로 한다. 따라서 소스 코드를 대상으로 하는 뮤테이션 분석의 기능을 모두 보여주면서, 성능향상을 가져다 준다.
-
컴포넌트 기반 개발 (CBD) 기술은 재사용을 통해 개발 노력과 시간을 줄여주는 기술로서 학계에서 활발한 연구가 이루어지고 있으며, 산업계의 기본 개발 패러다임으로 자리잡고 있다. 한편, 개방형 소프트웨어로 개발된 도구 및 어플리케이션 개발 통합 환경인 Eclipse 플랫폼이 각광 받고 있으며 Eclipse 플랫폼은 플러그인의 조립이라는 형태로 구성된다. Eclipse 플러그인은 큰 재사용 단위를 가지고 조림을 통해 구성되는 CBD의 컴포넌트와 비슷한 특성을 갖는다. 기존의 부족한 특정 플랫폼 기반의 컴포넌트 설계 및 구현 지침에 관한 연구를 Eclipse 플랫폼 기반의 CBD 기법을 연구함으로써 해결할 수 있을 것이다. 따라서, Eclipse 의 플러그인에 기반한 CBD 개발 기법에 대한 연구가 필요하다. 본 논문에서는 CBD 기술과 Eclipse 플랫폼에 대해서 알아보고 CBD 플랫폼과 컴포넌트의 요구사항을 분석하고 이러한 요구사항들이 어떠한 기법을 통하여 Eclipse 플랫폼에 적용 가능한지에 대해 알아본다. 끝으로 기존의 CBD 플랫폼에서의 개발과 비교하여 Eclipse 플랫폼을 사용함으로써 얻을 수 있는 장점에 대해서 알아본다.
-
XML을 이용하면 다이어그램에서 변경 내용을 검출하는 문제는 트리 구조에서 변경 내용을 검출하는 문제로 전환할 수 있다. 트리 구조의 털러 버전(version) 간에 형제(sibling) 노드의 순서가 유지되지 않는 조건하에서, 트리 구조의 변경 내용을 검출하는 문제는 NP-complete임이 증명되어 있다. 그러므로 본 논문에서는, 트리 연산에 몇 가지 제한을 부가하여, 빠른 시간 내에 최적에 가까운 변경 내용을 검출하는 방법을 제안한다.
-
소프트웨어 개발 생산성물 높이고 신뢰성 있는 프로그램을 개발하기 위하여 수많은 테스트 기법 및 도구들이 연구되고 있다. 본 논문은 효율적인 소프트웨어의 단위 테스팅을 위해 XML 기반의 테스트 스크립트 언어를 설계하고 테스팅 도구를 제안한다. 제안하는 테스팅 도구는 테스트 대상 소스를 기반으로 테스트 스크립트를 생성해주는 테스트 스크립트 생성기와 테스트 스크립트를 대상 언어로 작성된 테스트 드라이버로 변환해 주는 테스트 드라이버 변환기를 제공함으로서 보다 간편한 테스트 환경을 제공한다. 테스트 스크립트를 XML 형태로 기술함으로서 개발자들은 새로운 스크립트 언어의 학습이 불필요하며 대상 언어에 독립적인 테스트 스크립트를 작성 할 수 있다. 또한 테스트 실행 후 테스트 평가 결과를 XML로 제공함으로서 다양한 형태의 리포트 뷰(View)를 가능하게 한다. 본 XML 기반의 테스트 스크립트 언어와 테스팅 도구는 프로그래밍 언어에 독립적인 부분과 종속적인 부분을 분리하여 여러 가지 프로그래밍 언어의 단위 테스트 환경을 하나로 통합 할 수 있게 해주어 관련 소프트웨어 테스팅 분야의 발전에 크게 기여할 것으로 기대된다.
-
항해는 웹 응용의 대표적인 행위 특성이다. 본 연구에서는 UML 2.0의 행위 다이어그램 메타 모델을 확장한 웹 응용 항해 모델을 제안한다. 본 항해 모델은 딜 판정 항해 모델과 데이터 전송 관점 항해 모델로 구성된다. 뷰 관점 항해 모델은 UML 상태 기계 다이어그램을 확장하여 사용자에게 표시되는 항해를 기술한다. 데이터 전송 관점 항해 모델은 데이터가 전송되는 항해를 나타내며 UML 시퀀스 다이어그램을 확장하여 표현한다. 두 항해 모델은 상호 보완적으로 작용하여 온전한 항해 문맥을 형성한다. 본 논문에서는 UML 2.0 메타 모델의 확장점과 항해 모델의 표기법을 제시하고, 사례 연구를 통하여 실제적인 항해 모델의 예를 보인다.
-
컴포넌트기반 개발에 있어서 레거시프로그램의 재활용은 사업 기간과 범위 그리고 효율성이라는 부분에서 상당히 중요한 요소이다. 레거시프로그램을 재활용하기 위해 레거시 프로그램을 Wrapping하는 프로그램이 필요하며, 이를 위한 연구들이 활발히 진행되고 있다. 본 논문에서는 그 중 Adapter 패턴을 분석하여 상속과 위임의 장단점을 제시하고 상속 방식을 이용하는 패턴에 대하여 심층적으로 분석한다. 이를 바탕으로 레거시 프로그램을 통합함에 있어 개별적 Wrapper 구성을 통해 Adapter의 크기를 최소화하고 유지보수에 편리하도록 지역화하며, 단점인 인터페이스의 복잡성을 해결하기 위해 Facade 패턴을 활용하여 문제를 해결하는 방법을 제안한다.
-
컴포넌트는 컴포넌트 기반 개발(Component Based Development, CBD)기술에서 재사용되는 기본 단위로서 OOP(Object Oriented Programming, OOP)의 객체보다 상대적으로 큰 단위의 기능성을 제공하며 재사용성이 뛰어나다. 모델 기반 아키텍처(Model Driven Architecture, MDA)는 모델들 간의 다양한 변환(Transformation)을 활용하여 어플리케이션 개발을 자동화하는 새로운 패러다임으로서 소프트웨어의 생산성을 향상시킨다. 그러나 MDA 는 컴포넌트와 같은 어플리케이션들 간의 공통성과 가변성을 활용한 재사용성을 직접적으로 지원하지는 않는다. 본 논문에서는 CBD 와 MDA 의 장점과 한계점을 알아보고 서로의 단점을 보완할 수 있도록 컴포넌트 PIM 과 컴포넌트 기반의 MDA 공학 프로세스를 제안한다. 제안된 컴포넌트 PIM 과 프로세스를 이용하면 어플리케이션들 간의 공통성과 가변성을 이용한 뛰어난 재사용성과 자동화를 통한 생산성의 ,향상 및 높은 유지보수성을 가질 수 있다.
-
전세계적으로 영상을 이용하는 분야는 급속도로 발전되고 확장되어 가고 있다. 이러한 시점에서 영상처리 기술의 중요성은 더욱더 강조되고 있다. 하지만 영상처리 기술은 다른 기술들에 비하여 굉장히 특화되어 같은 기술이라도 사용 환경과 분야에 따라 각기 다른 형태와 다른 사용 방식을 요구하고 있다. 이러한 환경은 영상처리 기술들의 재사용성을 떨어뜨리고 기술 개발 비용의 증가를 가져 왔다. 본 논문에서는 이러한 문제점들을 해결하고자 영상처리 기술을 활용하고 공유하기 위한 컴포넌트의 구조를 제안하고자 한다.
-
제품-계열 방법은 소프트웨어 개발시 나오는 산출물들을 핵심자산으로 만들어 놓고, 이를 체계적으로 재사용할 수 있도록 지원하기 위한 프레임워크 역할을 한다. 그 초점은 소프트웨어 아키텍처나 상세설계 또는 코드에 맞추어져 있어서 임베디드 시스템 개발시 임베디드라는 특성화된 요구사항을 분석하고, 도출 하는데 미흡한 부분이 있다. 본 논문에서는 임베디드 시스템 개발시 요구분석 단계에 IDEF0 비즈니스 모델을 적용한 Feature 도출 및 분석 방법을 제안한다. 제안된 방법은 도메인 요구사항을 관리하는 측면에서 전체시스템에 대한 정확한 요구사항 도출과 분석이 가능하고, 도출된 Feature에 대한 공통성과 가변성을 식별 하는데 효율적이다.
-
본 논문은 정형 명세 언어인 Esterel이 가지는 취약점을 보안하기 위해 Safety-Critical Aided Development Environment를 추가로 활용하여 신뢰성 있고 안전적인 임베디드 제어 소프트웨어 개발을 위한 기법을 제시하고 있다. 그 뿐만 아니라 제시한 기법을 이용하여 개발된 간단한 자동 강속 제어 소프트웨어를 인터페이스와 기능 부분에 대해서 각각 확인 및 검증을 수행한 후 임베디드 시스템인 레고 마인드 스톰으로 제작된 차량 로봇에 탑재한 후 실험을 하고, 실험을 통해 기존 개발 기법과의 차이점을 분석한다.
-
하이브리드 시스템이란 연속적인 변화와 이산적인 변화가 함께 존재하는 시스템으로 많은 임베디드 시스템이 하이브리드 시스템으로 모델링 된다. 이러한 하이브리드 시스템을 모델링하고 타당성을 검사(validation) 할 수 있는 도구의 제안은 시스템 개발자들에게 하이브리드 시스템의 복잡한 변화로 인한 시스템의 복잡성을 간소화 시킬 수 있는 방법을 제공하고, 고품질의 제어 소프트웨어를 개발할 수 있도록 해준다. 본 논문에서 소개하는 ASADAL/OBJ Hybrid는 고신뢰성 하이브리드 시스템 모델링을 위한 도구로써 객체지향 모델링에 따라 여러 하이브리드 시스템을 객체로 모델링하며, 이들 간의 통신은 이벤트와 데이터 전송으로 이루어지도록 한다. 환경 객체의 경우 3D 형태 정보를 가지고 있어서 3D 시뮬레이션을 통해 시스템의 변화 양상을 개발자에게 직관적으로 제공하도록 하고 있다.
-
제품에서의 임베디드 소프트웨어의 비중은 점점 더 증가하고 있으며, 임베디드 소프트웨어의 특성으로 인해 일반적인 소프트웨어의 개발방법론을 적용한 임베디드 소프트웨어의 개발은 시간, 생산성, 비용 등 다양한 측면에서 제품의 성공을 보장해줄 수 없는 문제점을 안고 있다. 본 논문은 임베디드 도메인에 특성화된 소프트웨어개발에 필요한 방법론을 개발하기 위하여 MBASE(Model-Based (system) Architecting and Software Engineering) 기법을 적용하였으며 임베디드 제품개발의 실패를 가져올 수 있는 모델들 간의 충돌을 찾아내고 이를 개선하기 위한 개발 기술을 중심으로 임베디드 소프트웨어 개발 방법론을 제시하였다. 임베디드 소프트웨어 개발시 적용했을 때 발생되는 일반적인 문제점을 개선할 수 있다는 결론을 도출하였다.
-
유비쿼터스 환경에서의 원격화상회의 시스템은 그 시스템을 이용하는 사용자에 따라서 시스템의 실행환경이나 사용자의 디바이스 환경 등 많은 변화 요소를 가지고 있다. 본 논문에서는, 사용자가 가질 수 있는 서로 다른 환경 등에 스스로 적응하여 효과적이고 최적화된 원격화상회의를 진행 할 수 있는 시스템 구조를 제안하며, 이를 이종의 플랫폼에서 구동할 수 있도록 각각의 플랫폼 환경에 최적화된 적응 구조를 동적으로 재구성할 수 있는 방법과 응용프로그램을 제안한다. 또한, 제안시스템의 프로토타입을 실제 구현하여 그 유효성을 확인하였다.
-
그룹웨어에 대한 연구는 짧은 역사에도 불구하고 많은 부분이 이루어져왔다. 그리고 그 성과물 역시 단기간 내에 여러 가지 형태와 체계로 눈부신 결과들을 보여주었다. 하지만 그러한 변화에도 불구하고 소프트웨어의 개발업무에는 아직도 해결하지 못한 않은 문제점들이 있고 기본적인 소프트웨어 개발론 조차 산업현장에서는 제대로 적용되지 옷하고 있는 것 또한 간과 할 수 없는 사실이다. 이에 따라 기존의 휼륭한 그룹웨어들에게 이론적인 밑바탕을 제공하여 보다 나은 프로젝트 관리 모델을 제시하고 나아가서는 형태공명이라는 새로운 이론을 전산학에 소개하여 보다 나은 모델이나 이론들의 형성에 공헌하고자 한다.
-
마이크로소프트의 SLAM 프로젝트는 C 코드를 입력 받아서 프로그램이 주어진 속성을 만족하는지를 자동으로 검사한다. 그 결과, 실제 윈도우 2000에 탑재된 디바이스 드라이버의 버그를 찾아낼 수 있었다. 그러나 SLAM에서 검사할 수 있는 속성은 안전성 속성에만 국한되었다. 사용자가 검사하기를 원하는 속성은 안전성뿐만이 아니라 궁극성도 있지만, SLAM에서는 긍극성을 검사하지 못한다. 본 논문에서는 주어진 프로그램을 이진 프로그램으로 추상화 한 후에, 이진 프로그램에 대해서 CTL 모델 체킹을 수행하는 방법을 제안하였다. 그 결과 SLAM 보다도 더 많은 속성을 검사할 수 있다.
-
1990년대 후반에 들어서면서 않은 기업들이 기업의 생산성 향상 및 고객 서비스를 위해 IT투자를 확대해감에 따라 기업 내에서도 다수의 이질적인 시스템 도입을 추진하게 되었다. 그 결과 않은 기업 내에는 호환성이 없는 시스템이 산재해 업무추진에 어려움을 주고 있으며, 이러한 복잡하고 까다로운 분산화된 시스템을 통합하고자 업계에서는 많은 노력을 기울이게 되었다. 그 결과로 등장한 기술이 웹서비스이며 이것은 분산화된 시스템을 통합하는 기존의 통합기술들의 문제점을 해결하고 분산된 애플리케이션을 저비용
${\cdot}$ 고효율로 통합하기 위한 대안이 되었다. 본 논문에서는 웹서비스기반 시스템 개발을 위한 웹서비스 개발 절차를 제시하고 비즈니스 도메인에서 요구사항 분석을 통해 생성된 유스케이스모델을 기반으로 하는 웹 서비스 식별 방법을 제안한다. 유스케이스를 기반으로 서비스를 식별하므로 서비스에 도메인의 비즈니스가 잘 반영되도록 할 수 있으며 적절한 입도(granularity)을 갖는 서비스를 식별할 수 있다. -
웹 응용 관련 기술이 널리 이용되면서 적은 비용, 짧은 개발 기간, 고품질 등 새로운 요구사항이 등장하고 있다. 웹 응용 개발 현장에서는 이러한 요구사항을 만족시키기 위하여 개발 초기부터 UI 프로토타입(UI Prototype)물 적극적으로 이용하는 방법을 택하고 있다. UI 프로토타입에에는 클라이언트 측의 항해가 구현되어 있기 때문에, 항해 설계 활동(Navigation Design Activity)이 불필요하다고 생각할 수 있다. 그렇지만 UI 프로토타입의 복잡성과 비정형성 때문에 큰 규모의 웹 응용 개발 과정에서 요구사항을 만족시키지 못할 가능성도 있다. 이 논문에서는 항해 모델을 이용하여 웹 응용 전체를 쉽게 파악할 수 있고, 사용자 관점 및 서버 판정에서 항해의 문제점을 파악할 수 있다는 점을 근거로 UI 프로토타입에 기반한 항해 설계의 필요성을 제시한다. 그리고 웹 응용 개발 프로세스에서 항해와 관련한 활동들의 세부 단계를 밝히고, UML SPEM 프로파일(Profile)을 이용하여 세부 단계를 표현한다.
-
본 논문은 학습자의 학업 성취도를 높이기 위해 학습자의 수준에 맞는 평가 문항을 제공하기 위한 방안으로 문제의 정
${\cdot}$ 오답율을 측정하고, 코스 구성시 측정된 정${\cdot}$ 오답율을 근거로 문제를 구성하는 방안을 제안한다. 기존 연구는 학습자의 수준에 맞는 콘텐츠 제작에만 중점을 두었으나 본 연구에서는 수준에 맞는 평가를 제공함으로써 학습자의 학업 성취도를 높일 수 있다. 학습자의 수준은 기존 학습의 결과로 파악이 되며, LMS에 저장된다. 학습자가 문제를 풀면 정${\cdot}$ 오답 결과를 저장하여 해당 문제를 푼 여러 학습자들의 정${\cdot}$ 오답율을 메타데이터에 포함한다. 교수자는 학습 코스 설계 시 해당 학습자의 수준에 맞는 평가 문항 검색, 새로운 코스에 포함 할 수 있다. 이를 통해 학습 코스 설계자는 학습자의 수준에 맞는 평가 문항을 학습코스에 적용할 수 있고, 학습자는 자신의 수준에 맞는 평가를 함으로써 학업성취도가 높아지게 된다. -
본 연구에서는 온라인 다중 사용자 환경의 eBook 어노테이션 시스템 개발에서 데이터를 의미 기반으로 관리하고, 데이터에 대하여 상호 공통적인 이해를 표현하며, 그리고 데이터에 대한 무결성 검사 등을 지원하기 위해서 eBook 어노테이션 온톨로지를 구축하였다. eBook 어노테이션 테이터에 대한 상호 공통적인 이해의 표현을 위해서 한국 전자책 문서 표준인 EBKS(Electronic Book of Korea Standard)를 기반으로 구축 하였으며 구축된 온톨로지는 Conceptual Graph(CG)를 사용하여 표현하였다. 의미 기반의 처리를 위해서 본 온톨로지에서는 다국어(Multilingua) 관계를 고려하였으며 또한 오노테이션 데이터 생성 시 중요도를 표현하기 위해서 중요성 axiom을 고려했고,
$NF^2$ (Non-First Normal Form)에 입각하여 온톨로지를 설계함으로서 어노테이션 데이터의 검색에 활용도를 높였다. 제안된 온톨로지는 어노테이션 데이터의 재사용성을 높일 수 있고 의미 정보를 활용함으로써 eLearning, cyberclass과 같은 다중 사용자 환경에서 효과적인 협업을 가능하게 한다. 본 연구에서는 구현한 eBook annotation 시스템은 구축한 온톨로지를 사용함으로써 의미 기반의 데이터 관리가 가능하다. 또한 어노테이션 생성 시 온톨로지 구조를 모르더라도 어노테이션을 생성할 수 있는 인터페이스를 구현하였다. -
소프트웨어 개발시 요구사항 협의단계에서 WinWin 협의모델은 이해당사자들이 모두 만족할 수 있는 합의값물 결정하도록 도와준다. 이해당사자들은 각각의 Win 조건을 정의하고, 이것을 품질특성별로 규명한 수치화된 값으로 만든 후 이를 대상으로 협의하여 합의값을 도출한다. 하지만 이같은 합의값을 도출하는 과정에서 모든 이해당사자들이 Win 조건에 도달했는지 설명할 수 있는 방법은 없다. 본 논문은 WinWin 모델에서 이같은 합의값 도출 과정을 규명 가능한 수준으로 만들어 전체적으로 WinWin 모델의 성능이 개선될 수 있다는 것을 제시한다. 각 이해당사자들은 WinWin 모델 내의 합의값 도출과정을 퍼지 합의모델인 OCA(Opinion Changing Aversion)를 이용하여 산출된 합의값의 신뢰도를 평가한다. 평가된 신뢰도를 향상시킬 때까지 반복이 가능하므로 전체적으로 OCA는 WinWin 협의모델의 성능을 개선시킬 수 있다는 것을 증명한다.
-
모델 체킹에서 모델의 크기가 커질수록 검사해야 할 상태 공간이 지수적으로 증가하는 것을 상태폭발문제라고 부르며, 이 문제를 해결하기 위해 추상화 기법이 사용된다. 본 논문에서는 네모라이즈 게임을 대상으로 추상화 기법을 적용하여 게임 모델의 상태 공간을 줄설 기존 방법으로 풀지 못했던 게임을 풀었다. 이 게임은 한붓그리기처럼 출발지부터 이동가능한 모든 지점을 한번만 거쳐, 목적지까지 가는 경로를 찾아내는 도달성 게임이다. 이 게임은 Esterel 언어로 모델링 되었다. Esterel은 동기적 언어로써 게임을 유한상태모델로 모델링하고 관련 모델 체커인 Xeve를 사용하여 모델을 검사한다. Xeve는 모델 체킹 후 특정 출력신호를 방출하기 위한 입력신호들의 시퀀스를 생성해준다. 이 시퀀스가 게임의 해답인 경로가 되는데 Xes라는 시뮬레이터를 통해 실제 정확한 해답인지를 확인한다.
-
아키텍처는 요구사항을 기반으로 생성되어야 한다. 특히 비기능적 요구사항은 아키텍처의 생성에 않은 영향을 미치는 요인이다. 본 논문은 아키텍처를 생성하기 위한 요구사항 분석 기법과 전략을 제안한다. 제안하는 방법은 유스케이스를 이용하여 기능 요구사항을 추출하고, AHP(Analytic Hierarchy Process)를 이용하여 비기능 요구사항의 중요도를 정량적으로 분석한다.
-
본 논문에서는 최근에 각광을 받고 있는 HLA의 연구 현황을 파악하고 HLA의 기본 개념, 구성 요소, HLA를 이용한 시뮬레이션의 개발 방법 등에 대하여 조사하였다. 그리고 SMART-P 안전해석 전산코드인 TASS/SMR을 HLA에 적용하기 위한 방법에 대하여 기술하였으며 랩퍼 (Wrapper)를 사용하여 TASS/SMR을 HLA에 적용하여 보았다. 이러한 연구 결과로 TASS/SMR을 HLA에 적용, 구현하여 실행됨을 확인하였으며 그 결과로 레거시 코드를 HLA에 적용할 수 있는 방향을 제시하였다.
-
사용자의 요구사항을 실시간으로 반영하고 연구비 예산정책과 관련된 의사결정 과정을 최대한 지원할수 있는 시스템이 절대적으로 필요하게 되었다. 이러한 현실적인 상황을 반영하여 연구비의 예산편성 및 예산집행의 효율성을 높이고자 J2ME 기반 모바일 연구비 통합관리 시스템을 개발하였다. J2ME 기반 모바일 연구비 통합관리 시스템은 설계단계에서 정보검색 에이전트와 정보통합 에이전트를 이용하였다. 이러한 결과 연구비 계획단계에서부터 예산편성 및 예산집행, 예산정산까지 독립적으로 관리하고 있는 운영 시스템의 데이터베이스들을 최적화하였다. 또한 각 시스템간의 이질성을 최소화하여 연구비 집행업무의 투명성을 향상시키고 상호간의 유기적인 정보교환과 조직의 계획수립 및 분석적 업무를 효과적으로 지원할 수 있었다. 이로 인해 최종 사용자가 원하는 분석정보에 신속하게 접근하여 단편적인 관점보다는 종합적인 관점에서 다양한 자료를 제공받을 수 있었다.
-
비즈니스 시스템 분석을 위한 비즈니스 모델링에서 사용자와 개발자간의 원활한 의사소통은 프로젝트의 성공을 결정할 수 있는 중요한 요소이다. UML 기반의 유스케이스 모델링은 숙련자의 경험에 많이 의존하고 있으며, 모델링의 수준을 결정하기 어렵고, 또한 사용자가 쉽게 이해하기가 어렵다. 따라서 사용자의 업무를 분석하여 직관적으로 표현할 수 있는 속성구조 다이어그램을 이용한 정보구조 모델링은 사용자와 개발자 모두 쉽게 이해할 수 있는 구조로 사용자의 요구사항을 직관적으로 분석하여 요구사항 분석에서부터 발생되는 사용자의 잦은 변경을 줄일 수 있으므로 유스케이스 모델링을 보완할 수 있는 효과적인 방법이 될 수 있다.
-
임베디드 소프트웨어는 다른 일반 시스템과는 여러 가지 다른 특성을 가지고 있다. 우선 프로세서 자원과 메모리 자원을 적게 사용해야 하며, 소프트웨어의 오류에 대해 데스크 탑 또는 기타 서버환경에 비해 확실한 소프트웨어의 검증을 요구한다. 이러한 소프트웨어의 검증은 임베디드 소프트웨어의 오류허용이 다른 환경에 비해서 매우 다르기 때문에 고난도의 임베디드 소프트웨어의 응용을 빠르고 안정되게 개발하기 위해서는 사용자가 쉽게 사용할 수 있는 기술이 절실히 필요한 실정이다. 본 논문에서는 기존의 테스팅 자동화도구의 핵심 이슈인 테스트 데이터 제너레이터와 테스트 스크립트의 기능을 포함한 모듈인 테스트슈트 제너레이터의 성능향상 위한 방법을 제시한다. 제시된 테스트슈트 제너레이터 모듈은 임베디드 소프트웨어 테스팅 자동화도구의 개발 시 활용하여 개발한다면 임베디드 소프트웨어를 보다 효과적으로 테스팅 할 수 있을 것으로 예상된다.
-
최근 정보통신 기술이 빠르게 발전하면서 생활 환경 안에서 내장형 소프트웨어를 탑재한 독립적인 장치들을 많이 볼 수 있다. 이러한 내장형 장치들은 하드웨어의 특성으로 인해 비기능적인 요구사항이 중요하다. 본 논문에서는 내장형 시스템의 비기능적 요구사항을 기능적 요구사항 중심으로 추출하는 방법을 제안한다.
-
최근 소프트웨어 가 점 점 복잡해 짐 에 따라 다양한 상황에 대한 테스트의 중요도도 함께 증가하지만, 다양한 상황을 모두 고려하여 테스트하는 것은 많은 시간과 비용을 요구한다. 본 논문에서는 이러한 복잡한 시스템의 테스트를 위해 Orthogonal Array와 Equivalence Class 기법을 이용하여 test suite의 중복성을 낮추는 효율적인 test set을 생성하는 기법을 제안한다. 이렇게 제안된 기법을 OMA DRM(Digital Rights Management) System에 적용한 사례를 통해 기법의 우수성을 보인다.
-
DMS(Data Management Server)시스템은 DVM(Digital Variable Multi Air conditioning system) 관리, 제어, 모니터링을 수행하는 시스템으로 OSGi Service Platform을 미들웨어로 채택하고 있다. 본 논문에서는 OSGi Alliance에서 제공하는 Test Harness와 Test Suite을 기반으로 본 연구진이 개발한 OSGi Automated Test Toolkit인 MIRACLE을 이용한 DMS시스템 테스트 사례 연구에 관해 기술한다. 본 논문을 통해, MIRACLE을 이용한 임베디드 시스템에서의 OSGi Service Platform의 테스트 자동화에 대해 기여 할 수 있도록 한다.
-
다양한 상황(Context)들이 공존하는 유비쿼터스 컴퓨팅 환경에서는 이들 사이에 존재하는 이질성(heterogeneity)과 복잡성(complexity)을 추상화하기 위해 멀티미디어 미들웨어(Multimedia Middle-ware)가 요구된다. 또한 이러한 미들웨어를 통해 전달되는 콘텐츠는 다양한 환경 및 사용자에 맞게 리퍼포징을 수행해야 한다. 본 논문에서는 다양한 사용자에게 차세대 LBS 서비스를 위한 콘텐츠의 사용자 정보와 콘텐츠 관련 환경 정보 등을 분석, 전달하기 위한 방법론을 제안하고, 리퍼포징된 콘텐츠의 다양한 정보 분석 방법을 제공하기 위한 미들웨어 아키텍처를 설계한다.
-
기존의 컴포넌트 모델에서는 컴포넌트 사용과 설정의 분리가 용이하지 않아 개발자가 제약사항(처리시간과 메모리)간의 트레이드 오프(trade-off)를 고려할 수 없을 뿐만 아니라 AOP를 적용하기 힘들다. 본 논문에서는 제어인터페이스를 임의적으로 추가할 수 있는 FCM(fractal component model)을 사용하여 aspect을 적용하였고, 런타임시 비기능적인 속성을 효율적으로 재구성하는 동적 위빙(dynamic weaving)을 지원하기 위해서, fractal component의 제어기능을 담당하는 membrane에 있는 구성요소 중 제어 객체(control object)와 인터셉터 객체(interceptor object)를 간단하게 선택하고 구성하기 위해 혼합클래스를 사용하는 프레임워크를 제안한다. 또한 aspect의 재사용성을 높이기 위해, AspectDataBase를 프레임워크에 설계하였다.
-
동적 Aspect 프로그래밍(Aspect-Oriented Programming : AOP)은 로깅과 같은 비 기능적인 부분을 모듈화할 수 있도록 해주는 새로운 프로그래밍 기법이다. AOP는 절러 클래스에 영향을 미치는 행위들을 재사용 가능하도록 Aspect로 캡슐화 시켜준다. 기존의 Aspect 위버(weaver)에서는 Aspect를 위빙 할 경우, 새로운 서비스나 메소드를 추가하고자 한다면 서브클래스를 별도로 상속을 해주어야하며, 이로 인해 코드의 라인수가 증가되며, 수행 시간도 느려지게 된다. 이러한 문제점을 해결하기 위하여 동적 Aspect 위버 상에 Decorator 패턴을 적용하여 별도의 서브클래스를 상속하지 않고, 필요한 메소드만을 추가하여 위빙시키고, Aspect의 join point에 훅(hook)을 첨가하여 불필요한 메소드의 실행을 제거해준다. 이로 인해 수행속도와 재사용성을 증가시킬 수 있게 된다.
-
오늘날 대부분의 분산 컴퓨팅 환경들은 매우 복잡하다. 이러한 분산 환경위에 동작하는 시스템들은 문제 발생시 원인의 진단과 치유에 소비되는 시간이 높다. 이에 유비쿼터스환경으로 발전하기 위하여 네트워크를 구성하는 시스템들의 문제나 장애의 자가 진단 및 치유에 대한 요구가 높아지고 있다. 따라서 본 논문에서는 기존의 자가 치유 시스템에서 연구되어왔던 일률적인 치유가 아닌 각각의 시스템의 상황을 인식하고 그것에 맞추어 치유전략을 달리하는 상황인식 기능과 치유 결과 분석을 통해 치유전략을 자발적으로 개선해 나가는 기능을 제공한다. 제안 시스템은 시뮬레이션을 통하여 그 유효성을 입증하고 있다.
-
실행 환경 및 상황에 맞게 스스로 소프트웨어의 구성과 서비스를 변경시키기 위한 적응형 소프트웨어의 개발을 위해서는 변경 대상 및 변경 기법의 정의가 중요하다. 본 논문에서는 소프트웨어의 구성요소 및 기능을 실시간에 변경하기 위해 제품계열 방법에서 주로 사용되는 Information Hiding 기반의 가변성 관리 기법과 Parameterization 기반의 가변성 관리기법을 사용한다. 두 방법을 사용하면 실행 과정에 영향을 주지 않으면서 소프트웨어의 구성요소를 변경하거나 특성을 customizing할 수 있다.
-
인터넷과 웹의 빠른 발전과 더불어 비즈니스프로세스, 지식 경영, 마케팅, 전자 상거래 등 현대의 다양한 IT 시스템들이 웹으로 통합되면서 비즈니스 환경을 급격하게 변화시키고 있다. 웹의 본질적인 복잡함과 짧은 생명주기는 웹 사이트의 성공적인 개발과 유지보수를 위해서 많은 비용과 노력의 소요를 유발한다. 이러한 상황에서 웹 사이트의 효율적인 관리와 평가 방법 및 시스템적인 지원은 웹 사이트의 개발과 유지보수에 있어 핵심적인 요소라 할 수 있다. 본 논문에서는 웹 사이트의 개발과 유지보수에 대한 비용을 절감하고 효율적인 구조 관리와 평가를 지원하기 위해 개발된 시스템과 7단계의 효율적인 관리와 평가 방법을 제안한다.
-
최근들어 기업의 업무가 더욱 전문화되고 복잡해짐에 따라 워크플로우 시스템도 복잡해지고 다양해 지고 있다. 이러한 문제로 인하여 실제 필요로 하는 프로세스의 관리 및 도출이 요구된다. 본 논문에서는 영향력있는 프로세스를 도출하고 지원하기 위한 워크플로우 마이닝에 관하여 분석한 후 분석을 바탕으로 상관관계분석과 주성분분석을 통하여 워크플로우를 보다 효율적으로 관리할 수 있는 마이닝 규칙을 제시한다.
-
우편 서비스는 사람과 조직간을 이어주어 실물 배달과 의사 소통을 위한 중요 네트워크 중의 하나이다. 정보통신의 발달로 우편 서비스의 대표적인 형태인 서장이 전자메일로 대치되고 있으나, 전자상거래의 급속한 확장에 힘입어 소포 등과 같은 새로운 우편 서비스 영역의 중요성이 동반 확대되고 있는 실정이다. 인터넷 기반의 우체국 서비스를 의미하는 ePOST는 전통적인 우편 서비스와 쇼핑, 전자고지납부 및 에스크로 서비스 등으로 확대되고 있다. 한편 우리나라의 휴대전화의 보급율은 2004년 현재
$80\%$ 안팎에 이르고 있으며, 이제 ePOST 도 휴대전화상에서 새로운 서비스를 제공하기 위한 준비가 필요하다. 따라서 이 논문에서는 대국민 서비스와 효과적인 비즈니스를 동시에 지원하기 위한 모바일 우편 서비스(mPOST) 방안과 간단한 프로토타입 구현을 소개한다. -
소프트웨어 프로덕트 라인 공학은 두 가지 측면에서 재사용 활동을 정의한다. 첫째는 자산들의 공통성과 가변성을 분석하고 이를 명시적으로 표현하고자 하는 재사용 계획 프로세스 즉, 도메인 공학 프로세스이다 둘째는, 존재하는 핵심자산들을 이용하여 실제 프로덕트를 개발하는데 초점을 두고 있는 재사용 적용 프로세스 즉, 애플리케이션 공학 프로세스이다. 지금까지 프로덕트 라인 공학에서 많은 연구들은 재사용 계획 프로세스에 초점을 두고 있었으며, 재사용 적용 프로세스는 핵심자산의 단순한 커스터마이즈 또는 인스턴스화하는 수준으로 언급하고 있었다. 그로인해, 핵심자산들은 각기 다른 개발 프로세스에서 사용 표준 없이 적용되거나 핵심자산에 의존하여 개발 프로세스가 변경되어야 하는 문제를 발생시켰다. 본 논문에서는 프로덕트라인 핵심자산이 각기 다른 프로덕트 개발 프로세스에서 효율적으로 재사용 될 수 있도록 가이드해 주는 적용지침서 개발 방법을 제시한다.
-
제품계열(Product-Line) 개발 방법은 특정 영역에 대해 핵심 자산을 구축한 후 제품 특성에 맞게 자산을 변경하여 신속하게 제품을 생산하는 방법이다. 제품계열의 이용한 제품 생산이 생산성과 효율성을 높이기 위해서는 자산 구축이 제품 패밀리로부터 정확히 추출, 생성되어져 있어야 한다. 특히 핵심 자산 중에서 가장 중요한 자산인 제품계열 아키텍처이 중요하다. 본 논문에서는 도메인 전문가가 제품 영역에 대한 분석을 끝낸 후 제품계열 아키텍처를 생성, 편집을 용이하도록 도와 줄 수 있는 기능과 제품계열 아키텍처에서 제품 아키텍처로 쉽게 유도할 수 있도록 도와주는 기능을 고려하여 설계하고자 한다. 또한 설계된 내용을 기반으로 아키텍처 다이어그램 편집기 프로토타입을 구현하였다.
-
임베디드 소프트웨어의 품질 향상을 위해 소프트웨어에 대한 테스트가 필요하다. 이때 임베디드 소프트웨어가 가진 다양한 제약성을 고려해야 하며, 이를 위해 시스템 수준에서의 테스트를 수행하는 것이 가장 적합하다고 할 수 있다. 시스템 테스트에서는 SUT(System Under Test)의 하드웨어 구성에 따라 센서, 스위치, 액추에이터 등이 시스템과 연결되어 작동하여야 한다. 특히 온도센서나 습도센서 등과 같이 외부의 환경정보를 시스템의 입력으로 사용하는 임베디드 시스템을 테스트하기 위해서는 테스트 자동화 도구 내부에 환경을 관리하고, 정해진 환경 시나리오에 따라 시스템에 입력을 주는 모듈이 요구된다. 본 논문에서는 임베디드 시스템에 구성되어 있는 센서의 기능을 대신하는 가상 환경 관리자(Virtual Environment Operator)를 설계하고 구현하였다. 구현된 가상 환경 관리자의 도입으로 테스트 스크립트의 간결화와 현실 세계를 반영하는 다양한 테스트가 가능한 테스트 환경을 구축하였다.
-
원자력 발전소의 제어 시스템은 safety-critical 소프트웨어로서 안정성이 중요시되는 시스템이다. 최근 기존의 시스템이 PLC 기반의 디지털 제어장치로 대체되면서 이에 사용되는 소프트웨어의 안정성과 품질을 보장하기 위한 정형검증 기법이 요구되고 있다. 특히 PLC 프로그램의 설계에 사용되는 FBD의 모델체킹을 통한 정형검증에 대한 연구는 미비한 수준이다. VIS 검증기는 위의 요구에 부합하는 도구로서 이를 사용하면 여러 종류의 정형 검증이 가능하다. 본 논문에서는 VIS를 이용한 FBD의 검증을 위해서 FBD를 Verilog로 변환 하는 기법을 제안한다. 제안하는 방법의 효율성을 검증하기 위해서 현재 KNICS 사업단에서 개발중인 APR-1400용 원자로 보호 시스템의 운전정지회로를 예로 사용하였다.
-
최근 웹 사용자의 기대와 요구사항이 증가하고, 사회 전반의 트렌드가 자주 변하는 등 기존의 웹 서비스에 대한 프로그램 구조의 변경 요인이 자주 발생하고 있다. 본 연구에서는 이전에 개발된 XML Tree의 정보를 이용하여, 웹 기반에서 XML 개발 지원 서버의 도움을 받아 개발자가 웹 서비스를 하기 위한 XML Schema, XML Stylesheet, XML Document를 자동 생성할 수 있는 방법을 제시하고, 설계 및 구현을 하였다. 이렇게 함으로서, 웹 프로그램의 개발 시간 및 개발 비용을 줄일 수 있고 기업에서 각 부서 간에 시스템 통합이나 사용자의 트렌드 변화에 따른 웹 서비스의 구성 요소에 대한 변경 요인이 발생되었을 때, 이를 쉽고 빠르게 대처할 수 있을 것으로 기대한다.
-
임베디드 시스템은 다수의 디바이스를 컨트롤하여 시스템의 목적을 수행한다. 최근 임베디드 시스템의 요구사항이 증가함에 따라 하나의 임베디드 소프트웨어가 컨트롤하는 디바이스의 종류가 다양해지고 수도 증가하는 추세이다. 다수의 디바이스를 가지고 있는 임베디드 시스템에서 시스템의 신뢰도는 각 디바이스의 신뢰도에 많은 영향을 받는다. 본 논문은 임베디드 시스템의 신뢰도를 측정하기 위해서 통계적 신뢰도 측정 방법 중 한 가지인 마르코프 체인을 이용한 방법을 제안한다. 마르코프 체인은 여러 분야에서 복잡한 시스템을 단순화하여 모델링하고 과거의 변화를 토대로 미래를 예측할 수 있는 방법을 제공한다. 또한 전체 시스템의 확률을 행렬로 계측할 수 있는 방법을 가지고 있어 특정 부분의 확률이 전체 시스템의 확률에 미치는 영향을 산술적으로 계산할 수 있는 장점을 가지고 있다. 본 논문에서 제안하는 임베디드 소프트웨어 마르코프 체인은 테스트 대상 소스를 분석하여 디바이스를 컨트롤하는 루틴과 에러를 핸들링하는 루틴, 일반적인 루틴으로 나누어 각각을 상태로 정의한다. 정의한 각 상태간의 전이는 통계적으로 측정한 디바이스 신뢰도를 확률로 표현한다. 마르코프 체인을 이용하여 임베디드 시스템의 신뢰도를 측정하기 위한 시스템은 소스 분석기와 신뢰도 측정기로 나누어 설계한다. 소스 분석기는 테스트 대상이 되는 소스와 디바이스 드라이버 라이블러리 테이블을 입력으로 하고 소프트웨어의 마르코프 체인을 출력으로 한다 마르코프 체인은 행렬로 표현하고 연산하여 시스템의 신뢰도를 측정한다. 제안하는 시스템의 신뢰도 측정 방법은 부분이 가지고 있는 신뢰도가 전체 신뢰도에 미치는 영향을 산술적으로 측정할 수 있어 시스템이 요구하는 신뢰도에 접근할 수 있는 방법과 근거를 제공하는 장점이 있다.소시키는 장점을 갖는다.것으로 조사되었으며 40대 이상의 연령층은 점심비용으로 더 많은 지출을 하고 있는 것으로 나타났다. 4) 끼니별 한식에 대한 선호도는 아침식사의 경우가 가장 높았으며, 이는 40대와 50대에서 높게 나타났다. 점심 식사로 가장 선호되는 음식은 중식, 일식이었으며 저녁 식사에서 가장 선호되는 메뉴는 전 연령층에서 일식, 분식류 이었으며, 한식에 대한 선택 정도는 전 연령층에서 매우 낮게 나타났다. 5) 각 연령층에서 선호하는 한식에 대한 조사에서는 된장찌개가 전 연령층에서 가장 높은 선호도를 나타내었고, 김치는 40대 이상의 선호도가 30대보다 높게 나타났으며, 흥미롭게도 30세 이하의 선호도는 30대보다 높게 나타났다. 그 외에도 떡과 죽에 대한 선호도는 전 연령층에서 낮게 조사되었다. 장아찌류의 선호도는 전 연령대에서 낮았으며 특히 30세 이하에서 매우 낮게 조사되었다. 한식의 맛에 대한 만족도 조사에서는 연령이 올라갈수록 한식의 맛에 대한 만족도는 낮아지고 있었으나, 한식의 맛에 대한 만족도가 높을수록 양과 가격에 대한 만족도는 높은 경향을 나타내었다. 전반적으로 한식에 대한 선호도는 식사 때와 식사 목적에 따라 연령대 별로 다르게 나타나고 있으나, 선호도는 성별이나 세대에 관계없이 폭 넓은 선호도를 반영하고 있으며, 이는 대학생들을 대상으로 하는 연구 등에서도 나타난바 같다. 주 5일 근무제의 확산과 초 중 고생들의 토요일 휴무와 더불어 여행과 엔터테인먼트산업은 더욱 더 발전을 거듭하고 있으며, 외식은 여행과 여가 활동의 필수적인 요소로써 그 역할을 일조하고 있다. 이와 같은 여가시간의 증가는 독신자들에게는 좀더 많은 여유시간을 가족을 이루고 있는 가족구성원들에게는 가족과의 유대를 강화하는 휴식과 오락의 소비 트렌드를 창출시켰
-
모델 기반 아키텍처 (Model Driven Architecture, MDA)는 플랫폼 독립적인 모델로부터 변환 규칙을 이용하여 특정 플랫폼 용 모델을 생성하는 소프트웨어 자동화 기술로 각광을 받고 있다. EJB(Enterprise JavaBeans)는 컴포넌트 기반의 분산 컴퓨팅을 위한 아키텍처로써 Java 기반 어플리케이션 개발에서 가장 널리 사용되는 개발 플랫폼이다. 기존의 PIM에서 EJB 용 PSM으로 변환 규칙에 대한 연구는 아직 미흡하고 체계적이지 못하다. 본 논문에서는 PIM 의 구조적인 구성요소와 EJB 용 PSM 의 구성요소를 비교 분석하여 변환 규칙을 정의한다. EJB 어플리케이션 개발을 위해 제안된 변환 규칙을 적용한다면 모델간의 대응관계를 효율적으로 표현 할 수 있기 때문에 이들간의 일관성과 추적성을 높일 수 있고 제품의 생산성, 유지보수성을 높일 수 있다.
-
용어의 전문성은 전문용어의 판넬 기준을 정하고 그 계층구조를 밝히는데 유용하다. 본 논문에서는 말뭉치로부터 추출한 한국어 용어의 전문성을 측정하는 효과적인 방법을 제안한다. 말뭉치에서 관형형 전성어미('ㄴ/은/는')가 부여된 전문용어와 함께 출현하는 수식어구는 일반명사의 수식어구보다 제한적인 형태로 나타난다. 이런 점에 착안하여 본 논문에서는 수식어구를 포함하는 문맥정보에 대해 엔트로피를 측정하여 용어의 전문성을 측정하였다. 이를 위해 한국어 수식어구를 분석하고 기존 전문성 측정 방법에서 간과되어진 수식어구 출현빈도를 고려하여 엔트로피를 상대적 비율로 계산함으로써 한국어에 적합한 전문성 측정을 하였다. 400만 어절의 신문 말뭉치에서 추출한 전문용어와 ETRI 시소러스를 이용하여 실험을 해 본 결과 본 논문에서 제안하는 한국어 용어 전문성 측정방법이 효과적임을 알 수 있었다.
-
본 논문에서는 아라비안 숫자의 중의성을 효과적으로 제거하고 숫자 표현의 발음을 정확하게 문자화할 수 있는 임베디드 시스템용 경량화된 아라비안 숫자 읽기 시스템을 제안한다. 이를 위해 7 가지의 숫자 읽기 방식(Headings of Arabic Numerals RAN)을 분류하였고, 문자화 규칙을 설정하기 위해. (1) 문맥 자질, (2) 패턴 자질, (3) 휴리스틱 정보를 숫자 표현의 의미에 따라 분석하였다. 그리고 숫자의 문자화 시스템을 최적화하여 임베디드 시스템에 탑재하기 위해 (1) 형태소 분석 모듈의 분리, (2) 사전 압축, (3) 인명과 지명의 제거를 하였고, 이를 홍해 심각한 정확도 손실 없이 메모리 사용량과 처리 시간을 크게 줄일 수 있었다. 경량화된 mini-TAN 은
$96.9\~98.3\%$ 의 정확도를 보이며, 기존 상용 TTS 시스템에 비해서도 숫자 읽기의 처리에 있어 높은 정확도를 보인다. -
본 논문은 규칙 기반 방법과 통계 기반 방법을 동시에 사용함으로써 두 가지 방법의 장단점을 상호 보완한다. 한 문장에 대한 최적의 품사열은 HMM을 기반으로 Viterbi Algorithm을 사용하여 선택한다. 이때 파라미터 값은 규칙에 의한 가중치 값과 통계 정보를 사용한다. 최소한의 일반규칙을 사용하여 구축한 규칙의 적용에 따라 가중치 값을 구하며 규칙을 적용받지 못하는 경우는 비감독학습으로 추출한 통계정보에 기반을 둔 가중치 값을 이용하여 파라미터 값을 구한다. 이러한 기본 모델을 여러 회 반복하여 학습함으로써 최적의 통계기반 가중치를 구한다. 규칙과 비감독 학습으로 추출한 통계정보를 이용한 본 품사 태깅 시스템의 어절 기반 정확도는
$97.78\%$ 이다. -
교차언어검색 시스템은 다양한 언어자원을 필요로 한다. 여기서는 한-일 대역어 사전과 일본어 문서의 바이그램 색인만을 이용해서 교차언어검색을 수행하는 방법을 제시한다. 한국어로 된 자연어 질의에서 형태소분석기 등의 도움 없이 간단하게 일본어 대역어 리스트를 생성할 수 있는 방법과, 검색의 성능을 올릴 수 있도록 대역어에 가중치를 부여하는 방법을 제안한다. 그리고 실험을 통해 제시한 방법을 평가하고 분석한다.
-
본 논문에서는 한국어에 있어 '에, 로'를 격표지로 하는 부사격에 대한 의미역 결정 모델에 대해 다루고 있다. 의미역 결정은 의미 분석의 핵심 과정 중 하나이고 자연언어처리에서 해결해야 할 중요한 문제이다. 본 논문은 기존 연구와 언어학 논저를 참고해서 의미역 결정에 유용한 자질들을 정리하였고 SVM을 이용하여 의미역 결정 모델을 구축하였다. 또한 기존 연구와 차별적으로 기능동사 구문의 처리와 지배소 개념의 유사도 보정 방법을 사용하여 보다 견고한 모델을 만들 수 있었다. 성능 평가 결과 개념(Concept)만을 사용한 기본 모델에 비해서 평균
$9\%$ 의 정확률 향상을 보였다. -
일반적으로 중국어의 명사구는 최단명사구, 기본명사구 최장명사구로 분류된다. 최장명사구에 대한 정확한 식별은 문장의 전체적인 구조를 파악하고 문장의 정확한 지배용언을 찾아내는데 중요한 역할을 한다. 본 논문에서는 특성에 따라 5개의 클래스로 세분화된 문장부호를 학습자질로 사용하여 최장명사구 자동식별을 진행한다. 제안된 기법은 평균길이가 4인 최장명사구의 식별실험에서 기본모델(baseline)보다
$4.5\%$ 향상된 평균$85.1\%$ 의 우수한 F-measure 성능을 보인다. -
전문용어는 사전, 시소러스 및 온톨로지를 비롯한 다양한 기반지식자원에서 사용되고 있으며, 해당분야 발전에 민감하게 반응하는 특징을 가진다. 그럼에도 불구하고, 용어를 생명주기 관점에서 바라보고 이를 효율적으로 사용할 수 있도록 하는 연구가 부족하다. 본 논문에서는 한정된 인적
${\cdot}$ 물적 자원을 효율적으로 사용할 수 있도록 가까운 미래에도 유용한 용어들을 선정하고 관리하기 위한 방안으로서 용어지배값 (TDV; Term Dominance Value)을 제안한다. 이를 통해 용어 생명주기의 각 단계를 생성, 성장, 유지, 쇠퇴, 소멸, 재생 등으로 정의함으로써 관리해야 할 대상 용어를 명확히 할 수 있도록 한다. 용어지배값과 Coverage와의 관계 실험을 통해 유망한 용어들을 선정하고 관리해야 하는 당위성을 보여준다. -
사용자가 원하는 점보를 찾아주는 정보 검색 시스템은 최근까지 않은 연구가 이루어지고 있다. 일반적인 검색 엔진에서는 질의문이나 문서들을 색인할 때 영사를 중심으로 색인을 한다. 본 논문에서는 사용자가 한단어로 질의하지 않고 서술문 형식으로 질의를 할 경우 사용자가 원하는 정확한 정보를 검색해 내기 위하여 품사에 관계없이 사용자가 선택한 질의어들과 문서에서 나타나는 모든 용어들을 중요하다고 보고 명사만 이용하는 경우와 모든 품사를 이용하는 경우로 나누어 실험해 보았다.
-
문서분류 시 문서의 내용을 표현하기 위한 자질로서 사용되는 단어의 출현빈도정보는 해당 문서의 주제어를 표현하기에 취약한 점을 갖고 있다. 즉, 키워드가 문장에서 어떠한 목적(의미)으로 사용되었는지에 대한 정보를 표현할 수가 없고, 문장 간의 응집도가 강한 문장에서 추출되었는지 아닌지에 대한 정보를 표현할 수가 없다. 따라서, 이 정보로부터 문서분류를 하는 것은 그 정확도에 있어서 한계를 갖게 된다. 본 논문에서는 이러한 문서표현의 문제를 해결하기위해, 키워드를 선택할 때, 자질로서 문장의 역할(주어)정보를 추출하여 가중치 부여방식을 통하여 주어주도정보량을 추출하였다. 또한, 자질로서 문장 내 키워드들의 동시출현빈도 정보를 추출하여 문장 간 키워드들의 연관성정도를 시소러스에 담아내었다. 그리고, 이로부터 응집도 정보를 추출하였다. 이 두 정보의 통합으로부터 문서 주제어를 결정함으로서, 문서분류를 위한 주제어 추출 시 불필요한 키워드의 삽입을 줄이고, 동시 출현하는 키워드들에 대한 선택 기준을 제공하고자 하였다. 실험을 통해 한번 출현한 키워드라도, 문장을 주도하는 주어로서 사용될 경우와 응집도 가중치가 높을 경우에 주제어로서의 선택될 가능성이 향상되고, 문서분류를 위해 좀 더 세분화된 키워드 점수화가 가능함을 확인하였다. 따라서, 선택된 주제어가 문서분류의 정확도에 있어서 향상을 가져올 수 있을 것으로 기대한다.
-
신문기사를 대상으로 사건 단위로 문서를 클러스터링 하기 위해서, 기존의 연구에서는 기사의 발행일 또는 기사의 내용만 사용하여 하나의 사건을 다른 사건과 구분하는 방법을 사용해 오고 있다. 하지만 사건의 전개가 시간 차이를 두고 진행되는 경우 또는 비슷한 시간대에 같은 범주에 속하는 사건이 발생하는 경우 기사의 발행일만 사용하여 사건 관련 기사를 구분하는 것은 한계가 있다. 본 연구에서는 한국어 신문기사를 대상으로 신문기사에 나타난 시간정보를 자동 추출하고, 이를 기사의 발행일을 기준으로 정규화 한 후 사용하여 사건단위로 기사를 클러스터링 하는 방법을 개발하였다. 즉 한국어 신문 기사를 대상으로 기사에 나타난 시간 표현을 자동으로 추출한 후, 사건과의 유사도 비교에 사용함으로써 사건 단위 클러스터링의 정확도를 높이기 위한 방법을 제안한다.
-
문서 분류에서의 one class classification 문제는 오직 하나의 범주를 생성하고 새로운 문서가 주어졌을 때 미리 만들어진 하나의 범주에 속하는가를 판별하는 문제이다. 기존의 여러 범주로 이루어진 분류 문제를 해결할 때와는 달리 one class classification에서는 학습 시에 이미 정해진 하나의 범주와 관련이 있는 문서들만을 사용하여 학습을 수행하기 때문에 범주의 경계를 정하는 것이 매우 어려운 작업이며 또한 분류기의 성능에 있어서도 매우 중요한 요소로 작용하게 된다. 본 논문에서는 기존의 연구에서 one class classification 문제를 해결할 때 관심의 대상이 되는 예제의 일부를 부정 예제로 간주하여 one class문제를 two class문제로 변경시켜 학습을 수행했던 것에서 더 나아가 추가적으로 새로운 가상 부정 예제를 설정하여 학습을 수행하고, SVM을 통하여 범주화 성능을 확인해 보기로 한다.
-
개념망은 상당히 도메인에 의존적인 언어자원에 해당한다. 따라서, 도메인이 다른 분야에 적용하고자 한다면, 많은 수정이 요구된다. 그러나 개념망의 편집은 언어 이해 능력이 뛰어난 언어학자들 조차도 상당히 많은 시간이 요구되는 작업이다. 대부분의 시간소요는 개념망의 전체적인 계층구조를 스캐닝하는 작업과 특정 노드를 검색하는 작업에 의한 것이다. 기 구축된 개념망을 분석하면 계층관계에 있는 어휘들간의 일관된 규칙을 발견할 수 있다. 이 논문에서는 어휘들의 뜻풀이와 상위어간의 관계성, 복합명사와 상위어간의 관계성을 통계적으로 분석하였다 분석된 결과를 기반으로 확률모델을 이용하여 상위어 추천 기능을 구현하였다. 상위어 추천 기능의 시간 절감 효과를 실험하기 위해 실험자 2인을 대상으로 개념망 구축에 소요되는 시간을 측정하였다. 상위어 추천 기능이 있는 지능형 워크벤치를 이용할 경우 개념망 작업 시간은 약
$65\%$ 정도로 단축되는 것을 확인할 수 있었다. 본 지능형 워크벤치는 다양한 도메인에서 요구되는 개념망 구축의 시간 비용 절감에 크게 기절할 것으로 기대된다. -
본 연구는 신문기사나 백과사전 등의 문서에서 빈번히 발생하는 동사 파생 접미사와 어미가 생략된 형태의 서술성 명사를 동사로 복원하는 방법에 대한 것으로 이러한 복원은 문장구조 분석에 영향을 미친다. 기존 연구는 간단한 규칙만을 사용하지만 규칙을 사용하는 방법은 재현률에서 성능 저하를 보이기 때문에 본 연구에서는 이러한 생략 형태를 구분하여 규칙과 통계 방법을 사용하여 각각 적합한 형태에 적용하였다. 본 연구의 접근 방법은 규칙 기반에 비해 약
$30\%$ , 통계 기반에 비해 약$8\%$ 의 성능 향상을 보여서 문장 구조 분석에서는$3.6\%$ 의 성능 향상을 보였다. -
기네스 기록과 같은 기록정보는 사용자가 질의응답 시스템에 자주 질문할 수 있는 내용이지만, 구성단어의 수가 적고 일반적인 단어로 구성되는 기록정보 문장의 특성으로 인해 전통적인 질의응답 시스템에서는 정답을 제시하기 힘든 정보이다. 그러므로 기록정보만을 위한 접근방법이 필요하다. 우리는 기록정보는 특정 문맥에 의해 쓰여지는 경우가 많다는 가정 하에, 문맥 정보를 반영할 수 있는 템플릿을 정의하고, 이 템플릿에 의해서 기록정보를 색인하여 정답을 제시하는 시스템을 제안한다. 템플릿은 거리, 형태소, 형태 소품사, 정답유형, 구문 정보의 5가지 제약정보를 나타낼 수 있게 구성된다. 전통적인 백과사전 QA 시스템과 제안 시스템을 비교하여 평가한 결과, 제안한 방법이 기록정보 QA 시스템에 효과적임을 알 수 있었다.
-
현재 온톨로지는 많은 분야에서 활발하게 연구되고 있다. 온톨로지 구축에 관한 표준 언어가 W3C에 의해 공표되었으며, 온톨로지를 구축하기 위한 많은 도구들이 개발되어져 왔다. 그러한 도구들은 각각 특징이 있고, 온톨로지의 구축물 위해 최적화되어 있지만, 한가지 단정은 도구의 일반성의 결여이다. 기존의 모든 온톨로지 구축 도구들은 온톨로지 전문가를 위한 전문가용 구축 도구라고 해도 과언이 아니다. 그리하여 온톨로지에 관심이 있는 일반 사용자가 그러한 도구들을 사용하기 위해 많은 노력이 필요하다. 본 연구에서는 이런 단점을 보완하기 위하여 온톨로지 언어에 대한 사용자 지침 표준안을 만들고, 이 표준안을 온톨로지 구축 도구에 적용하여 보다 쉽고 정확한 온톨로지 구축이 가능한 온톨로지 구축 도구를 설계 하였다.
-
본 논문은 백과사전 도메인의 지식베이스 설계 및 통계기반 정보추출 방법을 이용한 속성정보 인식에 대하여 기술한다. 층 13개 카테고리로 구성된 백과사전에 대해 99개의 템플릿과 285개의 속성을 정의하였으며, 각 표제어의 추출 대상인 속성정보는 표제어를 설명하는 본문에서 통계기반 기계학습모델인 CRF(Conditional Random Fields)를 적용하여 추출하였다. 백과사전 카테고리 별로 균일하게 선정된 4천 5백 문서를 학습에 사용하였고 테스트 문서셋 500문서에 대해 속성인식률을 측정하였다. 성능 평가한 결과,
$F1\;55.76\%\;(P\;74.89\%,\;R\;44.42\%)$ 의 성능을 나타내었다. -
본 논문에서는 온톨로지의 개념구조를 이용한 웹페이지의 의미적 분류방법을 제안한다. 웹 문서들이 가지는 용어 정보들과 어휘들 간의 개념 구조를 파악하여 온톨로지를 확장시키면서 이를 문서분류에 적용하여 의미적 분류가 이루어지게 한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하여 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 온톨로지와 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.
-
인터넷의 발달로 전자문서가 증가함에 따라 정보추출기술의 중요성도 함께 증가하게 되었다. 정보추출 (IE)은 다양한 형태의 문서로부터 필요한 내용만을 추출하여 정형화된 형태로 저장하는 문서 처리기술이다. SIES (Sogang Information Extraction System)는 기계학습 방법과 고정밀의 수동작성 된 규칙기반의 방법론을 함께 사용하는 정보 추출시스템으로 문법에 맞지 않는 문장 등의 입력에 대해 견고한 문장분석을 위해 Lexico-Semantic Pattern (LSP)과 개체명사전(Named Entity Dictionary)를 사용하였으며, SIES의 기계학습의 성능향상을 위친 기존에 널리 사용되는 문맥점보 외에 후보단어들의 위치정보를 고려한 특성자질과 스코어링 방법을 사용하였다.
-
제한된 휴대폰 자판에서 효율적인 한글 입력을 위한 방법으로서 본 논문에서는 고정적인 한글 자소의 버튼 배치를 하지 않고, 사용자가 입력하는 한글의 상태에 따라 동적으로 변하는 S/W 자판을 제안한다. 이와 동시에 방향키와 숫자키의 동시 사용 가능한 입력 방식을 제안함으로써 기존의 휴대폰 한글 입력 방식이 가지는 다양한 문제점을 해결하였다.
-
본 논문에서는 미등록 어휘로 인한 구문분석의 실패를 해결하는 방법으로 WordNet의 유의어 정보를 이용하였다. 이 방법을 또한 설화용 온톨러지 OfN의 어휘확장에 적용하였다. 실험을 통하여 구문분석 과정에서 나타나는 미등록 어휘문제의 해결과 문장의 의미분석 과정이 순조롭게 진행될 수 있음을 확인하였다.
-
화제가 혼합되어 있는 문서에서 각 화제의 단락을 추출하면 사용자의 질의어에 일치하는 정보만을 추출할 수 있다. 정확하고 빠르게 사용자의 검색요구에 일치하는 관련 정보를 추출할 수 있다. 본 논문에서는 문서에서 사용자의 요구에 적합한 단락을 추출하는 기술을 설명한다. 문서에서 분야연상어를 추출하고, 각 문장마다 화제분야의 출현
${\cdot}$ 계속${\cdot}$ 전환이 어떻게 변화하여 가는지를 추적하여 계산한다. 긴 문서에서 어떤 화제가 출현하는가를 파악하고, 화제가 계속되거나 혹은 전환되는 지점을 인식하여, 분야별 단락을 추출하는 방법을 제안한다. -
본 논문에서는 수사법을 이용한 대중가요 분석법을 제시한다. 분석목표는 가사와 악곡의 수사구조 파악이다. 그 결과 가요의 가사와 곡이 어떻게 대응하여 전개되는지 확인해 볼 수 있었다. 이를 바탕으로 (1) 가요의 주제 가사와 선율을 빠른 시간 안에 찾아낼 수 있고 (2) 가요의 효과적인 분류와 검색, 또한 (3) 곡의 충실성 또는 유행가능성을 예측해보는 데에도 활용될 수 있을 것이다.
-
인터넷의 확장에 따라 형태소 분석기에서 사용하는 사전의 규모도 커지고 있다. 이러한 상황은 사전의 증가를 가져옴으로써 기존 형태소 분석기의 자료 구조에 대한 새로운 요구를 발생시켰다. 기존의 트라이를 이용한 방법은 노드의 과다 생성과 데이터 부족문제로 발생하는 메모리 낭비의 문제를 가지고 있다. 효율적인 메모리 사용을 위해서는 해시 구조가 적절하다. 하지만 이 경우 트라이에 비해 검색 횟수의 복잡도가 비약적으로 증가되는 문제점을 안고 있다. 본 논문에서는 해시를 위한 길이 비트맵을 이용하여 검색 횟수를 제한할 수 있는 방법을 제안하였다. 실험을 통해 제안된 자료 구조와 해시와 트라이의 형태소 사전 검색 횟수를 비교하였으며 비문 사용이 많은 영역에서 효율적임을 입증하였다.
-
Plot Unit는 이야기를 형성하는 줄거리 또는 줄거리에 나오는 여러 사건을 하나로 구성하여 표현한다. 글을 읽고 Plot Unit를 파악한다는 것은 그 글의 내용을 이해하고 있다는 것이다. 본 논문에서는 이러한 Plot Unit의 정서상태 선호도를 결정하는 방법으로 범주 재분류를 생각하였다. Roget 범주들을 양, 음 기준에 따라서 양범주, 음범주, 중성범주로 재분류하였다. 또한, 개연규칙과 Plot Unit의 대응에 이 결과를 적용해 봄으로써, 범주 재분류를 활용하여 Plot Unit의 사건유형을 결정할 수 있음을 확인하였다.
-
본 논문은 정답 색인 방법을 이용하여 응답 속도가 빠르고 정확한 백과사전 질의응답 시스템을 구현하는 방법을 제안한다. 논문에서 제안한 정답 색인 방법은 대상 문서에서 160여 개의 정답 유형 범주에 해당하는 정답 후보를 인식하고, 정답 후보와 색인 범주에 속하는 키워드를 색인단위로 정의하여 저장하였다. 특히 용언정보에 대해서는 LF(Logical Form)단위로 색인하여 색인 정확도를 높였다. 정답 랭킹에서는 사용자 질문에서 각 단어별로 문장 성분. 단어 가중치 정보 등을 이용하여, 필수단어를 산정하고 이를 정답랭킹의 방법으로 활용하였다. 이러한 방법론은 용언 정보를 활용해야 효과적인 백과사전이라는 문서 도메인의 특성을 반영하고, 빠른 질문 응답 시간을 보장하는 백과사전 질의응답 시스템에 적합하다.
-
인간을 상대하는 자율장치는 고객의 자발적인 협조를 얻기 위해 암시적인 신호에 포함된 감정과 태도를 인지할 수 있어야 한다. 인간에게 음성은 가장 쉽고 자연스럽게 정보를 교환할 수 있는 수단이다. 지금까지 감정과 태도를 이해할 수 있는 자동시스템은 발성문장의 피치와 에너지에 기반한 특징을 활용하였다. 이와 같은 기존의 감정인식 시스템의 성능은 문장의 특정한 억양구간이 감정과 태도와 관련을 갖는다는 언어학적 지식의 활용으로 보다 높은 향상이 가능하다. 본 논문에서는 한국어 문미억양에 대한 언어학적 지식을 피치기반 특징과 다층신경망을 활용하여 구현한 자동시스템에 적용하여 감정인식률을 향상시킨다. 한국어 감정음성 데이터베이스를 대상으로 실험을 실시한 결과
$4\%$ 의 인식률 향상을 확인하였다. -
본 논문에서는 한의학의 관점에서 몸과 마음의 상호작용에 대한 이론에 기반하여 사용자의 주의를 파악하기 위해 필요한 생체 신호의 센싱방법을 제안한다. 생체 신호는 음양오행의 각 부분의 반응을 살필 수 있는 체표의 자극 반응점인 경혈점에서 GSR을 이용하여 측정한다. 제안된 방법은 기존의 서양의학에 기반한 생체 신호 특징 분석을 다른 관점에서 해석할 수 있는 틀을 마련한다. 추출된 생체신호는 감정, 의도 분석에 활용될 수 있으며 추후 유비쿼터스 컴퓨팅 환경에서 인간과 컴퓨터간의 원활한 상호작용을 위한 개인화된 인터페이스 제공에 사용될 수 있다.
-
본 논문에서는 인간과 컴퓨터 사이의 상호작용을 하는 방법중의 하나인 제스처를 인식할 때 필요한 정확한 손 검출 방법을 제안한다. 이를 위해 기존의 다수의 손 영상들 가장 잘 표현하면서도 효과적으로 압축할 수 있는 PCA를 이용해서 특징 벡터를 추출한다. 이어서 특징 벡터간의 Mahalanobis distance를 이용한 분류기에 가중치를 적용하여 사용한다. 또한 시간에 따른 연속적인 영상에서 검출된 이전 영상의 중심점의 위치와 중심점의 motion vector를 이용해서 손이 검출되지 않은 영상의 검출 성능을 보상한다.
-
본 논문에서는 감각형 오브젝트, 사용자의 컨텍스트를 이용한 테이블 기반 증강현실 상호작용 시스템을 제안한다. 기존의 테이블 기반 상호작용 시스템들은 2차원 GUI기반의 인터페이스를 사용하여 상호작용 시 직관성이 결여되었고, 고립된 시스템으로 동작하여 시스템의 활용성 측면에서 제한적이다. 제안된 시스템은 테이블 표면에 관련된 정보를 투영시키고, 일반적인 오브젝트에 마커를 부착하여 카메라를 통해 추적함으로써 일상생활의 오브젝트를 상호작용 도구로 활용한다. 동시에 측면의 디스플레이를 통해 테이블 위에 그래픽 객체를 증강시켜 상호작용의 직관성을 향상시킨다. 또한 vr-UCAM을 통해 사용자의 컨텍스트를 상호작용에 반영하고 (6),칼만 필터의 예측 기법에 기반하여 보정된 오브젝트의 추적 정보를 컨텍스트로써 공유하여 제안된 시스템이 범용적인 인터페이스로 활용될 수 있도록 한다. 실험에서는 제안된 시스템을 가상환경 네비게이션 시스템과 연동하여 유용성을 평가하였다. 제안된 인터페이스는 다양한 형태의 콘텐츠에 대한 사용자의 접근성을 향상시킴으로써 가상현실 및 증강현실 등 다양한 분야의 직관적인 사용자 인터페이스로 사용될 수 있다.
-
본 논문에서는 감각형 객체를 도입한 새로운 햅틱 지원 증강 현실 시스템을 제안한다. 제안된 시스템은 카메라 또는 증강용 마커가 이동할 경우 발생하는 카메라-햅틱 간 캘리브레이션 문제를 해결하여, 햅틱 장비의 좌표계를 증강 객체의 좌표계로 강건하게 변환시킨다. 사용자의 간섭없는 캘리브레이션을 위해, 햅틱 좌표계와 증강 좌표계간의 캘리브레이션은 Hand-Eye방법으로 카메라 이동시 자동으로 수행된다. 또한, 감각형 객체 이동시 증강의 안정성을 높히기 위해 본 논문에서는 칼만 필터 (Kalman filter)를 적용한다. 사용자는 감각형 객체에 증강된 가상 모델을 손에 쥔채로, 햅틱 큐의 끝 부분을 움직여 가상 객체를 조작하고, 동시에 역감을 느끼게 된다. 실험에서는 시스템의 유용성을 보이기 위해, 증강용 감각형 객체, 상호작용 및 햅틱 피드백용 PHANToM, 그리고 디스플레이용 3차원 모니터로 구성된 MP3 조작 시스템을 구현하였다. 제안된 햅틱 지원 증강 현실 시스템은 역감과 증강 현실이 필요한 디자인 시스템이나, 교육 및 엔터테인먼트 응용 등에 접목되어 쓰일 수 있다.
-
IT 기술의 발전과 네트워크 보급은 일상생활만 변화시킨 것이 아니라, 인간의 의사소통 방법에도 영향을 미치고 있다. 대면(Face to Face) 커뮤니케이션은 지금까지 가장 효과적인 방법이라 일컬어 졌지만, 이제는 통신 기술의 발달과 더불어 여러 형태의 유용한 의사소통 방법들이 보급되어 생활화되어가고 있다. 특히 PC의 대중화와 초고속 통신망의 보급, 그리고 휴대전화의 보편화는 의사소통 방법의 다양화에 큰 영향을 주었다 보이스 메일은 텍스트 기반 소통과는 다른 음성으로 의사 전달을 하는 소통 방식이면서도, 대표적 텍스트 기반의 시스템인 이메일처럼 비동기적인 통신 수단이기도 하다. 본 논문은 프로젝트 수행이라는 특수한 경우 보이스 메일을 사용한 구성원들의 의사소통 케이스를 관찰, 분석하고, 이것을 기반으로 프로젝트 수행 시 보이스 메일의 사용성의 특성에 대해 살펴보고자 한다.
-
최근 컴퓨팅 환경의 변화와 함께, 무선 환경에서 발생할 수 있는 다양한 제약사항들을 극복할 수 있는 적응형 시스템에 대한 연구 필요성이 갈수록 높아지고 있다. 본 논문에서는 기존에 다양한 방법으로 연구되고 있는 적응형 시스템들의 단점을 보완하고, 장점을 취합하여, 클라이언트와 프록시 서버에 작업 모듈을 적절히 분산시킨 Hybrid형 시스템을 제안한다. 제안시스템은 주변상황을 인식하고, 이에 대한 대응방안을 결정하는 작업은 클라이언트에서 수행하며, 미디어 콘텐츠를 직접 변경하는 적응 작업은 상대적으로 리소스가 풍부한 프록시 서버에서 수행한다. 이를 통해, 클라이언트와 프록시 서버는 적응에 대한 계산 부하를 적절히 나누어 갖게 되며, 미디어 콘텐츠의 조절뿐만 아니라 실행되고 있는 애플리케이션의 파라매터도 조절이 가능해진다. 또한 클라이언트는 단지 결정에 대한 지시만을 서버로 전송함으로써, 전송되는 메시지의 양을 줄일 수 있고 작업내역과 같은 개인정보 유출을 방지할 수 있다. 본 논문에서는 제안 시스템을 멀티미디어 통신인 '화상회의시스템'에 적용하여 기능을 실험하였으며, 기존의 적응형 시스템들과 기능적 비교를 통해 본 시스템의 유효성을 평가하였다.
-
최근 컴퓨팅 환경의 급격한 발전과 다양화는 소프트웨어 외부 환경의 복잡성과 변화를 야기시켰으며, 소프트웨어는 예상하지 못한 외부 환경 변화에 직면하였을 때, 지속적으로 서비스의 제공과 동시에 동적 변경에 대한 적응 능력을 필요로 하게 되었다. 본 논문에서는 외부 환경의 변화를 인식하고, 대안을 선택하기 위해 '어떻게' 적응하도록 할 것 인가에 대해 모델을 이용한 적응 매카니즘을 제안하며, 시스템이 고려해야 할 컨텍스트 정보들을 모델링을 통하여 소프트웨어가 행위를 변경할 때 이용할 수 있도록 모델링 기법과 모델 기반 자가 적응형 프로세스를 제안한다. 또한, 프로세스를 이용하여 동작하는 모델 기반 자가 적응 시스템의 일반적 모듈들을 제시하고. 그 유효성을 확인하기 위하여 원격 화상 회의 시스템에 적용하였다.
-
대화형 에이전트가 다양한 분야에서 적용됨에 따라서 현실성 있는 대화 생성을 위한 자연언어 생성에 대한 연구가 관심을 끌고 있다. 대화형 에이전트에서는 보통 미리 준비된 문장을 이용하여 사용자와 대화를 수행하지만, 최근에는 문장을 동적으로 생성하고 학습함으로써 보다 유연하고 현실성있는 서비스를 제공하는 대화형 에이전트가 활발히 연구되고 있다. 본 논문에서는 문장계획 트리를 인코딩 방법으로 적용한 대화형 유전자 프로그래밍을 통해 대화형 에이전트의 문장을 생성하는 방법을 제안한다. 피험자 12명을 대상으로 템플릿 기반 시스템과의 비교 실험결과, 제안하는 방법의 유용성을 확인할 수 있었다.
-
유비쿼터스 컴퓨팅 환경을 위해서는 그 구성 개체들 간의 의사소통이 원활히 이루어져야 한다. 이를 위한 중요한 기술 중 하나가 사람이 아닌, 컴퓨터가 데이터를 이해하고 직/간접적으로 처리할 수 있도록 하는 기술이며, 그래서 도입된 개념이 온톨로지(Ontology)이다. 본 논문에서는 이러한 온톨로지을 기반으로 하는 유비쿼터스 컴퓨팅 환경 하에서 서로 다른 온톨로지를 기반으로 하는 구성개체들이 원활하게 서로 이해하고 상호작용할 수 있도록 Ontology Mediator와 Ontology Bridging Service를 기반으로 하는 Bridge Ontology 생성 및 제공 기법을 제안하다.
-
현재의 컴퓨팅 패러다임은 객체간의 대화다. 심지어 인간도 객체의 일부로 보고, 인간의 행동처럼 텍스트로 나타내기 힘든 추상적인 개념들도 관계들을 정의함으로써 온톨로지로 표현할 수 있다. VPW는 이러한 온톨로지들을 바탕으로 사용자의 상황을 표현하고, 이는 컨텍스트 적응형 서비스 객체에게 전달되어 사용자에 맞는 적응형 서비스를 제공받게 된다. 본 논문에서는 컨텍스트 적응형 개인화 서비스를 위해 사용자와 관련된 컨텍스트를 전달하는 방법으로써 사용자를 현존하는 온톨로지들을 이용하여 VPW 모델링 방법으로 표현하는 것과 VPW를 이용하여 사용자에게 알맞은 서비스를 제공하는 방법을 기술하고 있다.
-
최근 정보 제공에 도움을 주는 대화형 에이전트의 연구가 활발히 진행되고 있다. 그러나 대부분의 대화형 에이전트는 사용자의 요구에 미리 준비된 정적인 답변을 제공하므로 친밀감을 주는 다양한 대화를 유지하지 못한다. 이런 한계점을 극복하기 위해 베이지안 네트워크 등의 인공지능 기법을 이용한 사용자 의도 추론을 통해 보다 세밀하고 유연한 대화처리 모델이 연구되고 있다. 본 논문에서는 기존의 정보검색을 위한 대화형 에이전트에서 사용자 의도 추론에 사용된 베이지안 네트워크의 효율을 높이기 위해 노드간의 의미 관계를 표현하는 정보를 결합한 시맨틱 베이지안 네트워크 모델을 제안함으로써 효과적인 사용자 의도 추론을 가능하게 한다. 또한 단발적인 질의 분석이 아닌 점증적 질의 분석 방법으로써, 불충분한 정보로 적절한 답변을 추론하지 못할 경우에 MII(mixed-initiative interaction)를 이용하여 주어진 문제를 해결한다. 실제 모바일 검색 사이트를 대상으로 다양한 유형의 대화를 수행하여 유용성을 확인하였다.
-
실감 재현이 중요한 가상현실 응용에서는 사용자에게 고급 그래픽 환경을 제시하고 사용자의 인터랙션에 즉각적인 피드백을 제공함으로서 실재감과 몰입감을 증대시키는 연구가 진행되어왔다. 실재감, 공간감 전달을 위해 시각과 청각을 함께 활용하는 것이 효과적이나, 가상공간의 특징을 반영한 3차원 사운도 재현 연구는 국내외 통틀어 초기단계에 머물러 있다. 실재감과 공간감을 반영한 3차원 사운드의 재현을 위해서는 음원의 전파, 반사, 잔향 풍의 계산이 사용자의 인터랙션에 따라 새롭게 계산되어야한다. 그러나 사운드 전파경로와 공간을 이루는 모든 폴리곤들과의 충돌을 검사하며 반사 등을 계산하는 것은 실시간성이 중요한 가상현실응용에서는 무리가 따르므로 실 시간성을 보장하기 위한 계산량 축소가 요구된다. 본 논문에서는 다수의 음원이 존재하는 복잡한 가상공간에서의 3차원 사운드를 재현하기 위하여 사운드 신과 계산에 필요한 최소한의 정보를 가지는 오디오 씬 그라프의 공간을 재구성하고 다수의 음원을 대상으로 음원 축소 및 군집화를 적용하여 3차원 사운드효과를 실시간으로 재현하는 알고리즘을 제안한다.
-
본 논문은 모든 항전장비 가운데서도 조종사의 신속한 상황인식과 수많은 정보의 처리를 위하여 지속적으로 발전이 이루어지고 있는 조종석 디스플레이 시스템의 개량형 설계를 제안한다. 현재 항공기 조종석 시스템은 아날로그식 계기판과 함께 다수의 2-D 컬러 디스플레이를 배열한 모델을 사용하고 있다. 본 논문에서 차세대 조종석을 위해 제안하는 시스템은 미공군에서 개발 중인 방식을 도입하여 3-D와 2-D를 흔용한 소수의 대형 디스플레이로 디지털 신호만을 사용한 시스템에 OLED(Organic Light Emitting Diodes) 소자를 적용한 것이다. 이 시스템은 상용칩을 수용한 고성능의 컴퓨터 시스템을 이용하여 초당 50,000개의 3-D triangle을 최신화하여 밝은 지형과 어두운 지형 투명도, 지형특성, 비가시적 지형을 시현한다. 본 설계의 구현을 통하여 고성능의 신호 집약적 시스템 설계의 우수성과 차세대 소자로 각광받는 OLED 디스플레이 채택을 통한 디스플레이 시스템 상의 가시도 향상 및 중량감소 등의 효과가 있어 조종석 디스플레이 시스템의 실용도가 개선들 수 있음을 제안하였다.
-
본 연구에서 제안하는 3차원 인터렉티브 스케칭 시스템은 쉽고 간략한 인터페이스 환경으로 유연하고 정교한 물체 생성 및 변형이 가능한 3차원 개념설계 시스템이다. 제품의 설계 과정에서 무선 완드를 이용하여 3차원 공간에 일련의 프리핸드 스트로크로 곡면을 정의하고 생성된 곡면은 캘리그래픽 스트로크를 이용하여 실시간으로 변형할 수 있는 공간 곡면의 정의와 실시간 자유 변형 알고리즘을 포함한다. 공간 곡면 정의 알고리즘은 무선완드의 입력 방위에 따라 상이한 물체를 생성하고 변형하는 기술로서 물체 생성시 필요한 인터페이스의 양을 최소화 할 수 있다. 또한 절러 차례 캘리그라픽 스트로크 입력으로 수정과 변형이 실시간 통합적으로 이루어지는 자유변형 알고리즘은 기존의 공학적. 수치적 접근방식에서 탈피한 직관적이며 유연한 모델링 방식을 제안하여 전문가가 아니더라도 쉽게 공학적 모델을 생성. 변형 할 수 있다. 누구나 쉽게 본 시스템의 도움으로 직관적이며 공학적으로 건전한 제품을 설계할 수 있는 디자인 설계의 획기적인 변화를 마련할 것이다.
-
본 연구에서는 2003년부터 정보통신부의 주도로 차세대 신성장 동력 산업으로 지능형 로봇 URC 프로젝트의 산업화 성공을 위하여 로봇 요소기술 뿐만 아니라, 컴퓨터과학과 정보통신공학의 IT와 기계공학의 RT를 인체공학, 심리학, 뇌과학, 언어학, 인지과학, 행동학 등의 복합과학적 HRI 연구와 결합하는 학제간 유비쿼터스 로봇기술 컨버전스의 필요성을 제시하고 정책적 육성 전략을 제시하였다. 즉, 복합과학적 HRI 연구 인력을 발굴하고 연구지원, 성인보다는 아동과 노인을 대상으로 HRI 현장 실험연구가 다양하게 이루어지도록 지원, HRI에 기반한 로봇 서비스를 정의하여 국제적 BM특허와 로봇 컨텐츠 표준화 로봇시장의 확대를 위한 사회학적 HRI 연구와 로봇의 역기능에 대한 HRI연구와 지원이 이루어져야 하겠다.
-
정보검색에서의 사용자의 다양한 질의어는 객관적인 키워드에서 인간이 주관적으로 생각하고 느끼는 감정요소를 동반한 어휘들로 범위가 넓어지고 있다. 이에 본 논문에서는 감정에 기반한 신문기사 검색을 위하여 기사의 구문 분석 및 품사 태깅 절차를 거쳐 동사를 추출하고 그 중 감점을 내포하는 동사들의 관계를 이용하여 신문기사의 감정을 추출한다. 감정동사의 관계를 창조하기 위하여 감정동사들을 OWL/RDF(S)를 이용해서 온톨로지를 구축하였고 에지(Edge)기반의 유사도 측정방법을 제안하였다. 제안한 방법은 여러 가지 감정을 추출하고 감정 정도를 측정할 수 있기 때문에 이는 향후 감정기반 신문기사 검색에 효과적으로 사용될 수 있을 것이다.
-
유비쿼터스 컴퓨팅 환경 실현을 위해 차량의 정보화 능력 향상은 필수적이나 이에 관련한 연구는 미비한 편이다. 본 논문은 고성능의 내장형 컴퓨터 및 평판 디스플레이 기술을 자동차 계기 시스템에 적용하여 차량의 컴퓨팅 능력을 증대시키고, 이러한 물리적 환경에 적합한 계기 시스템 설계 모델을 제시한다 제안하는 계기시스템은 디지털 디스플레이의 특성을 살린 레이아웃과 그래픽 효과를 통해 상황에 따라 동적으로 운용된다. 또한 그래픽 인터페이스와 결합한 모바일 기기가 제공되어 사용자가 손쉽게 계기 시스템의 기능을 제어할 수 있다.
-
아바타는 최근 각광 받고 있는 기술로서 다양한 분야에서 많은 활용 및 발전이 기대된다. 현재 아바타 행위 표현 및 제어를 위해 다양한 기법들이 연구되고 있으나, 대부분 객체와의 상호작용이 결여된 아바타 자체의 동작을 대상으로 하고 있다. 그러나 가상환경에서 아바타를 활용하기 위해서는 여러 객체와의 상호작용을 통한 행위가 필수적으로 요구되며, 이에 대한 아바타-객체간의 행위 모델 및 스크립트에 대한 연구가 이루어져야 한다. 본 논문에서는 3D 가상환경에서 아바타의 제어를 보다 용이하게 하기 위해서 아바타-객체 행위 표현을 위해 객체기반 아바타 행위 표현 및 제어 스크립트를 정의하였다. 제안 모델에서 는 단순히 객체가 모든 행위를 사용자에게 나열하는 것이 아니라, 객체 상태에 따라 사용가능한 적합한 행위를 사용자에게 제공하기 위해서 컨텍스트에 기반한 객체-아바타 행위 모델을 제안하고 있다. 제안 기법을 실제 3D 환경와 프로토타입 시스템으로 구현해본 결과, 사용자는 제안 객체 모델의 컨텍스트에 따라 변화하는 객체의 행위 인터페이스를 통하여 보다 용이하게 아바타-객체간의 행위를 제어할 수 있었다.
-
차세대 컴퓨팅 환경에서의 프로젝터 기반 증강 현실 디스플레이 시스템은 전반적인 컴퓨터가 가지고 있는 공간상의 제한과 한계점을 극복하고 발전하고 있다. 그러나 시스템 구축 시 여러 장비가 요구되어 비용이 높아지거나 주위 환경에 조화롭지 못하다는 단점을 지니고 있다. 본 논문에서는 최근 범용 그래픽 카드에서 지원하는 듀얼 모니터 기능과 프로젝터를 이용하여 일반 모니터 환경을 실세계의 환경으로 확장할 수 있는 간단한 기법을 제안한다. 본 논문에서 제안하는 방법을 통해 컴퓨터로부터 실세계 환경으로 정보의 이동을 자연스럽게 할 수 있으며 실세계에 편재한 다양한 사물을 컴퓨터 인터페이스의 일부로 채택함으로서 주위 환경에 조화로운 확장 가능한 컴퓨팅 공간을 구축할 수 있다.
-
최근 주요 이동통신 사업자, 단말기/칩 제조업체, 콘텐츠 제공업자들 사이에는 모바일 3D 분야가 가장 큰 이슈로 떠오르고 있다. 이러한 환경을 기반으로 모바일 장치에서 3차원 아바타 애니메이션 연구가 진행되고 있다. 이는 아바타의 자연스러운 동작은 사용자에게 아바타가 살아있는 듯한 느낌(Life-likeness)과 사실감(Believability)을 심어주어 보다 친숙한 인터페이스로 활용될 수 있고 이에 따라 채팅이나 온라인 게임 외에도 교육, 쇼핑몰, 비즈니스 등 다양한 분야로 확대되고 있기 때문이다. 하지만 지금까지의 연구는 자연스러운 모션 생성에 집중되어 있을 뿐, 어떻게 쉽게 아바타는 제어할 것 인가에 대한 연구가 적었다. 특히 모바일 환경에서 효율적인 아바타 동작 제어를 위한 연구는 부족하다 할 수 있다. 본 논문에서는 모바일 환경에서 효율적인 아바타 동작을 제어를 위해 스크립트(Script) 기반의 아바타 동작 제어 기법을 제안한다. 모션 생성을 위해 아바타 동작 스크립트(Avatar Motion Script)를 정의하여 아바타 애니메이션의 기록, 재생이 가능하다. 둘째 계층적 스크립트(Multi-Level Script) 기법을 이용하여 적은 양의 데이터만으로도 아바타 동작 제어가 가능하다. 셋째 어느 환경에서도 Motion이 생성, 재생이 가능하한 플랫폼 독립적 구조이다. 넷째, 키 프레임(Key Frame) 기반의 모션을 이용하여 아바타의 상황 상황에 모션이 변하는 동적 동작 생성이 가능하다.
-
Personal Kiosk: Computing the Right Set of Services based on User Location in Ubiquitous Environment최근 유비쿼터스 컴퓨팅의 발전으로 인간에게 편리한 생활환경을 제공하기 위한 다양한 서비스들이 연구되고 있다. 향후 이런 서비스가 정차 현실화되면서 인간의 생활환경에는 많은 수의 서비스들이 제공될 것이다. 하지만 인간을 편리하게 하는 서비스라 할지라도 그 수가 많아지면 이를 이용하는 사용자에게 혼란을 초래할 수 있다. 그렇기 때문에 유비쿼터스 환경에서는 사용자 주위의 많은 서비스들로부터 사용자에게 유용한 서비스와 그렇지 않은 서비스를 결정할 수 있는 방법이 필요하다. 본 논문에서는 local area의 물리공간을 모델링하고 물리공간과 유비쿼터스 서비스의 관계를 정의하여 사용자가 서비스를 요청한 공간을 바탕으로 사용자에게 유용한 서비스와 그렇지 않는 서비스를 구분할 수 있는 방법을 제시한다.
-
본 연구는 한국과학기술정보연구원(KISTI)의 과학기술지식정보 서비스의 일환으로 수요자에게 각 개인별 전공, 관심 및 연구 분야 등에 따라 적합한 자료를 정기적으로 제공하는 맞춤정보서비스에 관한 것으로 수요자의 기호에 안게 급변하는 과학기술 및 응용분야의 신규정보를 제공하는 방법과 절차 그리고 과학기술 포털 맞춤정보 서비스 시스템의 구성을 기술한다. 또한 맞춤정보 서비스 시스템에서 수요자에게 자료가 제공되기까지의 요구전달 프로세스 및 발송 프로세스 등을 기술한다.
-
2D, 3D 아바타에 대한 연구가 활발히 진행되고 있다. 미국 펜실베니아 대학의 프리젠터 젝을 비롯하여 스크립트 언어를 사용하여 아바타를 제어하고자 하는 일본의 TVML, 네덜란드의 가상환경 미팅룸등 다양한 연구가 있다. 3D 아바타 제어에서 해결해야할 과제로 동기화가 지적되고 있다. 3D 아바타의 행동과 아바타의 멘트등의 길이는 상황에 따라 다르기 때문에 스크립트 언어 자원에서 일일이 동기화 시키는 것은 많은 시간과 노력이 요구된다. 따라서 본 연구에서는 자동적으로 동기화가 가능한 스크립트 생성에 대해 연구한다.
-
휴대 전화와 PDA의 급속한 보급과 더불어, 휴대용 장치에서의 간단한 텍스트 입력 방식 연구의 중요성도 나날이 증대되고 있다. 현재 다양한 방식의 입력 방법들이 존재하나, 한글의 특성을 반영하지 않아 한글 입력에 적용하기 어려운 단점들이 존재한다. 본 연구에서는 2차원 평면상의 연속적인 제스처와 언어 모델을 이용하고, 한글의 특성을 고려한 새로운 한글 입력 방식을 제안한다.
-
기존의 문서 분류 방법들은 대게 기존의 기계 학습의 방법을 그대로 가져오거나 문서라는 데이터에 맞춰 약간의 변형을 가한 방법들이 대부분이다. 본 논문에서는 기존의 방법에서 벗어나 데이터 마이닝 분야에서 쓰이는 FP-Tree 방법을 이용하여 문서내의 문장들의 패턴을 저장하고 이를 사용하여 문서 분류를 하는 방법을 소개한다.
-
문서를 분류하기 위해서는 분류주제에 맞춰 미리 분류가 된 자료(labeled data)가 필요하다. 하지만 미리 분류가 된 자료를 만들기 위해서는 사람이 직접 그 문서의 의미를 해석하고 일일이 분류를 해야 하기 때문에 시간이 많이 소모가 된다. 본 논문에서는 비록 사랑이 직접 분류한 자료를 이용하는 것에 비해서 분류 정확도는 조금 떨어지지만, 대신 주제어와 미분류 문서(unlabeled data)를 이용해서 문서를 분류하는 방법을 제시하려고 한다. 이와 같은 주제어와 미분류 문서의 경우에는 구하기가 쉽고, 사랑이 일일이 분류하는 작업이 필요로 하지 않기 때문에 비용과 시간이 크게 절약이 된다는 장정이 있다.
-
본 논문에서는 자율 에이전트에 의해 미지의 공간을 탐사하는 실시간 그래프 탐색 알고리즘 DFS-RTA*와 DFS-PHA*를 제안하고 그 효율성을 비교한다. 두 알고리즘들은 모두 깊이-우선 탐색(DFS)을 기초로 하고 있으며, 직전 노드로의 빠른 후진(backtrack) 을 위해 각각 실시간 최단 경로 탐색 방법인 RTA*와 PHA*를 적용하는 것이 특징이다. 본 논문에서는 대표적인 3차원 온라인 게임 환경인 Unreal Tournament 게임과 지능형 캐릭터 에이전트인 KGBot를 이용한 실험을 통해 두 탐색 알고리즘의 완전성과 효율성을 분석해본다.
-
군집 유효화 평가란 기본적으로 클래스 (Class)에 대한 정보가 주어지지 않은 상태에서 다양한 입력 변수에 의해 발생되는 군집화의 결과들을 평가하여 그들 중에서 주어진 데이터 집합의 자연적인 분할 상태에 가장 적합한 결과를 찾는 기법을 말한다. 군집 유효화 평가에서 그 척도로 사용되는 것이 군집 유효화 지수이다. 본 논문에서는 우선 현존하는 다양한 군집 유효화 지수들 중에서 합 형식을 가지는 지수들을 다룬다. 구체적으로 이 지수들의 설계 원리와 각 지수들의 부합성 (Compliance) 분석한다. 다음으로 분석을 통해 밝혀진 그들의 단점을 보완할 수 있는 새로운 군집 유효화 지수들을 제안한다. 마지막으로 기존의 군집 유효화 지수들을 포함한 새로이 제안한 지수들의 성능을 실험 학습을 통해 평가한다.
-
군집 유효화 평가는 군집화 알고리즘을 진정한 의미의 비감독 학습이 가능하도록 만든다는 의미에서 그 중요성이 더해지고 있다. 본 논문에서는 이 군집 유효화 평가에 일반적으로 이용되는 군집 유효화 지수들의 설계원리를 분석하고 기존 지수들의 부합성을 분석한다. 우리는 제 (I) 부에서 합 형식의 지수들을 다루었으며, 본 논문에서는 비 형식의 지수들을 다룬다. 합형식의 CVI에서처럼 저역 필터링의 문제점을 해결하였으며, 또한, 부작용 없이 비형식의 지수들의 성능을 향상시킬 수 있는 새로운 기법을 제시한다. 새로운 지수들의 성능은 실험 학습을 통해 제시된다.
-
컴퓨터 게임에서 움직이는 캐릭터를 위한 자연스러운 경로의 계획은 게임의 현실감을 측정하는 중요한 척도이다. Voronoi 다이어그램은 컴퓨터 기하학 분야에서 잘 알려진 로봇 경로계획 알고리즘 중 하나이다. Voronoi 다이어그램은 두 장애물로부터 같은 거리에 있는 선분과 점들로 구성되어 생성된 경로가 장애물로부터 멀리 떨어진 안전한 길이고 사람이 실제로 택하는 경로와 유사하다는 것이 장점이다. 본 논문에서는 셀-기반 게임 환경에서 움직이는 캐릭터의 이동경로를 찾기 위해 Voronoi 다이어그램을 적용하는 방법을 제안하고 구현한다. 제안된 방식과 기존에 많이 사용되던 그리드 기반 A* 알고리즘의 적용 결과를 비교 분석한다.
-
온라인 및 오프라인 상에서 추천시스템에 대한 요구가 커지고 있으며 이에 관련해 않은 연구가 이루어지고 있다. 추천시스템은 마케팅 활용의 관점에서 목표 상품에 대한 반응 가능성이 높은 고객군을 추천하는 타겟마케팅 추천시스템과 고객 개인별로 구매 가능성이 높은 상품을 추천하는 개인화 추천시스템으로 구분할 수 있다. 지금까지의 추천시스템에 관한 연구는 대부분 개인화 추천시스템의 효율 향상에 목표를 두고 있다. 그러나 기업의 타겟마케팅에 대한 요구를 적절히 지원하지 못하고 있어 타겟마케팅에 대한 연구가 필요하다. 본 연구에서는 상품별 구매 패턴을 이용하는 프로파일 기반 추천 방법을 제안하고 이 방법과 기존의 협력적 추천 방법을 결합하여 특정 상품에 반응 가능성이 높은 고객을 추천하는 방법을 제안한다. 프로파일 기반 추천에서는 카이스퀘어 검정을 사용하여 상품별로 구매 패턴에 영향을 미치는 요인을 추출하고 이를 이용하여 특징 고객군을 선별하여 전체 고객군과 특징 고객과의 엔트로피(Entropy)의 변이 정도를 예측값으로 사용한다. 실험결과, 프로파일 기반 추천과 협력적 추천을 결합하여 추천하는 방법은 한 가지 방법을 사용할 때 보다 좋은 추천 정확도를 나타내었다.
-
협동적 여과를 이용한 추천 시스템은 데이터의 희소성 문제(sparseness problem)와 초기 추천 문제 (cold-start problem)에 대해 취약점을 가지고 있다. 협동적 여과를 이용한 추천 시스템에서 사용하는 선호도 데이터에 아이템들의 전체 수량에 비해 매우 적은 양의 아이템 선호도만 존재한다면 사용자들의 유사도 측정에 문제를 발생시켜 극단적인 경우엔 협동적 추천이 불가능할 경우가 발생한다. 이와 같은 문제는 선호도 데이터에 나타난 아이템들의 총수에 비해 사용자가 선호(구매)한 아이템이 극히 적은 수량으로 존재하기 때문이며 새로운 사용자의 경우에는 아이템 선호도 정보가 전혀 없기 때문에 유사 사용자를 추출하지 못하여 아이템을 전혀 추천할 수 없는 문제가 발생한다. 본 논문에서는 희소성이 높은 선호도 데이터를 희소하지 않은 상태로 변형하는 희소 데이터 변형 기법을 제안한다. 희소 데이터 변형 기법은 희소데이터에 나타난 사용자와 아이템의 추가 속성 정보의 확률분포를 이용하여 알려지지 않은 선호도 값을 예측함으로써 희소성이 높은 선호도 데이터를 변경하고, 변경된 선호도 데이터를 협동적 추천에 적용하여 추천 성능을 향상시킨다. 이와 같은 선호도 데이터 변경 기법을 데이터 블러링(data blurring)이라 한다. 몇가지 실험 결과를 통해 제안된 기법의 효과를 확인하였다.
-
사용자와 관련한 환3 데이터로부터 유용한 정보를 만들어 내기 위하여 다양한 형태의 데이터를 이용한 다양한 방법이 연구되고 있다. 그 중 사용자의 이동 경로는 공간상의 이동 위치를 예측하고 유용한 서비스를 제공하는데 유용하게 사용될 수 있다. 본 논문에서는 사용자의 이동 경로에 대한 분석과 예측기술을 제안한다. 환경으로부터 발생한 사용자의 이동 경로를 수집하고 수집된 데이터는 이동 경로 선택(Path Selection) 방법을 이용하여 유사성이 가장 높은 경로를 선택하여 준다. 선택된 경로는 시간에 따른 공간 정보 표현 및 위치에 따른 시간 예측 서비스를 위하여 사용가능 하며, 실험을 통하여 유사성이 높은 이동 경로를 선택하는 모습을 확인하였다.
-
서비스 로봇 분야에서 물체를 인식하고 장면을 이해하는 것은 매우 중요하다. 전통적인 방법들은 기하학적 모델을 기반으로 물체를 인식하였으나 불확실하고 동적인 환경에서 이러한 방법은 한계를 갖는다. 이에 최근 지식 기반의 접근 방법을 통해 이러한 부분을 보완하는 연구가 이루어지고 있다. 본 논문에서는 효과적인 물체 탐색을 위해 베이지안 네트워크를 사용하여 대상 물체의 존재 여부를 추론하는 방법을 제안한다. 이를 위해 트리구조의 계층적 베이지안 네트워크를 사용하였고 물체들의 관계를 활동을 기준으로 모델링 하였다. 6가지 장소를 기반으로 한 실험 결과,
$86.5\%$ 의 정확도를 보여주었다. -
은닉 마코프 모델은 이산 동역학을 표현할 수 있는 확률 모형이다. 우도 함수 최적화를 수행하는 전통적인 Baum-Welch 학습 알고리즘은 국소해로 수령하기 쉬우며, 우도함수의 특성상 복잡한 모델을 선호하는 바이어스가 존재한다. 베이지안 프레임워크에서는 파라미터를 랜덤 변수로 보고 이에 대한 사후 확률 분포를 추정하여 이 문제를 해결할 수 있다. 본 논문에서는 베이지안 추정을 위한 결정론적 근사화 기법인 변분 베이지안 방법을 이용, 출력 노드에 가우시안 혼합 노드를 지니는 일반화된 HMM의 추론 방법을 유도한다. 인공 데이터에 대한 실험을 통해, 본 방법이 효과적인 HMM 학습을 수행할 수 있음을 보인다.
-
대규모 지문인식 시스템에서 비교해야할 지문의 수를 줄이기 위해서 지문분류는 필수적인 과정이다. 최근 이진분류기인 지지 벡터 기계(Support Vector Machine: SVM)를 이용한 지문분류 기법이 많이 연구되고 있다. 본 논문에서는 다중부류 지문분류에 적합하도록 자기 구성 지도(Self-Organizing Map:SOM)를 이용하여 OVA(One-Vs-All) SVM들을 결합하는 지문분류 기법을 제안한다. SOM을 이용하여 OVA SVM들을 동적으로 결합하기 위한 결합 지도를 생성하여 지문분류 성능을 높인다. 지문분류에 있어 대표적인 NIST-4 지문 데이터베이스를 대상으로 Jain이 구축한 FingerCode 데이터베이스에 제안하는 방법을 적용하여
$1.8\%$ 의 거부율에서$90.5\%$ 의 분류율을 획득하였으며, 기존의 결합 방법인 승자독식(Winner-takes-all)과 다수결 투표(Majority vote)보다 높은 성능을 확인하였다. -
결정 트리(Decision Tree)는 주어진 데이터의 경향을 학습하는 데 사용되는 대표적인 방식이다. 이것은 주어진 데이터를 구조화하기 위하여 데이터의 속성과 정보의 엔트로피에 기반을 둔 정보획득량을 이용한다. 본 논문에서는 유비쿼터스 환경에서 사용자 프로파일 정보처럼 시간에 따라 그 경향이 변하는 데이터에 유용하게 적용할 수 있는 시간 가중치 엔트로피를 정의한다. 그리고 ID3 알고리즘을 기반으로 새롭게 제안하는 시간 가중치 엔트로피를 이용하는 향상된 ID3 알고리즘을 쓰고 사용자의 경향을 분석한다. 본 논문에서 제안하는 엔트로피를 이용하는 방식은 데이터들의 시간에 관한 영향을 고려해서 기준방식보다 분석결과가 더욱 유리하다. 두 방식의 비교 테스트 결과를 보면 시간 가중치 엔트로피를 이용하는 알고리즘은 기존의 ID3 알고리즘보다 구성된 트리의 구조가 매우 간단하고 유리하다.
-
베이지안 네트워크는 확률이론에 기초해 불확실성이 존재하는 실세계 문제를 해결하는데 많은 기여를 하고 있다. 최근 네트워크 구조를 데이터로부터 자동으로 학습하는 많은 연구가 이루어져 보다 손쉽게 많은 사람들이 사용할 수 있게 되었다. 하지만 한번 학습하여 고정된 네트워크의 구조는 새롭게 수집되는 데이터의 특성을 잘 반영하지 못하는 문제를 지니고 있다. 환경의 변화에 맞게 지속적으로 네트워크 구조를 갱신하기 위한 연구가 진행되고 있으며 본 연구에서는 Lam이 제안한 MDL기반 평가함수를 이용한 진화적 갱신 방법을 제안하여 갱신 성능을 향상시키고자 한다. 벤치마크 네트워크인 ASIA에 대한 실험 결과 제안한 방법이 기존의 지역적 탐색 방법에 비해 향상된 성능을 제공함을 확인하였다.
-
다양한 형태의 상황 정보를 결합하여 추론하기 위해 베이지안 네트워크를 많이 사용한다. 그러나 일반 베이지안 네트워크는 각 노드의 상태가 이산적이기 때문에, 연속적이거나 여러 상태가 동시에 존재할 수 있는 현실의 상황 정보를 처리하기 어렵다. 본 논문에서는 이와 같은 베이지안 네트워크의 단점을 보완하기 위해 다양한 형태의 상황 정보를 퍼지를 통해 전처리하여 베이지안 네트워크를 통해 추론하는 퍼지 베이지안 네트워크를 제안한다. 유용성을 보이기 위해 음악 추천 에이전트를 설계하여 일반 베이지안 네트워크와 비교 실험한 결과, 제안한 방법으로 다양한 상황 정보에 대해 유연한 처리가 가능함을 확인하였다.
-
지능형 로봇 기술이 발전하면서 영상에서 장면을 이해하는 연구가 많은 관심을 받고 있으며, 최근에는 불확실한 환경에서도 좋은 성능을 발휘할 수 있는 확률적 접근 방법이 많이 연구되고 있다. 본 논문에서는 확률적 모델링이 가능한 베이지안 네트워크(BN)를 이용해서 장면 인식 추론 모듈을 설계하고, 실제 환경에서 얻어진 증거 및 베이지안 추론 결과를 결합하여 분류 성능을 향상시키기 위한 방법을 제안한다. 영상 정보는 시간에 대해 연속성을 가지고 있기 때문에, 증거 정보와 베이지안 추론 결과들을 적절히 결합하면 더 좋은 결과를 예상할 수 있으며, 본 논문에서는 확신 요소(Certainty Factor: CF) 분석에 의한 결합 방법을 사용하였다. 성능 평가 실험을 위해서 SET (Scale Invariant Feature Transform) 기법을 이용하여 물체 인식 처리를 수행하고, 여기서 얻어진 데이터를 베이지안 추론의 증거로 사용하였으며, 전문가의 CF 값 정의에 의한 베이지안 네트워크 설계 방법을 이용하였다.
-
영상 정보를 통한 실내 환경의 인식은 지능형 로봇에서 매우 중요한 문제이다. 영상을 통한 실내 환경정보는 로봇의 각도나 위치의 영향으로 불확실해질 수 있으므로 영상 인식 기법은 이러한 불확실함에 강인함을 갖고 있어야 한다. 본 논문에서는 불확실하게 들어오는 실내 환경 정보에서 PCA를 통한 위치 정보와 SIFT를 통한 물체 존재 정보를 추출하고 이를 베이지안 네트워크에 적용하여 장소 및 물체를 인식하는 방법을 제안한다. 실제 실내 환경에서의 실험을 통하여 8곳의 위치 및 20개의 오브젝트를 효과적으로 인식하는 것을 확인할 수 있었으며 위치에 따른 물체의 존재 확률 추론 및 존재 물체에 의한 위치 확률의 수정 등 다양한 방향의 추론도 가능하다.
-
본 논문에서는 온톨로지 기반의 질의-응답을 위한 지능형 웹서비스에 관해 기술하고자 한다. 이 웹서비스는 질의 에이전트와 응답 에이전트 간의 OWL-QL 메시지 교환에 의해서 이루어진다. OWL-QL은 OWL 언어로 표현된 지식베이스를 이용하는 시맨틱 웹 에이전트들 간의 질의-응답 처리를 위한 정형화된 언어이며, 프로토콜이다. OWL-QL에서 응답 에이전트는 질의 에이전트로부터 주어진 질의에 대한 응답처리를 위해 자동화된 추론을 전개한다. 본 논문에서는 시스템을 구성하는 각 에이전트들의 기능과 구조에 관해 설명하고, 질의 에이전트 내에 포함된 그래픽 기반의 OWL-QL 질의 작성기의 유용성에 관해 설명한다.
-
본 연구는 인공지능과 정보검색, 웹 기반 시스템 분야의 새로운 추세인 시맨틱 웹 기술을 이용하여 웹 문서의 변경을 자동으로 사용자에게 알려주는 시스템을 개발하고자 한다. 기존의 시스템의 문제점인 신택스 중심의 변화 탐지에서 벗어나 시맨틱 중심의 변화 탐지에 목표를 두어, 의미가 있는 변경 사항만을 찾아 알려주어 사용자에게 유용한 정보가 될 것이다. 또한 특정 도메인에 중심 된 변경 사항을 사용자에게 알려준다면 더욱 유용한 시스템이 될 것이다. 이를 위하여 특정 도메인과 시나리오를 가정한 온톨로지를 구축하고 이를 이용하여 시맨틱 중심의 변화 탐지를 가능하게 한다.
-
시맨틱 웹과 시맨틱 웹 서비스의 논리적 기반이 되는 온톨로지에 대한 연구가 활발히 진행되고 있다. W3C는 웹 온톨로지 기술을 위한 표준 언어로 OWL을 발표했고, OWL로 기술된 온톨로지는 웹 서비스, 유비쿼터스 컴퓨팅 등에서 활용되고 있다. 그러나 OWL의 복잡한 문법 구조는 OWL 온틀로지 개발을 어렵게 하고 있어, 직관적으로 OWL 온틀로지를 개발할 수 있는 방법이 요구되었고. 이를 위해 Protege 등 많은 온톨로지 편집기들이 개발되었다. 본 논문에서는 쉬운 OWL 온톨로지 편집을 위해 개체 중심의 온톨로지 시각화를 통한 온톨로지 편집기 개발에 관한 내용을 담고 있다. 이 편집기는 JDK 1.4 환경에서 개발되었으며 OWL 온톨로지 분석을 위해 Jena2 API를 사용하였다.
-
차세대 웹으로 기대되는 시맨틱웹에 대한 기술에 대한 관심이 증대되고 있어 시맨틱웹에서 가장 중요시 되는 온톨로지의 대한 관리에 대한 연구가 활발히 진행중이다. 온톨로지 관리에 대한 연구로는 KAON, OntoServer등이 진행되고 있으며 이러한 연구에서는 RDF, DAML등의 온톨로지 언어를 지원한다. 이에 본 연구에서는 W3C에서 표준 온톨로지 언어로 지정한 OWL을 지원하는 온톨로지 저장소에 대한 아키텍처를 제시하고자 한다.
-
정보 추출은 텍스트로 되어 있는 비 정형화된 데이터로부터 정형화된 정보를 추출하는 분야이다. 기존의 정보 추출이 구문 중심의 방법인데 비해 본 논문에서는 시맨틱 웹과 온톨로지를 이용한 의미 기반의 정보 추출을 시도한다. 또한 본 논문에서는 기존의 정보 추출 모델을 분류해 보고 반자동 정보 추출이라는 새로운 모델을 제시한다. 이 모델에 기반하여 개인 정보를 자동으로 정형화 시켜주는 정보 추출 도구를 개발하고 이를 소개한다.
-
Ontology Management Tool for Editing, Integration and Inference: Primitive Design and Implementation온톨로지를 효율적으로 관리하기 위한 관리도구의 프레임워크로써, 온톨로지 편집과 통합, 추론을 다루고 있다. 온톨로지 편집에 있어 텍스트 기반의 편집과 한국어 사용자를 위한 편집 방식 지원 그리고 semi-Automatic 편집 및 템플릿 생성에 대해 다루고 있으며 온톨로지 통합과 관련된 여러 알고리즘을 구상하고, 온톨로지에 대한 정당성 체크 및 향후 유비추론을 위한 프레임워크 개발에 대한 통합 측면과 추론에 대해 언급한다.
-
텍스트 형태의 문서에는 않은 종류의 유용한 관계가 존재한다. 이러한 관계들을 문서에서 자동으로 찾아내는 것은 정보검색 분야에서 매우 중요한 작업 중 하나이다. 그러나 각각의 관계마다 다양한 형태의 패턴이 존재하기 때문에 많은 양의 문서에서 이러한 관계들을 찾아내는 것은 쉬운 일이 아니다. 이러한 어려움을 해결하기 위해 본 논문에서는 일반화된 패턴을 이용하여 자동으로 관계를 찾는 방법을 제안한다. 본 논문에서 제안하는 방법은 초기에 사용자로부터 얻은 정보를 이용하여 관계를 자동으로 찾는다. 약 1,000,000개의 문장을 이용해 실험한 결과 자동으로 일반화된 패턴을 이용하는 방법을 이용할 경우 그렇지 않은 경우보다 성능이 향상됨을 확인할 수 있었다.
-
배경음악 서비스는 최근 저작권법의 강화, Music Contents 시장의 발전과 함께 많은 화두가 되고 있는 분야이다. 하지만 국내의 배경 음악 관련 현황은 일괄 CD를 구입하고 대형업체만이 소수의 전문가로만 운영하여 관련 법규 대응과 음악 제공 수준이 극히 저조한 상태이다. 이러한 문제를 해결하기 위해 본 논문에서는 배경음악과 관련된 업계의 상황과 선진 사례를 기준으로 개인화된 배경음악 시스템의 표준 구조 운영 모델 및 시스템 구조 모델을 제시 하고자 한다. 표준 운영 구조 모델은 취약한 국내 서비스 환경하에서의 최소한의 운영 요구 사항과 운영목표 달성을 위한 Guideline을 제시하고 함께 시스템 구조 모델을 통해 그 실현 가능성을 살펴보았다.
-
막횡단 단백질(Transmembrane Protein)은 약물표적(drug target)으로 신약개발로 대표되는 바이오 산업에서 중요한 연구대상이 되고 있다. 막횡단 단백질의 구조는 실험적 기법 또는 컴퓨터 모델링 기술을 이용하여 연구되고 있으며 컴퓨터 모델링 방법 중에서는 Hidden Markov Mode(HMM)에 기반한 시스템들이 좋은 성능을 보이고 있다. 그런데 이러한 시스템들은 구조형성에 관여하는 단백질의 다양한 특성에 대한 지식은 많이 고려하고 있지 않다. 만약 이러한 특성들이 고려된다면 구조 예측에 효과적인 보다 지능적인 모델을 만드는데 도움을 줄 수 있을 것이다. 본 논문은 단백질의 특성과 관련한 다양한 정보들을 융합하는데 효율적인 최대엔트로피모델(Maximum Entropy Model)을 이용하여 막횡단 단백질의 서열(sequence)로부터 막횡단 지역을 예측하는 방법을 제시하고자 한다.
-
최근 새로운 데이터마이닝 방법인 지도 군집화가 소개되고 있다. 지도 군집화의 목적은 동일한 클래스가 한 군집에 포함되도록 하는 것이다. 지도 군집화는 데이터에 대한 배경 지식을 획득하거나 분류 방법의 성능을 향상시키기 위한 방법으로 사용된다. 그러나 군집화 방법에서 파생된 지도 군집화 역시 군집화 개수 설정 방법에 따라 효율성이 좌우된다. 따라서 클래스 분포에 따라 최적의 지도 군집화 개수를 찾기 위해 진화알고리즘을 적용할 수 있으나, 진화알고리즘은 대용량 데이터를 처리할 경우 수행 시간이 증가되어 효율성이 감소되는 문제가 있다. 본 논문은 지도 군집화보다 강인한인 지도 퍼지 군집화를 효율적으로 생성하기 위해 진화성이 우수한 휴리스틱 분할 진화알고리즘을 제안한다. 휴리스틱 분할 진화알고리즘은 개체를 생성할 때 문제영역의 지식을 반영한 휴리스틱 연산으로 탐색 시간을 단축시키고, 개체 평가 단계에서 전체 데이터 대신 샘플링된 부분 데이터들을 이용하여 진화하는 분할 진화 방법으로 수행 시간을 단축시킴으로써 진화알고리즘의 효율성을 높인다. 또한 효율적으로 개체를 평가하기 위해 지도 퍼지 군집화 알고리즘인 지도 분할 군집화 알고리즘(SPC: supervised partitional clustering)을 제안한다. 제안한 방법은 이차원 실험 데이터에 대해서 정확성과 효율성을 분석하여 그 타당성을 확인한다.
-
본 논문은 비전을 기반으로 한 감정인식 로봇에 관한 논문이다. 피부스킨칼라와 얼굴의 기하학적 정보를 이용한 얼굴검출과 감정인식 알고리즘을 제안하고, 개발한 로봇 시스템을 설명한다. 얼굴 검출은 RGB 칼라 공간을 CIElab칼라 공간으로 변환하여, 피부스킨 후보영역을 추출하고, Face Filter로 얼굴의 기하학적 상관관계를 통하여 얼굴을 검출한다. 기하학적인 특징을 이용하여 눈, 코, 입의 위치를 판별하여 표정 인식의 기본 데이터로 활용한다. 눈썹과 입의 영역에 감정 인식 윈도우를 적용하여, 윈도우 내에서의 픽셀값의 변화와 크기의 변화로 감정인식의 특징 칼을 추출한다. 추출된 값은 실험에 의해서 미리 구해진 샘플과 비교를 통해 강정을 표현하고, 표현된 감정은 Serial Communication을 통하여 로봇에 전달되고, 감정 데이터를 받은 얼굴에 장착되어 있는 모터를 통해 표정을 표현한다.
-
The art psychotherapy expert system is a computer system which helps to analyse one's psychology through pictures. However we need a standard criterion because the psychology, the target of the art psychotherapy, does not only have a ambiguous criterion but also a vast range. We're going to suggest a criterion in the field of the art psychotherapy by constructing systematic database through knowledge acquirement of the art psychotherapy expert system. In this study we introduce a system which enables systematic classification and confirmation of symptoms according to mental analyses. The suggested system enables confirmation of a classical structure and systematic classification of knowledges through conversation by extracting nouns through sentence analysis from the knowledge of descriptive form based on the clinical purpose of sentence analysis.
-
디지털 비디오에 있어서 멀티미디어 데이터베이스 및 검색 시스템 구축을 하기 위해서는 비디오를 여러개의 장면으로 분할하는 기술이 요구된다. 본 논문에서는 다양한 종류의 장면 전환을 검출하기 위해 기존의 규칙기반이 아닌 신경망 이론을 접목하여 자율학습과 실수값 입력이 가능한 ART2를 이용하였다. 매프레임마다 발생할 수 있는 변동의 폭을 줄이기 위해 MPEG 동영상의 DC에 해당하는 값만을 이용하고, 프레임마다 색상의 분산값을 이용하여 Plateaus 구간을 검출한 다음 Plateaus 구간에 해당하는 프레임들에 대해서만 프레임차이, 히스토그램차이, 상관계수 등의 특징치를 추출하여 ART2에 특징벡터를 입력하여 장면 전환을 검출하였다.
-
현재의 Web Service를 구성하는 Core Component들은 진정한 Service-Oriented Architecture를 지원하기에는 많은 단점(Keyword 기반 검색, WSDL의 Semantic 부재 등)들을 가진다. 이러한 단점들을 해결하기 위해 SWSA는 OWL-S라는 Framework을 제안하고, 이를 기반으로 학계와 회사에서 활발한 연구가 진행되어 지고 있다. 하지만 Ontology를 생성해주고 관리하는 체계적인 툴이 없는 실정이라 OWL-S는 다양한 분야에서 활용되지 못하는 한계점을 가지고 있다. 그래서 이러한 문제들 해결하기 위해 본 논문은 OWL-S를 쉴게 생성하고 관리해 주는 Semantic Web Services Manager를 제안한다.
-
현재 설러 병원에서 PACS 시스템을 도입해 유용하게 사용하고 있다. 병원 진료에서 방사선 영상 정보는 중요한 위치를 차지한다. 방사선 영상은 관전압(KVP)과 관전류(mAs)로 방사선량을 조절한 후 인체에 조사하여 얻게 되는데, KVP와 mAs, 인체의 두께에 따라 영상의 질이 변하게 된다. 이와 같이 장비에서 촬영된 영상은 판독을 거처 진료에 이용되고 일정한 시간이 지나면 압축하여 보관하게 되는데, 압축율을 높게 적용할수록 저장장치에 대한 경제적인 효과는 크다. 이에 저자는 1) CR, DR 촬영 조건별 흉부 영상을 얻어 JPEG 2000 압축방식을 적용해 촬영조건이 압축영상에 미치는 영향을 평가하였고, 2) MOS(Mean opinion score) 평가를 통해 영상판독에 영향을 주지 않는 유효 압축율을 제시하였다.
-
본 연구에서는 관광정보를 온톨로지로 구축하고, 개인화 추천 방법들 중 규칙 기반 필터링과 학습 에이전트를 적용하여 사용자에게 관광 정보를 정확하게 추천하기 위한 시스템을 설계하였다. 여기에서는 제주도 관광에 관한 정보의 일부를 개인화 추천 시스템에 적합하도록 각각의 도메인 온톨로지로 구축하였으며, 이 도메인 온톨로지를 이용하여 사용자가 선호하는 관광정보를 추천하고, 온톨로지의 클래스들 사이의 관계를 통해 추천된 관광정보와 관련있는 필요한 정보를 추천함으로써 사용자에게 더욱 정확하고 의미적인 정보를 제공할 수 있는 개인화 추천 시스템을 설계하였다.
-
Ontology를 이용한 대부분의 이미지 검색 시스템들은 중앙 집중적(Centralization)으로 구성되어 있어, 단일 이미지 제공자의 특정 지식기반의 이미지 검색을 제공한다. 이에 반해 메타데이터 기반의 분산 이미지 검색 시스템들은 이미지 제공자들의 자율성을 보장하기 용의하지만, 지식기반 이미지 검색을 제공하지 못한다. 본 논문은 위 시스템들의 단정들을 극복하기 위해 Web Services를 이용하여 다양한 이미지 제공자들의 자율성을 보장하면서, 지식기반 이미지 검색을 지원하는 프레임워크의 Architecture를 제안한다.
-
본 연구에서는 FMM 신경망의 학습 알고리즘에서 하이퍼박스 확장과정에 수반되는 중첩현상을 분석하고, 이에 대한 축소 과정의 특성과 이를 보완하기 위한 새로운 활성화 함수에 관하여 고찰한다. 하이퍼박스 중첩 영역에 속하는 패턴 데이터는 그 분류 결과가 왜곡될 수 있다. 왜냐하면 학습과정에서 하이퍼박스상의 특징범위는 특징값의 빈도요소를 고려하지 않음으로 인하여 극소수의 비정상적 데이터에 관해서도 동일 수준으로 민감하게 확장되기 때문이다. 본 논문에서는 특징집합에서 가중치와 빈도요소를 반영하는 모델로서 이러한 중첩현상의 영향을 개선하는 방법론을 소개한다. 제안된 이론은 단순화된 패턴집합에 대하여 그 유용성을 이론적으로 고찰하며, 실제 패턴분류 문제에 적용하여 실험적으로 평가한다.
-
본 논문에서는 개선된 유전자 알고리즘과 역전파 신경망 알고리즘의 특징을 살펴보고, 비선형 모의자료를 이용하여 개선된 유전자 알고리즘 기반의 신경망 학습 효과와 역전파 신경망 알고리즘을 이용한 신경망 학습 효과를 비교해 본다. 유전자 알고리즘을 이용한 신경망 학습에는 개선된 신경망 제어기를 이용한다. 역전파 알고리즘을 이용한 신경망 학습에는 일반화 성능향상을 위한 인자들의 결합효과를 이용한다. 모의실험을 통하여 두 가지의 학습에서 학습 수령의 정도와 학습 속도 등을 비교하는 모의실험 결과를 개선된 유전자 알고리즘과 신경망 알고리즘의 학습 결과와 항께 제시한다. 모의실험의 결과로서 유전자 알고리즘을 적용한 개선된 신경망 제어기를 통한 학습 결과가 일반 신경망 학습 결과보다 초기 가중값을 작은 범위에서 발생시킬 때 수렴 정확도 및 학습 속도에서 좋은 결과를 나타내 주고 있다.
-
연속 변수 함수 최적화를 위한 진화 연산에서는 전통적으로 확률 분포를 도입하여 새로운 세대를 생성하는 기법을 사용하고 있다. 최근 들어 이러한 확률 분포를 개체군으로부터 추정하여 보다 효율적으로 최적화를 해결하려는 연구가 진행되고 있다. 본 논문에서는 variational 베이지안 혼합 인자 분석 기법(Bayesian mixtures of factor analyzers)을 사용한 개체군의 분포 추정을 통해 연속 변수 함수의 최적화 문제를 해결하는 방법을 제안한다. 이 기법은 혼합 분포의 개수 추정을 자동화하여 개체군의 다양성을 유지할 수 있기 때문에 지역 최적점으로 일찍 수렴하는 현상을 방지할 수 있으며, 세부 개체군 내의 분포 추정을 통해 탐색을 효율적으로 수행할 수 있다. 잘 알려진 평가 함수들에 대하여 다른 분포 추정 진화 연산과 비교하여 제안하는 방법의 우수성을 검증하였다.
-
본 논문에서는 대규모 베이지안 망을 빠른 시간 안에 학습하기 위한 방법으로, 클러스터링을 이용한 방법을 제안한다. 제안하는 방법은 베이지안 구조 학습에 있어서 DAG(Directed Acyclic Graph)를 탐색하는 영역을 제한하기 위해 클러스터링을 사용한다. 기존의 베이지안 구조 학습 방법들이 고려하는 후보 DAG의 수가 전체 노드 수에 의해 제한되는 데 반해, 제안되는 방법에서는 미리 정해진 클러스터의 최대 크기에 의해 제한된다. 실험 결과를 통해, 제안하는 방법이 기존의 대규모 베이지안 망 학습에 활용되었던 SC(Sparse Candidate) 방법 보다 훨씬 적은 수의 후보 DAG만을 고려하였음에도 불구하고, 비슷한 정도의 정확도를 나타냄을 보인다.
-
연속적이고 동적인 실세계에서의 경로 탐색 문제는 이동 로봇 분야에서 주된 문제 중 하나였다. 최근 컴퓨터 성능이 크게 발전하면서 컴퓨터 게임들이 실제에 가까운 연속적인 3차원 환경 모델을 사용하기 시작하였고, 그에 따라 보다 복잡하고 동적인 환경 모델 하에서 경로 탐색을 할 수 있는 능력이 요구되고 있다. 강화 학습 기반의 경로 탐색 알고리즘인 평가치 반복(Value iteration) 알고리즘은 실시간 멀티에이전트 환경에 적합한 여러 장점들을 가지고 있으나, 문제가 커질수록 속도가 크게 느려진다는 단점을 가지고 있다. 본 논문에서는 연속적인 3차원 상황에서 빠르게 동적 변화에 적응할 수 있도록 하기 위하여 작은 세상 네트웍 모델을 사용한 환경 모델 및 경로 탐색 알고리즘을 제안한다. 3차원 게임 환경에서의 실험을 통해 제안된 알고리즘이 연속적이고 복잡한 실시간 환경 하에서 우수한 경로를 찾아낼 수 있으며, 환경의 변화가 관측될 경우 이에 빠르게 적응할 수 있음을 확인할 수 있었다.
-
본 연구에서는 다단계 필터와 복합형 신경망을 사용하는 얼굴 검출 시스템에서 FMM 모델을 이용한 특징선정 기법을 소개한다. 색상, 모션 및 명암을 이용한 다단계 필터는 검출 대상 영역의 개수를 줄임으로써 시스템의 실시간 검출기능을 가능하게 한다. 신경망을 이용한 특징추출 단계에서는 대상영역의 기본 특징으로부터 일련의 특징지도를 생성하게 된다. 이 과정에서 패턴 분류 신경망의 입력으로 사용되는 특징집합이 지나치게 커짐으로써 신경망의 규모와 계산량이 방대해지는 단정을 갖는다. 이에 본 논문에서는 FMM 모델의 수정된 특성으로부터 특징과 각 클래스에 대한 상호 연관도 요소를 정의하고, 이로부터 특징의 상대적 중요도를 평가함으로써 성능의 저하 없이 최적의 특징집합을 선정하는 방법론을 소개한다.
-
최근 음성인식 분야에서는 발화된 음성의 단순한 신호 처리위주의 인식 결과로부터 좀 더 신뢰할 수 있는 결과를 얻기 위하여 여러 가지 후처리 기법들이 연구되고 있다. 본 논문에서는 개인 사용자를 위한 음성 명령어 인식 환경에서 사용자의 발화 정보를 후처리에 적용함으로써 사용자 정보를 고려한 음성인식 후처리 기법을 제안한다. 먼저 이전에 사용했던 음성 명령어들로부터 명령어 발화 순차 패턴 규칙을 추출 한 후 사용자가 사전에 발화한 명령어를 바탕으로 구성된 순차 패턴을 비교하여 순차 규칙상 얻어 질 수 있는 단어를 결정한다. 이렇게 얻어진 단어를 고려하여 음성인식기 인식단어 후보들의 확률값을 적절히 보정한 후 최종 인식 단어를 재결정한다. 이러한 과정에서 적절한 보정을 위하여 발화 순차 패턴의 신뢰도와 인식기의 결과단어를 고려한 보정 방법을 제안한다. 실험을 통하여 제안한 후처리를 이용한 음성인식이 HMM을 이용한 기본 음성인식에 비해 오류율을
$15\%$ 이상 낮추어 인식률에 상당한 기여를 하였음을 확인할 수 있다. -
이미지와 비디오 등 시각 미디어를 분산 환경에서 효율적으로 검색하는 HERMES시스템을 제안한다. 본 시스템에서는 서비스 중계자(Broker)와 서비스 제공자(Provider) 사이에 효과적인 서비스 검색을 위하여 온톨로지를 이용한다. 비주얼 미디어 검색을 위한 서비스 온톨로지와 서비스 ID 부여 방법을 소개한다. 온톨로지를 이용한 추론으로서 기존의 매치메이킹 방법을 살펴보고 본 시스템에서 제안된 ASN.1에 기반한 추론 방법을 소개한다.
-
Support vector machine(SVM)은 최근 각광받는 기계학습 방법 중 하나로서, kernel function 이라는 사상(mapping)을 이용하여 입력 공간의 벡터를 classification이 용이한 특징 (feature) 공간의 벡터로 변환하는 것을 근간으로 한다. SVM은 이러한 특징 공간에서 두 클래스를 구분 짓는 hyperplane을 일련의 최적화 방법론을 사용하여 찾아내며, 주어진 문제가 convex problem 인 경우 항상 global optimal solution 을 보장하는 등의 장점을 지닌다. 한편 bioinformatics 연구에서 주로 사용되는 데이터는 측정 오류 등 일련의 오류를 포함하고 있으며, 이러한 오류는 기계학습 방법론이 어떤 decision boundary를 찾아내는가에 영향을 끼치게 된다. 특히 SVM의 경우 이러한 오류는 특징 공간 벡터간의 관계를 나타내는 Gram matrix를 변화로 나타나게 된다. 본 연구에서는 입력 공간에 오류가 발생할 때 그것이 SVM 의 decision boundary를 어떻게 변화시키는가를 대표적인 두 가지 kernel function, 즉 linear kernel과 Gaussian kernel에 대해 분석하였다. Wisconsin대학의 유방암(breast cancer) 데이터에 대해 실험한 결과, 데이터의 오류에 따른 SVM 의 classification 성능 변화 양상을 관찰하여 커널의 종류에 따라 SVM이 어떠한 특성을 보이는가를 밝혀낼 수 있었다. 또 흥미롭게도 어떤 조건 하에서는 오류가 크더라도 오히려 SVM 의 성능이 향상되는 것을 발견했는데, 이것은 바꾸어 생각하면 Gram matrix 의 일부를 변경하여 SVM 의 성능 향상을 꾀할 수 있음을 나타낸다.
-
이동 단말기의 대중화로 사용자는 시간과 공간의 제약 없이 필요한 다양한 정보 서비스를 쉽게 접할 수 있게 되었다. 그러나 사용자 인터페이스에 있어 이동 단말기는 제약사항이 않음으로 적시적소에 원하는 정보를 접근하기가 어렵기 때문에 음성인식을 통한 인터페이스 연구가 진행되고 있으며, 특히 잡음환경에서 강인한 음성인식 처리를 위한 연구가 활발히 진행되고 있다. 지금까지 잡음환경을 위한 음성인식 접근 방법으로는 언어모델의 개선과 음향모델 개선으로 크게 구분할 수 있다. 그러나 이러한 접근 방법들은 적용하는데 있어 많은 시간과 비용이 요구됨으로 효율성이 떨어진다. 따라서 본 논문에서는 이러한 효율성 문제를 보완하기 위해 음성인식기로부터 인식되어 나오는 결과를 문맥정보와 융합하여 정보를 추출하고 이 정보를 이용한 후처리 모듈을 이용하여 인식시에 발생하는 오류를 적은 비용과 시간으로 수정하여 이동 단말기에 이용할 수 있도록 한다.
-
웹 문서를 대상으로 하는 정보 추출이나 웹 마이닝에 관한 연구가 활발히 진행되면서 특히, 웹에서 나타나는 구조적 패턴을 이용해 정보를 추출하는 방법에 대한 연구가 이루어지고 있다. 하지만 구조적 패턴을 이용할 수 없는 경우 텍스트에 의존한 추출기를 생성할 수 밖에 없는데 웹 문서에서 시각적 요소가 강해지면서 트리거가 단순 텍스트가 아닌 이미지로 처리되는 경우가 있다. 기존의 연구들은 트리거를 단순 텍스트로 보는 관점에서의 연구가 많았고 이러한 접근 방법은 트리거가 이미지인 경우에 정확한 정보를 추출해 낼 수 없었다. 이 논문에서는 트리거가 텍스트가 아닌 이미지인 경우에도 필요한 정보를 잘 추출해 내기 위한 방법에 관해 제안하고자 한다.
-
베이지안망(Bayesian network)은 다수의 변수들 사이의 확률적 관계(조건부독립성: conditional independence)를 그래프 구조로 표현하는 모델이다. 이러한 베이지안망은 비감독학습(unsupervised teaming)을 통한 데이터마이닝에 적합하다. 이를 위해 데이터로부터 베이지안망의 구조와 파라미터를 학습하게 된다. 주어진 데이터의 likelihood를 최대로 하는 베이지안망 구조를 찾는 문제는 NP-hard임이 알려져 있으므로, greedy search를 통한 근사해(approximate solution)를 구하는 방법이 주로 이용된다. 하지만 이러한 근사적 학습방법들도 데이터를 구성하는 변수들이 수천 - 수만에 이르는 경우, 방대한 계산량으로 인해 그 적용이 실질적으로 불가능하게 된다. 본 논문에서는 그러한 대규모 데이터에서 학습될 수 있는 계층적 베이지안망(hierarchical Bayesian network) 모델 및 그 학습방법을 제안하고, 그 가능성을 실험을 통해 보인다.
-
나이브베이즈분류기(
$na\ddot{i}ve$ Bayes classifier)는 학습, 적용 및 계산자원 이용의 측면에서 매우 효율적인 모델이다. 또한, 그 분류 성능 역시 다른 기법에 비해 크게 떨어지지 않음이 다양한 실험을 통해 보여져 왔다. 특히, 데이터를 생성한 실제 확률분포를 나이브베이즈분류기가 정확하게 표현할 수 있는 경우에는 최대의 효과를 볼 수 있다. 하지만, 실제 확률분포에 존재하는 조건부독립성(conditional independence)이 나이브베이즈분류기의 구조와 일치하지 않는 경우에는 성능이 하락할 수 있다. 보다 구체적으로, 각 자질변수(feature variable)들 사이에 확률적 의존관계(probabilistic dependency)가 존재하는 경우 성능 하락은 심화된다. 본 논문에서는 이러한 나이브베이즈분류기의 약점을 효율적으로 해결할 수 있는 자질변수의 통합기법을 제시한다. 자질변수의 통합은 각 변수들 사이의 관계를 명시적으로 표현해 주는 방법이며, 특히 상호정보량(mutual information)에 기반한 통합 변수의 선정이 성능 향상에 크게 기여함을 실험을 통해 보인다. -
디지털 방송이 본격적으로 시작되고 각 가정에 디지털 TV의 보급이 많이 이루어짐에 따라 사용자들이 시청할 수 있는 채널 및 프로그램의 수는 기존의 공중파 환경과 비교하여 폭발적으로 증가하였다. 채널의 수가 수백 개로 늘어나기 때문에 사용자가 자신이 원하는 프로그램을 찾기 위해서는 리모콘을 누르거나 방송 편성표를 검색하는 것과 같은 많은 시간과 노력을 필요하다. 따라서 이러한 문제점을 해결하기 위해서는 사용자의 프로파일과 선호도 정보를 분석하여 사용자의 취향에 적합한 프로그램을 추천해줄 수 있는 방법이 필요하다. 본 논문에서는 수백 개의 채널에서 방송되는 프로그램 및 사용자의 선호도 정보를 분석하여 사용자가 원하는 프로그램을 추천해주고 시청 히스토리를 분석하여 사용자 모델을 동적으로 갱신하는 기법을 제안한다.
-
인터넷 경매는 객관적 정보획득이 쉽고 신분노출이 적어 크게 각광받고 있으나 불특정 다수의 참여로 이루어지기 때문에 안정성과 효율성을 전제로 해야 한다. 본 논문에서는 인터넷과 같은 불안전한 통신채널과 호스트를 신뢰할 수 없는 상황에서 확률론적 암호화 기법을 이용하여 자신들의 입찰정보는 최대한 숨기면서 효율적으로 낙찰자와 낙찰가를 계산할 수 있는 Vickrey 경매 모델을 제안한다 제안된 모델은 Auctioneer라 Auction Issuer가 담합하지 않는다는 가정하에서 그 효율성이 입증된 Naor-Pinkas-Sumner의 시스템보다 훨씬 적은 계산량을 요구한다.
-
오늘날 인터넷 환경의 급속한 발전으로 인하여 이메일을 통한 메시지 교환이 급속히 증가하고 있다. 그러나 이메일의 편리성에도 불구하고 개인이나 회사에서는 스팸 메일로 인한 시간과 비용의 낭비가 크게 증가하고 있다. 이러한 스팸 메일에 대한 문제들을 해결하기 위해서 많은 방법들이 연구되고 있다. 본 논문에서는 패턴 분류 문제에 있어서 우수한 성능을 보이는 SVM(Support Vector Machine)을 사용하여 정상 메일과 스팸 메일을 분류할 수 있는 최적의 항목을 찾고자 한다. 그 방법으로 Feature Selection 기법을 사용하여 항목을 선별하였으며 이 선별된 항목이 얼마나 정확한 구분력을 가지고 있는지를 나타내고자 한다.
-
상황 인식(Context-Aware) 시스템은 현재 자신이 처한 상황 정보를 인식하여 그에 맞는 행동을 결정하고 그 결과에 따라 동작하는 시스템을 일컫는다. 이러한 상황 인식 시스템은, 유비쿼터스 컴퓨팅을 비롯해 특정 작업을 수행하기 위해 사용자로부터 주어지는 입력 값 이외의 환경 정보를 필요로 하는 분야에서 주로 사용된다. 이때 시스템이 인지하는 상황은 자신의 작업을 수행하기 위해 필요한 환경 정보로 구성되어 있다. 가령 온도조절 서비스를 담당하는 에이전트가 있다고 할 때, 이 에이전트는 사용자의 요청 온도를 맞춰주기 위해 현재 실내 온도를 측정할 수 있어야 한다. 그래야 요청 온도에 도달했을 때, 동작을 멈출 수 있기 때문이다. 이처럼 각 에이전트가 자신이 필요로 하는 정보를 인지하고 그에 따라 작업을 수행할 때, 다일 에이전트 혼자 그 공간에 존재한다면, 자신이 필요한 정보만을 인지하는 것으로 적절한 작업 수행을 기대할 수 있지만. 둘 이상의 에이전트가 동일 공간에 존재하고, 각 에이전트의 작업 과정이 서로의 수해 과정에 영향을 미칠 가능성 즉, 에이전트 사이의 충돌 발생 가능성이 존재한다. 이미 오디오가 동작하고 있는 방안에서 TV를 작동시키게 된다면, 음악을 들을 수도, TV를 볼 수도 없는 상황이 발생한다. 이에 본 논문에서는 동일 공간에 존재하는 상황 인식 에이전트들 사이에 발생하는 충돌을 해결하기 위한 방법을 제안한다.
-
지금까지의 재난대책이 대응 및 복구에 초점이 맞춰져 있었다면, 앞으로는 첨단시스템을 이용해서 재해경감 체제를 갖추기 위해서 다양한 노력이 시도되고 있고 이를 위한 연구와 프로젝트가 활발히 이루어지고 있다. 본 논문에서는 긴급구조 시스템의 지능화 핵심인 분산 에이전트의 동작에 관한 방법론을 제시하고자 한다. 분산 에이전트중의 하나인 Broker를 긴급구조 시스템의 중심으로 내세워 자치적인 프로세스를 이용해 상황을 인지하고 그에 따라 최적의 신속하고 합리적인 서비스가 사용자에게 제공되도록 서비스 제공자들과 협상을 전개한다. 보다 효과적인 시스템 구현을 위하여 온톨로지를 이용한 상황인지와 협상 모델을 제시하고자 한다.
-
본 논문은 연속 초음파 영상으로부터 모자이크 영상을 구하기 위한 특징점 기반 블록 움직임 추출 방법에서 정확도를 높이고 계산 시간을 줄이기 위해 다해상도(multi-resolution)영상을 이용한 계층적 특징점 기반 블록 움직임 추출 방법을 제시하였다. 초음파 영상에서의 Speckle 노이즈의 영향을 줄이기 위해 저해상도의 영상에서 특징점을 추출하고, 계산 시간을 줄이기 위해 저해상도 영상의 추정된 움직임을 고해상도 영상의 움직임 추정에 적용하여 탐색 범위를 줄였다. 그 결과 계산 시간을 개선하면서 모자이크 영상의 정확도를 높일 수 있었다.
-
Isomap [1] is a manifold learning algorithm, which extends classical multidimensional scaling (MDS) by considering approximate geodesic distance instead of Euclidean distance. The approximate geodesic distance matrix can be interpreted as a kernel matrix, which implies that Isomap can be solved by a kernel eigenvalue problem. However, the geodesic distance kernel matrix is not guaranteed to be positive semidefinite. In this paper we employ a constant-adding method, which leads to the Mercer kernel-based Isomap algorithm. Numerical experimental results with noisy 'Swiss roll' data, confirm the validity and high performance of our kernel Isomap algorithm.
-
지문을 5가지 클래스로 나누는 헨리시스템을 기반으로 신경망이나 SVM(Support Vector Machines) 등과 같은 다양한 패턴분류 기법들이 지문분류에 많이 사용되고 있다. 특히 최근에는 높은 분류 성능을 보이는 SVM 분류기의 결합을 이용한 연구가 활발히 진행되고 있다. 지문은 클래스 구분이 모호한 영상이 많아서 단일결합모델로는 분류에 한계가 있다. 이를 위해 본 논문에서는 새로운 분류기 결합모델인 다중결정템플릿(Multiple Decision Templates, MuDTs)을 제안한다. 이 방법은 하나의 지문클래스로부터 서로 다른 특성을 갖는 클러스터들을 추출하여 각 클러스터에 적합한 결합모델을 생성한다. NIST-database4 데이터로부터 추출한 핑거코드에 대해 실험한 결과. 5클래스와 4클래스 분류문제에 대하여 각각
$90.4\%$ 와$94.9\%$ 의 분류성능(거부율$1.8\%$ )을 획득하였다. -
본 논문은 연속 초음파 영상에서 움직임 보상 시간 필터를 적용하여 영상의 품질을 향상시키는 방법을 제안한다. 비선형 광학 흐름 추정 방법을 이용하여 화소 단위의 움직임을 추정하고, 이를 바탕으로 시간적 재귀 필터링을 적용한다 화소 단위 움직임 벡터의 양이 작을 경우 필터링을 크게 하고, 움직임 벡터의 양이 클 경우 필터링을 작게 적용한다. 그 결과 프로브에 의한 전역적 움직임과 측정 대상물에 의한 국부적 움직임으로 발생되는 블러 현상을 극소화하고 잡음을 감소시켜 영상의 품질을 향상시켰다.
-
Henry의 지문분류법이 창안된 후, 지문분류에 대한 여러 가지 접근 방법이 연구되고 있다. 특이점에 의한 분류는 가장 많이 연구되고 있는 방법이지만, 지문영상의 품질에 민감하기 때문에 정확한 분류가 쉽지 않다. 의사 융선은 특이점과 더불어 지문을 분류하기 위한 특징으로, 특이점의 불완전함을 보완하는데 이용한다. 본 논문에서는 나이브 베이즈 분류기를 이용하여 특이점과 의사 융선 정보의 확률적인 분류 방법을 제안한다. NIST DB 4에 대해 제안하는 방법을 실험한 결과 5클래스 분류에 대해
$85.4\%$ 의 분류율을 획득하였으며, 제안하는 방법이 신경망, 최근접 이웃에 의한 분류에 비해 더 빠르다는 것을 확인하였다. -
Support vector machine(SVM)은 졸은 일반화 능력을 가진 학습시스템으로, 최근 다양한 패턴 인식 분야에서 적용되고 있다. SVM은 기본적으로 이진 분류기이므로 두 개 이상의 클래스를 분류하기 위해서는 다중 클래스 분류가 가능한 형태로의 설계 방법이 필요하다. 이를 위해 각 클래스별로 독립적인 SVM들을 만들어 결과를 병합하는 방식이 주로 사용되어 왔다. 그러나 이러한 방법은 클래스의 수는 않고 한 클래스 내의 데이터의 수가 많지 않은 경우에는 SVM의 일반화 성능을 저하시키고 노이즈에 민감해지는 문제점을 가지고 있다. 이를 해결하기 위해 본 논문에서는 각 클래스내의 데이터간의 유사도 측정을 위한 통계적 정보를 안정적으로 추출하기 위해 두 데이터의 쌍을 입력으로 받는 새로운 SVM 설계 방법을 제시한다. 제안한 방법을 실제 생체인식 데이터에 적용한 실험에서 기존의 방법보다 우수한 분류 성능을 보임을 확인할 수 있었다.
-
본 논문에서는 점증적 분류 성능을 갖는 단계형(cascade) 분류기를 이용한 새로운 실시간 얼굴 탐지시스템을 제안하고자 한다. 제안된 시스템의 첫 단계는 전처리 단계로써 매우 빠른 속도를 갖는 새로운 피부색 탐지기를 이용하여 탐색 공간을 대폭 축소하고, 두 번째 단계에서는 빠른 분류가 가능한 유사-하(Haar-like) 특징을 이용한 단계형 분류기를 배치하여 빠른 속도로 후보 얼굴을 검출한다. 마지막 단계에서는 탐지율을 높이기 위해 단일 클래스 SVM인 SVDD를 분류기로 사용하였으며, 실험을 통하여 제안된 시스템의 우수성을 보인다.
-
최근 대형 디스플레이 및 웨어러블 컴퓨터의 등장과 함께 키보드와 마우스를 사용하는 일반 데스크탑 환경에서 벗어난 컴퓨터와의 자연스러운 상호 작용 연구가 활발히 진행되고 있다. 본 논문에서는 스크린 정면에 놓인 프로젝터가 스크린과 그 위에 놓인 사용자의 손 위에 화면을 투영할 때 PC 카메라로 입력된 프레임 속에서 손의 영역을 인식하여 컴퓨터와 상호작용하게 하고자 한다. 이 경우에 투영된 빛이 사용자의 손 위에도 합쳐짐으로 인하여 피부의 고유색이 사라진다. 또한, 투영되는 화면이 사용자와 컴퓨터의 상호 작용에 따라 추정할 수 없이 변함에 따른 적응적 인식 방법이 필요하다. 따라서, 본 논문에서는 손을 인식하기에 앞서 스크린에 투영될 원본 이미지에 대해 칼라 보정을 수행하여 추정되는 카메라 입력 프레임을 생성한다. 이를 위해 우선 백색 영상을 투영하여 프레임 내의 자기 오차 맵을 생성한 후 R,G,B 채널 별로 원본 값에 대한 카메라 반응 값들을 룩업 테이블에 저장한다. 이를 통해 원본 이미지에 대해 칼라보정을 수행하고, 생성된 카메라 추정 프레임과 실제 카메라로 입력된 프레임 간 자기 성분을 비교하여 손 영역을 검출한다. 실험 결과, 주변의 조명 상태나 프로젝터 및 카메라의 위치에 관계없이 안정적인 인식 결과를 보였다.
-
In this paper we present a method of separating musical instrument sound sources from their monaural mixture, where we take the harmonic structure of music into account and use the sparseness and the overlapping NMF [1] to select representative spectral basis vectors which are used to reconstruct unmixed sound. A method of spectral basis selection is illustrated and experimental results with monaural mixture of voice/cello and trumpet/viola are shown to confirm the validity of our proposed method.
-
간판인식은 관광지의 간판을 자동 인식하여 외국인 또는 외지인에게 편리한 관광 정보제공을 목적으로 연구되고 있다. 이러한 연구의 효율적인 진행을 위해 객관적인 간판영상 데이터베이스가 필수적이다. 이 논문은 전주 한옥마을을 대상으로 수집한 간판영상 데이터베이스에 대해 기술한다. 총 45개의 서로 다른 간판에 대해 각각 50개씩 영상을 다양한 조건에서 획득하였다.
-
화상의 이치화는 패턴인식에서 중요한 전처리과정이다. 이 논문은 상관(correlation)을 이용하여 화상의 이진화를 하는 새로운 방법을 제안한다. 이것은 기존의 히스토그램의 분포를 이용하여 흑과 백을 나누는 임계치를 구하는 방법과는 달리 화상의 상관을 구하고 그 상관의 임계치를 정하여 임계치를 초과하는 화상을 구함으로써 얻을 수 있다. 이 방법은 히스토그램을 이용하는 방법보다 알고리듬이 단순하고 흩어지지 않고 집중된 검은 영역을 보여 준다. 실험결과는 이 방법이 효과적임을 보여준다.
-
본 논문에서는 학습을 통해 JPEG 영상의 잡영을 제거하는 방법을 제안한다. 주어진 영상을 low-pass filtering 하면 JPEG 영상의 잡영 제거는 남아있는 저주파 성분으로부터 원래의 고주파 성분을 복원하는 문제가 된다. 다수의 영상과 이를 JPEG 압축한 영상의 쌍들이 주 어졌을때, low-pass filter된 영상으로부터 원하는 고주파 성분을 추정하는 함수를 학습함으로써 JPEG 영상의 잡영을 제거하였다.
-
본 논문은 손 모양 인식을 이용한 비전 기반의 보행 로봇 제어 시스템을 제안한다. 손의 모양을 인식하기 위해서 움직이는 카메라 영상으로부터 정확한 손의 경계선물 추출하고 추적하는 일이 선행되어야 한다. 따라서 본 논문에서는 민 시프트 방법을 사용한 활성 윤곽선 모델 기반의 추적 방법을 제안한다. 제안된 시스템은 손 추출기, 손 추적기, 손 모양 인식기 그리고 로봇 제어기, 4개의 모들로 구성된다. 손 추출기는 영상에서 미리 정의된 손의 모양을 가지는 피부색 영역을 추출한다. 추출된 손의 추적은 활성 윤관선 모델과 민 시프트 방법을 사용하여 실행된다. 그 후 Hue moments를 사용하여 추적된 손의 모양을 인식한다. 제안된 방법을 평가하기 위해서 본 논문에서는 2족 보행 로봇 KHR-1에 제안된 방법을 적용 한다.
-
본 논문에서는 웹 문서의 논리적 구조분석을 위한 전처리 과정으로서 웹 문서에 포함된 잡음 영역을 제거하는 클리닝 방법을 제안한다. 제안된 방법은 잡음 영역을 내비게이션 영역, 광고 영역, 상호작용 영역, 특수정보 영역, 그리고 스크립트/스타일 영역의 5종류로 구분한 후, 이를 제거할 수 있는 규칙을 제안한다. 제안된 방법의 성능을 평가하기 위하여 웹으로부터 추출된 726개의 다양한 문서를 대상으로 실험한 결과
$91.16\%$ 확률을 보였다. -
본 논문에서는 로봇이나 감시 시스템에서 주로 쓰이고 있는 배경 모델링의 정확성을 지속 시키는 방법을 제안한다. 오브젝트를 추출하려면 정확한 배경 모델이 필요하다. 정확한 배경 모델을 유지하기 위해서는 전경의 정보가 배경 모델에 반영되면 안 된다. 본 논문에서는 오브젝트의 움직임을 기반으로 한 배경 무효화 기법을 사용하여 전경이 배경 모델에 영향을 주는 것을 방지함으로써 정확한 배경 모델을 유지하는 방법을 제안한다.
-
본 연구에서는 3차원 온라인 필기의 효과적인 인식 방법을 제안한다. 3차원 필기 시 pen-up/pen-down 정보의 구분이 없이 입력하도록 하여 사용자가 편리하게 필기하도록 하고 구분의 부정확함으로 인해 발생하는 오류를 줄인다. 또한, 기존의 2차원 필기 인식 모델을 개선하여 3차원 필기 데이터의 특성을 반영하게 함으로써 경제적이며 안정적인 인식이 가능하다. 실험 결과 제안된 인식 방법을 통해 pen-up/pen-down 정보의 구분이 없는 3차원 필기 숫자에 대해
$91.6\%$ 의 인식 성능을 얻었으며, 특히 인식 모델의 개선을 통해 여러획으로 이루어진 글자의 경우 높은 인식 성능의 향상을 보임을 확인하였다. -
본 논문에서는 자동결함검출 방법으로 돌출 함몰, 점 등과 같은 작은 결항들을 검출하기 위해 모폴로지의 닫힘, 열림 방법을 이용하는 템플레이트 검사 방법을 사용하였고, 얼룩, 스크래치와 같은 큰 결함을 검출하기 위해 영상에서 격자와 같은 일정한 블록을 형성하여 각 블록을 비교하여 결함을 찾는 블록매칭 방법을 사용하였다. 또한 이 알고리즘을 적용한 결과 결함 검출에 좋은 성능이 있음을 보여준다. 제안된 알고리즘은 자체 개발한 장비에서 실제 BLU의 영상을 얻어 테스트를 하였다.
-
역사적 가치가 높은 고문서의 훼손을 방지하고 접근을 용이하게 하기 위해서 고문서 전산화가 필요하다. 이를 위한 작업에서는 고문서의 방대한 양을 빠르고 정확하게 처리하는 기술이 필수적이다. 본 논문은 고문서 전산화를 위한 분할 방법과 인식 방법을 제안한다. 인식을 이용한 분할 방법을 통해 신속하면서도 정확하게 문서내의 문자영역을 찾아낸다. 또한 인식기로부터 생성된 점수를 확률화 하여 신뢰도를 높이고 이를 문자의 모양 및 문맥정보와 결합을 통해 분할과 후처리를 수행한다. 제안하는 방법은 고문서 전산화 과정에서 사람의 수작업을 최소화하기 위해 유용하다.
-
모델 영상내의 각각의 물체의 대표 값을 만든 후에 실험 영상을 물체 공간에 투영 시켜서 나온 성분과 대표 값의 거리를 비교하여 인식하게 된다. 그러나 단순히 기존의 방법인 Point to Point 방식인 단순 거리 계산은 오차가 많기 때문에 된 논문에서는 개선된 Class to Class방식인 k-Nearest Neighbor를 이용하여 몇 개의 연속적인 입력영상에 대해 각각의 모델영상들을 인식의 단위로 이용하였다.
-
제안된 연구에서는 기존의 일반 CT(Computerized tomography) 영상이 아닌 MDCT(Multi Detector CT) 영상을 이용하여 장기 추출에 관한 연구를 진행하였다. 조영제를 이용한 복부 MDCT 영상으로부터 모폴로지(morphology) 기법을 통해 간에 근접한 노이즈를 제거하고, 기존의 Otsu threshold를 개선하여 간의 명암값 분포를 구분할 수 있는 임계치를 구하였다. 찾아진 임계치를 이용하여 영상을 이진화하고, 최종적으로 위치정보를 이용하여 간에 해당하는 부분들을 추출하였다. 이러한 방식은 명암값과 위치정보를 이용하여 간을 추출한 후 다시 노이즈 문제를 해결하는 기존의 알고리즘과 비교했을 때, 처리 방식이 단순해지고 속도가 향상되었다. 추출된 간은 간 이식술이나 절제술에 필요한 간 내부의 혈관 인식과 간의 부분체적 계산 연구에 중요한 정보로 사용될 수 있을 것이다.
-
본 논문에서는 동적 계획법(dynamic programming)과 이미지 세그먼트(segment)를 이용한 새로운 스테레오 정합(stereo matching)기법을 제안한다. 일반적으로 동적 계획법(dynamic programming)은 빠르면서도 비교적 정확하고, 조밀(dense)한 disparity map을 얻을 수 있다. 그러나 경계(boundary)근처의 폐색지역(occlusion region)이나, 텍스쳐가 적은 모호한 영역에서는 잘못된 결과를 유도할 수 있다. 본 논문에서는 이러한 문제점들을 해결하기 위해 먼저 이미지를 아주 작은 영역으로 분할(over-segmentation)하고, 이런 작은 영역들이 비슷한 disparity를 가질 것이라고 가정한다. 다음으로 동적 계획법(dynamic programming)을 통해 정합을 수행한다. 여기서 계산비용(cost)은 기존의 정합윈도우 안에서 세그먼트 영역을 적용한 새로운 비용함수를 사용하며, 이 새로운 비용함수를 통해 정확도를 높인다. 마지막으로 동적 계획법을 통하여 얻어진 조밀한 disparity map을 세그먼트 영역들의 시각특성(visibility)과 유사도(similarity)를 이용하여 에러를 찾아내고, 세그먼트 정합을 통해 수정함으로 정확한 disparity map을 찾아낸다.
-
분 논문에서는 워터마크가 삽입된 영상의 비가시성과 강인성을 보장하기 위하여 주파수 영역 기반인 FFT(Fast Fourier Transform)을 이용하였다. 그리고 영상에 삽입된 워터마크를 정확하게 추출하기 위하여 워터마크에 삽입하는 키 사이의 직교성을 유지할 수 있는 그람-슈미트 정규직교화를 이용하였다. 실험을 통해 살펴본 결과 영상의 특징에 관계없이 랜덤계열에 민감한 워터마크를 추출할 수 있는 정확성 및 신뢰성을 가짐을 알 수 있었다.
-
주어진 영상에서 인체를 찾고 그 자세를 인식하기 위해 자세나 조영 조건의 변화에 됨 민감한 방법으로 구성요소에 기반한 접근이 있다. 본 논문에서는 10개의 구성요소와 그들간의 유연한 연결로 구성된 인체모델을 사용한다. 각 구성요소는 기하학적, 명시적, 다른 구성요소와의 연결요소에 대한 정보로 구성되어 있다. 인체구성요소 사이의 계층적 연결은 일반-상세 탐색으로 시간효율적인 인체 매칭을 가능케 한다. 본 논문에서는 새로운 인체를 찾을 때마다 인체 구성요소를 갱신함으로써 자세 및 조명 변화에 보다 적응적으로 자세를 추정하는 방법을 제안한다.
-
본 연구에서는 영상획득 조건을 충분히 만족시키지 못하는 몰입형 디스플레이 환경에서 다수의 사용자 머리위치를 탐지하는 방법을 제안한다. 본 기법은 몰입형 가상환경에서 적외선 반사영상을 획득하고 그로부터 배경을 제거함으로써 얻어진 전경(foreground) 영역으로부터 프로젝션 히스토그램을 생성하고 사용자 실루엣을 추출하게 된다. 모든 사용자의 머리는 다각형 근사된 실루엣과 프로젝션 히스토그램에 기반하여 탐지된다. 또한 향후 몰입형 가상환경에서의 다중 사용자 트래킹을 지원하기 위해 스테레오 영상에서 탐지된 머리를 기준으로 탐색영역을 정의, 대응점을 결정하고 그에 기반하여 각 사용자 머리의 3차원 위치를 계산하였다.
-
본 논문은 사람이나 로봇이 자율보행을 하기 위해서 시각적으로 한 곳을 집중적으로 선택하도록 하기 위한 논문이다. 동물들이 효율적인 시각 정보 수집을 위해 사용하는 선택적 주의 처리 기법을 기본으로, 깊이정보를 이용하여 여러 개의 주의시선 중 한 곳을 선택하도록 하는 방법을 제안하였으며, 이를 이용한 실험 결과 깊이정보를 이용한 선택적 주의 처리 기법이 유용함을 알 수 있었다. 향후 연구과제는 보행하는데 필요한 정보를 한 번의 계산으로 깊이에 따라 차례대로 정할 수 있는 3차원 맵을 만드는 것이 될 것이다.
-
본 논문에서는
$CAVE^{TM}-like$ 시스템에서 역운동학을 이용하여 사용자의 인체 움직임을 실시간으로 추정하기 위한 기법을 제안한다. 사용자를 둘러싼 스크린으로 투사되는 빛에 인하여 매순간 변화하는 배경을 포함하는 영상으로부터 사용자 영역을 추출하기 위하여 적외선 반사 영상을 이용하였다. 이를 이용하여 추출된 사용자 컬러 영상에 프로젝션 기반 가상환경의 특성을 고려한 컬러 모델을 적용하여 사용자의 얼굴과 손 영역을 추출하였다. 위치 추정 단계를 통하여 다음 프레임에서의 관심영역 위치를 미리 예측하고 추출된 사용자의 손과 얼굴 위치 정보를 말단장치로 이용하고, 관절모델과 운동학적 제약조건을 기반으로 역운동학적인 방법을 통해 사용자의 동작을 추정하였다. 제안 기법에서는 별도의 마커나 도구를 사용하지 않기 때문에 비침입적이며 사용자 움직임의 제약을 최소화할 수 있기 때문에 보다 인간 중심적인 인터랙션을 위한 기반 기술로 이용될 수 있다. -
컴퓨터 비전 연구에서의 주요 관심은 객체의 특징을 이용하여 객체를 분간하거나 또는 계수하는데 있어 왔다. 최근 대단위의 사람들이 운집하는 공공장소에서의 사고에 대비한 대책의 기준으로 혼잡도라는 점보의 중요성이 대두되고 있다. 본 실험에서는 객체들이 존재하는 전경(Foreground) 영역을 객체들이 없는 배경 영역(back ground)으로부터 분리한 후 전경 영역에서의 edge pixel 들의 수를 계수하여 혼잡도의 정도를 구한다. 전경 영역과 배경 영역은 소 영역별로 RGB에 대한 표준편차와 평균을 비교 분석해서 구분하고 배경 영역을 삭제한다. 전경 영역에서 edge detection 방법을 이용하여 환경에 알맞은 edge pixels수를 계수하고 pixels수와 혼잡도 사이의 관계를 구한다. 이러한 측정 방법의 장점은 다양한 환경에서도 혼잡도라는 기본 특징정보를 추출할 수 있다는 것이다.
-
본 논문에서는 이질적인 수신단말들에 효율적인 스테레오 영상전송을 위한 시공간적 계위를 이용한 부호화 방법을 제시하였으며, 각각의 시간적, 공간적 계위의 오버헤드를 분석하였다. 제시된 부호화기는 유연성있는 스테레오 비디오 서비스를 위해서 하나의 영상에 각각 시간적, 공간적으로 확장 가능한 추가적인 비트열을 정의하였다. 실험을 통하여 공간적 계위 오버헤드는 시간적 계위 오버헤드에 비해 상대적으로 크지만, 스테레오 부호화기의 양안차 예측으로 인해 많이 감소됨을 보였다. 제안된 스테레오 비디오 부호화기는 다양한 디스플레이 장치 및 네트워크 환경을 가지는 유비쿼터스 컴퓨팅 환경을 위한 효율적인 스테레오 비디오 전송 서비스에 활용될 것으로 기대된다.
-
디지털 카메라 이미지의 화질을 저하시키는 주요 요인 중 하나는 노이즈이다. 디지털 카메라에 사용되는 CCD/CMOS 센서의 특성상, 노출이 증가할수록 신호대 잡음비(SNR)가 증가한다. 따라서 디지털 카메라에서 SNR이 높은 이미지를 얻기 위해서는 되도록 많은 노출을 주어야 한다. 하지만 너무 과다한 노출을 주게 되면 highlight clipping이 일어나기 때문에, RGB 모든 채널에서 clipping이 일어나지 않는 범위 안에서 노출을 주어야 한다. 그리고 CCD/CMOS RAW 데이터에 대해 카메라의 이미지 프로세싱 과정에서 디지털 노출 보정을 해주면 사람이 보기에 적절한 노출을 가지면서도 SNR이 높은 고화질의 이미지를 얻을 수 있다.
-
본 논문에서는 여러 가지 표정으로 입력되어지는 얼굴 이미지를 효율적으로 인식시키는 작업을 수행하는 방법에 대한 내용을 소개하고 있다. 각 얼굴 이미지들은 상황에 따라 많은 표정에 영향 성분을 포함하고 있다. 이런 각기 특성이 다른 얼굴 이미지들의 효율적인 인식을 위하여, 특징 점을 선정을 한 후 실험 진행을 하면 표정에 영향을 많이 받는 이미지를 구분할 수 있다. 여기서 제안하는 방법은 표정이 많이 포함된 이미지에 대하여 표정에 영향을 많이 미치는 특징 점과 그 특징 점영역에 와핑 기법을 처리함으로써 표정이 있는 이미지를 인식하는 방법을 제안한다.
-
본 논문에서는 가보 웨이블릿을 통해 얼굴 이미지로부터 특징을 추출하고, 그에 Genetic Algorithm 을 통해 구한 특징점별 가중치를 적용하여 얼굴 인식을 하는 방법을 소개한다. 각 특징점별로 가중치를 적용하는 방법은, 기존의 Gabor wavelet 을 사용한 얼굴 인식 방법들에 비해 높은 인식률을 보인다. 특징점별 가중치들은 진화 알고리즘을 통해 학습 되어진다.
-
본 논문에서는 감시 시스템 내에서 검출된 객체에 대해 정확한 특징벡터를 추출하기 위한 그림자 제거(shadow casting)방법을 제안한다. 그림자에 외해 부정확한 특징벡터를 가지게 되는 객체는 동일한 객체임에도 불구하고 서로 다른 객체로 인식하는 잘못된 결과를 가져온다. 이러한 문제점을 해결하기 위해 객체가 가지는 대칭성을 사용하여 그림자 후보 영역을 추출한 후 중심축으로부터의 거리에 비례한 가중치값을 사용하여, 추출한 영역에 대해 그림자를 제거를 수행한다.
-
최근에 들어서 전력산업에 규제완화가 도입되면서 환경이 급변하고 있는 실정이다. 여러 가지의 환경변화가 예상되지만, 그 중에서도 공급자간에 경쟁 도입이 전력산업 참여자간에 주요 이슈로 부상하고 있다. 이와 같은 변화는 전력시스템의 기술 개발 뿐만 아니라 경영전략에도 큰 영향을 미치고 있으며, 대 수요자 서비스의 제공이 전략의 핵심이 되고 있다. 따라서 공급자는 보다 나은 서비스를 제공하기 위해서, 수요자 정보의 수집 및 분석을 해야 할 필요가 있다. 이와 같은 수요자 정보의 분석은 여러분야가 있지만 그 중에서도 수요특성을 파악하는 것이 가장 기본이 된다. 수요 특성은 원격검침시스템에서 수집되는 load profile 데이터로써 표현된다. 본 논문에서는 전력 수요자의 부하 특성을 분석하고 명가하기 위하여 수요특성별로 그룹으로 분류하는 방법을 개발하고, 분류된 그룹의 특징을 검토하였다. 이와 같은 부하분석의 정보는 가격설계, 수요 핀 에너지 예측, 송전 및 배전 계획, 에너지 효율 향상 및 부하관리의 필수 자료가 된다. 또한 향후에 개발될 전력 부가서비스의 주요 기반이 될 것으로 예상된다.
-
본 논문에서는 3차원 모델을 검색하기 위한 형태 기반 기술자를 추출하는 알고리즘을 제안한다. 제안하는 알고리즘은 모델의 기하학적인 특성을 고려하여 레이 캐스팅 샘플링과 구면조화함수를 이용하는 방법이다. 레이 캐스팅 기법은 모델의 외형을 고려한 적응적인 방법으로 샘플링 하여 기술자에 포함되는 형태 정보를 증가시켜 기술자의 식별성을 높인다. 또한 구면조화함수 계수 추출에서는 기하학적인 주파수 특성을 고려하여 적응적인 계수를 추출한다. 이 방법은 검색 성능에 영향을 미치지 않고 기술자를 조밀하고 간결하게 만든다. 최종적으로 두 방법을 결합함으로써 검색 엔진에서 이용 가능한 기술자를 생성한다. 실험 결과에서는 제안된 알고리즘의 성능이 기존 방법에 비해 약
$12.5\%$ 향상 된 것을 확인 할 수 있다. -
본 논문에서는 3차원 객체의 전체적인 기하학적 특성을 3차원 형태 기술자로 추출하는 방법을 제안한다. 제안하는 기술자는 기존의 방법에서 문제가 된 부분적 자세변화에 대한 민감성 부분을 해결한다. 3차원 객체의 평면상의 모든 점들을 대상으로 형태 함수를 이용하여 형태 분포(Shape Distribution)를 생성한다. 이때 평면상의 두 정의 거리를 측정하는 기존의 D2 형태 함수를 최단경로를 사용하여 거리를 측정하는 방법으로 변형해 3차원 객체의 부분적 자세 변화에 강건하도록 하였다. 기존의 형태 분포와 비교하여 성능 평가한 결과 관절 객체에 대해서는 약
$ 51\%$ , 전체에 대해서는 약$24\%$ 의 성능 향상을 보였다. -
차량을 포함하는 임의의 영상에서 번호판 추출은 다양한 조명조건 및 배경, 촬영 각도, 번호판 종류 등의 요인으로 인해 고도의 영상처리 과정을 필요로 한다. 본 논문에서는 실제 환경에서 발생할 수 있는 이러한 요인들에 대해 강건한 번호판 추출 방법을 제안한다. 제안하는 방법은 입력영상의 RGB 성분들을 색상성분과 영암성분으로 분리할 수 있는 칼라모델 HSI로 변환하고 H(hue)와 S(saturation)성분을 이용하여 번호판의 배경색상을 고려한 칼라 퍼지지도를 구성한다. 또한, I(intensity)성분을 이용하여 에지밀도를 추출하고 에지밀도 지도에 기반한 영역분리 퍼지지도를 생성한다. 마지막으로, 후보영역 탐색을 위해 칼라 퍼지지도와 영역분리 퍼지지도를 결합하고, 연결성분 해석(Connected Component Analysis)을 통해 ROI(Region Of Interest)를 추출한다. 제안하는 방법의 유효성 검증을 위해 조명 및 촬영 각도에 제한을 거의 두지 않고 촬영된 차량 영상 410장을 실험 영상으로 사용하였다. 실험 결과에서는
$97.1\%$ 의 효과적인 추출 성공률을 볼 수 있었다. -
은닉 마르코프(HMM)의 HMM의 구조 최적을 위한 모델 선택 방법에 많은 방법들이 연구되어지고 있다. HMM의 구조를 어떻게 최적으로 정해야 하는 가에 대해 HMM의 구조를 체계적인 방법으로 정함과 동시에 변별력의 단점을 개선 할 수 있는 방법으로 Anti-likelihood(ALC1)를 제안하였고 이를 모델 선택 기준인 BIC와의 결합(ALC2)하여 필기 데이터에 대해 실험한 결과 기존의 방법보다 파라미터의 수는 감소되고 인식률이 향상됨을 알 수 있었다. 이를 Discrete HMM에도 적용하여 제안된 ALC2가 HMM 구조를 최적화하는 모델 선택 기준임을 Continuous-Density HMM과 비교하여 실험 검증 한다.
-
음성인식 시스템에서 입력된 음성 데이터에 대해 비인식 대상을 거부하는 기능은 신뢰도 보장 측면에 있어서 상당히 중요하며, 신뢰도를 높이기 위해서는 단순한 인식기능 외에 부적절한 입력 패턴의 거부 기능이 필요하다. 본 논문에서는 이러한 신뢰성 문제를 해결하기 위하여 음소기반 인식 네트워크에서 필러 모델 방법과 단어 검출률 방법을 사용하여 실험하였고, 문장의 단어 수에 따른 두 방법의 문장 거부 성능을 FAR과 FRR의 평균을 최소화 하는 값을 각각 구함으로써 비교
${\cdot}$ 분석 하였다. 그 결과 필러모델 방법이 좀 더 나은 거부 성능을 보였고, 단어 검출률을 이용하는 방법이 인식 네트워크를 전부 거치지 않아도 되므로 실행속도와 메모리 절약에서 효과적이었다. -
레이저 프린터의 드럼 자동시각 검사 시스템은 사람의 육안 검사를 자동화함으로써 정확하고 신속한 제품 검사가 가능하도록 한다. 또한 검사 결과를 데이터베이스화함으로써 지속적인 불량 발생 요인을 찾아 조치할 수 있어 불량률 감소와 제품 신뢰도 향상을 도모할 수 있다. 본 연구에서는 레이저 프린터 드럼의 표면에 발생하는 결항을 자동으로 검사하는 시각 검사 시스템을 구현하였고 이를 적용하여 신속하고 정확한 검사가 가능함을 보였다.
-
자동차 전자 부품 중 하나인 정션박스의 자동 시각 검사 시스템은 사랑의 육안 검사를 자동화함으로써, 정확하고 빠른 검사가 가능하다. 또한 검사 결과를 데이터베이스화하여 지속적인 불량 발생요인을 분석할 수 있기 때문에 불량률을 감소시켜 제품 신뢰도를 향상시킬 수 인다. 본 연구에서는 정션박스에 삽입된 퓨즈와 릴레이의 유무 및 오결합을 자동으로 검사하는 자동 시각 검사 시스템을 구현하였고 이를 적용한 결과 신속하고 정확한 검사가 가능함을 보였다.
-
비디오 데이터의 장면전환 검출은 동영상 검색, 색인 등의 응용을 위한 첫 단계로서 매우 중요한 기술이다. 본 논문에서는 점진적 장면전환의 하나인 wipe 장면전환의 검출 방법을 제안한다. 제안하는 방법은 wipe 구간 내에서 현재 장면과 이전 장면의 경계선의 이동 궤적을 이용하여 wipe 장면전환을 검출하는 기존의 방법에 허프 변환을 추가하는 것을 기반으로 한다. 이 방법은 보다 정확한 wipe 경계선의 이동 궤적을 구함으로써 기존의 방법에 비해 보다 높은 검출 성능을 보여준다.
-
본 논문은 포즈가 취해진 얼굴의 정확한 특징점 추출을 위하여 적응적인 평균 모양 방법을 이용한 ASM(Active Shape Model)을 제안한다. ASM은 사람 얼굴의 모양을 모델링하기 위하여 통계학상의 모양 모델을 이용한다. 통계학상의 모양 모델의 평균 모양은 입력 영상의 얼굴 포즈와 관계없이 하나로 고정되어 있으며, 이는 모양 모델 제한 조건 검사 및 복원과정에서 잘못된 결과를 만드는 원인이 된다. 이러한 문제를 해결하기 위하여 입력 영상의 얼굴 모양에 적응적인 평균 모양을 제안하며, 실험을 통해 제안한 방법이 고정된 평균 모양 방법의 문제를 해결하고 특징점 추출 성능을 향상시킴을 보였다.
-
필기는 특정인의 정체성을 나타내는 매우 효과적인 매체이다. 이런 이유로 최근 개인의 필기를 디지털 환경에서 사용하기 위한 방법들이 제안되고 있다. 또한 필기 인식 분야에서는 높은 성능의 필기 인식 시스템을 개발하기 위해 많은 양의 필기 데이터를 필요로 한다. 이에 본 연구는 주어진 데이터내의 문자 조합을 바탕으로 한글 필기를 생성하는 것을 목적으로 한다. 특히 데이터에서 관측되지 않은 필기까지도 생성하는 것을 주요 문제로 다룬다. 실험 결과 생성된 필기는 실제 필기와 시각적으로 매우 유사함을 보인다.
-
간경변을 보유한 환자의 복부 CT 영상을 관찰한 결과 비장의 웨이브 패턴(wave pattern)이 정상간을 보유한 사람의 복부 CT 영상과 차이가 있음이 발견되었다. 한편 간경변에 동반된 비장은 일반적으로 비대한 것으로 알려져 있다. 따라서 본 논문에서는 이러한 두가지 원리를 바탕으로, 복부 CT 영상에서 비장의 웨이브 패턴을 이용하여 비장 비대를 효과적으로 진단하는 새로운 방법을 제시한다. 제안된 방법에서는 단순히 비장의 크기만물 이용하지 않고 비장의 형태 변화를 바탕으로 국소적 비장 비대의 자동 판정을 효과적으로 수행할 수 있음을 입증하였다.
-
장면전환의 검출은 비디오 브라우징, 검색, 요약 등에 관한 많은 응용에 유용하다. 본 논문에서는 점진적 장면전환 검출을 위해 정의된 N-길이 로컬 윈도우 내에서 비유사도 분포가 갖는 최소값만큼 상승하여 형성되는 분포를 구하고, 분포의 상단이 이루는 비유사도 값을 누적하여 설정된 임계값보다 클 경우 점진적 장면전환으로 판단하는 방법을 제안한다. 장면전환 구간에서 이루는 영역의 누적값은 최소-최대 분포를 이용하여 구할 수 있다. 실험에서 기존의 제안된 방법과 비교를 하였고 그 결과 제안된 방법에서 올바른 장면전환 검출 성능은 낮았으나 잘못 검출되는 장면전환 수는 적은 결과를 보였다. 제안된 방법은 점진적 장면전환 검출을 위한 임계값의 선택이 쉬우며, 장면전환 길이에 크게 의존하지 않는 장점이 있고 수행속도가 높아 실시간으로 처리하는데 적합하다.
-
내용기반 영상 검색 시스템은 데이터베이스에 저장된 정지영상의 색이나, 질감, 형태 등의 특징을 이용한다. 본 연구는 실험 영상 집합에서 주요 객체를 추출하여, 객체들의 외형으로부터 분리된 토큰들을 군집화 한 후, 그 군집단위를 색인어로 사용하여 검색하는 방법이다. 기존의 내용기반 영상 검색 시스템에서 모양 정보는 그 표현과 색인 정합 등의 문제로 처리 방법이 명확하지 않았고, 회전, 크기 변화, 폐색 등에 민감했다. 따라서 기존 방법의 문제점을 해결하기 위해서 토큰을 이용한 색인을 이용하여 지역 정보와, 이들 지역 정보들의 관계에 의한 전역 정보를 복합적으로 이용한 방법을 제안한다.
-
비디오 데이터에서 의미적 인식을 위해 활용되는 요소 중 하나가 객체에 대한 움직임 정보로 이는 비디오 데이터에 대한 색인과 내용 기반 검색을 수행하는데 중요한 역할을 한다. 본 논문에서는 효율적인 객체기반 비디오 검색과 비디오의 움직임 해석을 위한 시공간 관계 표현 방법을 제시한다. 비디오의 객체표현 방법은 Polygon-based Bounding Volume의 3차원 Mesh 모델을 생성한 후 이를 이용하여 비디오 내 개체의 구조적 내용을 저차원적 속성과 움직임에 대한 기본 구조로 활용하였다. 또한, 움직임 객체에 대해 시공간적 특성과 시각적 특성을 동시에 고려하여 표현되도록 하였다. 각 Vertex는 시각적 특징 중 일부분이고, 비디오 내 개체의 공간적 특성과 개체의 움직임은 Volume Trajectory로 모델링되고, 개체와 개체간의 시공간적 관계를 표현하기 위한 Operation을 정의한다.
-
영상처리분야의 연구개발은 특정 분야에 특화된 알고리즘을 이용하고, 이러한 특수성으로 인해 유사한 기능을 반복적으로 구현하는 문제점을 안고 있다. 특히 연구개발결과물의 공유환경이 마련되어있지 않아 이러한 문제점을 더욱 가중시켜 연구개발비용의 증가를 유발하고 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 영상처리용 통합개발환경과 연계된 P2P기반의 공유체계를 제안한다. 제안된 시스템은 많은 비용을 들여 연구개발한 영상처리 알고리즘이 사장되는 위험을 감소시키고 재활용 가능성을 높일 것으로 기대한다.
-
디지털 기술과 통신 기술의 발전으로 멀티미디어 컨텐츠가 급격히 증가하고 있다. 이러한 멀티미디어 컨텐츠는 다양한 유무선 서비스 환경에서 실시간 서비스가 가능해야 한다. 그러기 위해서는 멀티미디어 컨텐츠 중 가장 큰 비중을 차지하는 영상 및 오디오 컨텐츠에 대한 압축 및 전송 기술이 요구된다. 현재 여러 분야에서 영상 및 오디오에 대한 압축 표준으로는 MPEG 이 자리잡았다. 그리고 MPEG에 대한 많은 개선 노력이 있었으며 특히 테스트 모델인 TM5를 비롯한 많은 연구에서 벡터 추출이나 양자화를 이용한 방법을 중심으로 비트율을 제어하기 위한 부호화기 모델이 제시되었다. 본 논문에서는 기존의 연구 접근 방식과는 다르게 프레임 유형간의 거리를 이용하여 영상의 특성에 따라 보다 적합한 프레임 구조를 찾아 제안하였다. 즉 영상의 복잡도와 변화도에 따라 영상의 종류를 구분하고 각 종류별 영상에 대한 표준 MPEG 인코딩 화질을 기준으로 삼은 후, GOP구조 내에서 프레임 유형간의 거리를 조정하여 화질을 손상하지 않고 가장 적은 비트율을 보상하는 프레임구조를 실험 및 분석을 통해 찾아 제안하였다.
-
의미 분석이란 프로그램의 각 구성요소의 결합이 의미적으로 타당한가를 분석하는 과정으로 최근 컴파일러의 제작에서 필수 불가결한 요소이며, 속성문법(attribute grammar)이나 경험적인 방법(manual method)으로 해결한다. 그러나 이러한 방법론들은 효율성이나 자동화 측면에서 제약성을 가진다. 본 연구에서는 이러한 단점을 보완하기 위해 의미 분석정보가 포함된 시멘틱 트리를 정의하고, 대부분의 컴파일러에서 사용되는 구문분석 결과물인 추상 구문 트리를 시멘틱 트리로 변환하는 기법을 제안한다. 시멘틱 트리 변환기법은 의미 분석과정을 시멘틱 노드 단위로 처리하므로, 의미 분석 과정이 일관적으로 수행되며 효율적이고, 타 자료구조로의 변환이 용이하며 자동화가 용이하다.
-
자바의 문제점은 실행속도의 저하이다. 실행속도 저하의 해결 방법으로 네이티브 코드로 변환, JIT컴파일러, 바이트코드 최적화등의 연구가 되어 왔다. 그 중에 바이트코드 최적화 방법을 사용하는 CTOC(Class To Optimized Classes)에서 중간코드로 사용하는 3-주소 코드를 스택-기반 코드로 코드 확장 기법으로 변환 시 불필요한 store/load 코드가 생성된다. 따라서 본 논문은 불필요한 store/load 코드를 제거하기 위해서 부분 중복 코드 제거 후 불필요한 store/load문을 제거함으로서 불필요한 store/load 코드의 양을 줄이는 변환기를 제안하고, 거기에 대한 간단한 예를 들어 설명한다.
-
최근 다양한 모바일 기기가 등장하면서 플랫폼에 독립적인 응용 프로그래밍 실행 환경을 구축하기 위해 가상기계(Virtual Machine)와 가상기계 기반의 언어가 등장하고 있다. 가상기계 환경에서 수행되는 응용 프로그램의 원활한 수행물 위해서는 입출력, 시스템 함수 호출 등에 대해서는 플랫폼에 의존적인 네이티브 코드를 적절한 방식으로 연결해주어야 한다. 본 논문에서는 기존의 가상기계들이 특정 플랫폼에 탑재 되는 방식 및 네이티브 코드 연결 방식을 고찰한 후 본 연구팀에서 현재 개발중인 임베디드 시스템을 위한 가상기계(EVM)에 적용하여 보다 효과적인 연결 기법을 제시하고자 한다.
-
본 논문에서는 절차 중심 소프트웨어를 객체 지향 소프트웨어로 재/역공학기 위한 다단계 절차 중 객체 추출 단계에서 선 클러스터링을 통해 불필요한 정제 결합단계를 축소하고, 영역 전문가의 선택으로 영역모델링에 가장 가까운 객체 후보군을 제시하는 알고리즘을 제안하고자 한다. 기존의 연구에서는 영역 모델링과 다중 객체 후보군과의 유사도를 측정하여 영역 전문가에게 최적합 후보를 선택할 수 있는 측정 결과를 제시하였다. 하지만 영역 전문가가 제시하는 영역 모델링이 존재한다면 정제 결합단계이전에 최대한의 선 클러스터링을 통해서 영역 모델링과 가장 유사한 통합 객체를 제시할 수 있고, 정제 결합 단계를 선 클러스터링을 통해서 축소할 수 있으며 이를 통해서 객체 후보군과 영역모델링의 유사도를 향상 시키며 클러스터링에 따른 시간과 공간을 절약할 수 있다. 따라서 본 논문에서는 영역 모델링과 사용자의 함수, 전역변수의 선택을 통해 영역 모델링에 가장 유사한 객체 후보군을 찾는 선 클러스터링 알고리즘 제안 하고자 한다.
-
자바 언어는 병행 프로그래밍을 위해 쓰레드를 제공한다. 자바 병행 프로그램은 레이스 컨디션이나 데드락에 의하여 사용자가 원하지 않은 값을 출력하거나 예기치 못한 오류를 발생시킬 수 있다. 이러한 문제는 프로그램의 전반적인 신뢰성 및 안정성에 악영향을 미칠 수 있다. 본 연구에서는 실행 중에 실시간으로 쓰레드와 동기화 객체의 발생과 처리 과정을 보여줄 수 있는 모니터링 시스템을 코드 인라인 기법을 기반으로 설계 개발하였다. 이 시스템은 사용자 옵션에 따라 관심 있는 쓰레드나 동기화 객체만을 추적할 수 있으며 실행 후에 쓰레드와 동기화 객체 관련 요약 프로파일 정보를 제공한다.
-
Jini 서비스는 개발자에게 분산시스템을 쉽게 개발할 수 있는 하부구조를 제공한다. Jini 서비스 중 하나인 Javaspace는 자바환경의 분산컴퓨팅 모델로서 Java 객체를 저장하고 저장된 객체에 접근할 수 있는 공간을 말한다. 이러한 Javaspace 서비스는 객체를 공유하는 방법으로 매우 유용하게 사용되고 있지만, 보안성이 취약하여 객체정보에 대한 접근 보안이 요구되는 분산시스템의 개발에는 적합하지 않다. 본 논문에서는 Javaspace의 취약한 보안성을 강화시켜 안전한 Javaspace 서비스를 제공하는 SecureJS 시스템에 대하여 설명한다.
-
Maple은 수학적 표현에 가까운 프로그래밍 언어로, 함수, 표현열(sequence), 집합, 리스트, 배열, 테이블, 등의 자료구조를 가지고 있다. 단순히 과학 계산과 관련된 수식처리뿐만 아니라 수식기호와 표현을 해석하여 그 문법과 의미를 파악할 수 있는 기능을 갖추고 있다. 본 연구에서는 Maple을 이용하여 그래프 이론 학습에 사용할 수 있는 white box형 워크시트를 개발하고, 개발된 워크시트를 웹에서 서비스 할 수 있도록 html로 변환하였다.
-
국제적으로 표준화 된 객체지향 언어 중 하나인 ada는 동시수행제어(concurrent) 프로그래밍 언어로 임베디드 시스템에서 가장 널리 사용되고 있다. 하지만 현재 ada 프로그램의 주석을 처리하거나 프로그램의 명세를 나타내는 툴은 거의 없다. 이에 기존에 존재하는 javadoc과 비슷한 역할을 하는 AdaDoc을 단순칠 주석들만 출력하는 것이 아닌 몇 가지 특정 tag를 지원하게 하고 명세들을 보기 좋게 출력할 수 있는 자동 문서 생성 시스템으로 확장하였다.
-
표절이란 원본 자료의 출처를 밝히지 않고 사용하는 행위인데, 프로그램 표절은 표절로 의심되는 유사 소스코드를 말한다. 프로그램 표절을 검출하는 방법은 소스코드의 토큰 요약 후 비교하거나 단어와 키워드의 개수를 측정해 통계적으로 비교, 계산하거나 또는 프로그램의 구문구조를 비교하는 등 여러 접근 방법이 있다. 본 조사 보고서에서는 프로그램 표절 검출 방법 및 응용 도구에 대한 최근 연구 동향을 조사하여 정리하고 향후 발전 방향을 토론한다.
-
본 논문은 임베디드 소프트웨어 개발자가 개발 소프트웨어의 성능 테스팅 결과를 그래픽 형태의 인터페이스를 통해 쉽고 편리하게 분석할 수 있는 성능 분석기를 제안한다. 제안하는 성능 분석기는 임베디드 소프트웨어에 대해 생성된 텍스트 기반 저수준의 성능 평가 정보를 그래픽 형태의 결과 화면으로 재구성하기 위한 API로 변형하는 정보 변환기 모듈과 API 형태의 자료구조를 이용해 성능 평가 결과를 그래픽 형태로 출력하는 레포트 생성기로 구성된다. 제안하는 그래픽 기반의 성능 분석기는 개발자나 사용자에게 그래픽 형태의 편리한 성능 분석 레포팅을 제공한다. 따라서, 임베디드 소프트웨어 개발자는 기존의 텍스트 형태의 결과를 분석하기 위한 시간과 노력을 줄일 수 있고, 즉각적이고 직관적인 결과 분석기회를 얻을 수 있어 관련 소프트웨어 개발 효율성을 높일 수 있을 것이다.