• 제목/요약/키워드: 생성형 정보추출

검색결과 246건 처리시간 0.028초

적응형 웹 사이트 구축을 위한 연관규칙 알고리즘 개발과 적용 (Development and Application of An Adaptive Web Site Construction Algorithm)

  • 최윤희;전우천
    • 정보처리학회논문지D
    • /
    • 제16D권3호
    • /
    • pp.423-432
    • /
    • 2009
  • 컴퓨터의 보급과 인터넷의 발달로 인해 데이터의 유통은 증가하고 있으나 전통적인 방법으로는 가치 있고 의미 있는 정보를 획득하는 것은 어렵다. 또한, 정보화 사회에서의 많은 정보 중에서 자신에게 알맞은 정보를 탐사하는 데이터 마이닝의 필요성이 대두되고 있다. 또한 사용자들의 편리한 인터넷 항해를 돕고 적절한 정보를 제공할 수 있는 적응형 웹 사이트에 관한 연구도 필요하다. 본 연구의 목적은 사용자들에게 연관성이 있는 웹 페이지를 연결해 주는 적응형 웹 사이트 구축을 위해 웹 로그 분석을 통한 웹 사이트 사용자들의 행동 패턴을 발견하는 연관규칙 알고리즘의 개발에 있다. 데이터 마이닝의 기법 중에서 연관규칙은 웹 사이트에 접속하는 사용자들의 행동을 파악하는데 효과적이다. 본 논문에서는 웹 사용 마이닝을 이용하여 웹 서버의 로그 데이터를 분석하여 트랜잭션을 구성하고, 사용자들의 행동 패턴을 발견하기 위한 의미 있는 문서만을 추출하여 추출된 문서를 대상으로 발견한 빈발 항목으로 연결리스트를 구성하며, 빈발 패턴을 찾아 웹 페이지에 적용하는 일련의 알고리즘을 제안한다. 제안한 알고리즘의 특징은 첫째, 빈발패턴 발견을 위해 생성하는 연결리스트 이외에는 마이닝 과정에서 다른 중간생성물이 필요하지 않으므로 공간 사용면에 있어 효율적이다. 둘째, 기존의 연관규칙 알고리즘에 비해 데이터 베이스의 스캔 횟수를 줄이고, 시간복잡도를 개선하였다.

인라이닝에 기반한 XML 스키마의 관계형 스키마 변환 기법 (A Transformation Technique of XML Schema into Relational Schema Based-on Inlining)

  • 조정길
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1021-1030
    • /
    • 2004
  • 데이터 중심의 XML 문서를 관계형 데이터베이스에 저장하고 관리할 경우에 XML 스키마로부터 관계형 스키마를 추출하는 것이 보다 시급한 일이다. 또한 생성된 테이블에 XML 문서를 분할하여 저장할 경우에 많은 널 값을 초래하거나 조인 비용의 증가를 가져오기 때문에 이에 대한 해결책이 필요하다. 이 논문에서는 XML 스키마로부터 관계형 스키마를 생성하는 Schema Hybrid Inlining 기법을 제안하였다. 제안된 기법은 XML 스키마 그래프를 바탕으로 관계형 스키마를 생성하게 되는데, 기존의 Inlining 방식을 확장하여 출현 지시자와 진입 차수에서의 테이블 생성 방법을 휴리스틱하게 매뉴얼 처리를 하며, 유도 관계에서 최종 노드인 조상 노드는 새로운 테이블을 생성한다. 또한 DTD 종속적인 저장 방식의 단점인 조인 연산 비용을 줄이기 위하여 중복을 활용한 분할 저장과 구조적 검색 기법을 개선한 관계 경로 요소 정보를 이용하였다.

저가형 3D 카메라를 이용한 K-POP 댄스 안무 검색 (K-POP Dance Choreography retrieval with low-cost depth cameras)

  • 김도형;장민수;윤영우;김재홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1435-1438
    • /
    • 2015
  • 본 논문에서는 대용량의 K-POP 모션캡처 데이터베이스에서 특정 안무구간을 검색하는 방법을 제안한다. 제안 기술은 저가형 3D 카메라를 이용하여 사용자가 직접 검색하고자 하는 동작을 생성하고 이를 질의동작으로 입력하여 원하는 안무동작을 검색하는 직관적인 검색 기술로서 구간 동작의 명칭이 존재하지 않는 K-POP 댄스를 검색하기 위한 핵심기술이다. 역동적인 댄스 자세를 표현하고 매칭하는 방법으로 관절 및 바디파트 간의 상대적인 각도 정보를 추출하고 비교하는 방법을 설명한다. 대용량의 모션캡쳐 데이터베이스를 고속으로 검색하기 위해서 안무동작의 핵심 자세를 분석하여 후보구간 집합을 빠르게 생성하고, 이들 집합에서 Dynamic Time Warping(DTW) 알고리즘으로 안무동작 간의 매칭거리를 보다 정밀하게 산출한다. 약 358분의 K-POP 댄스 곡 100곡에 대한 성능평가에서 92%의 검색정확도를 보였으며, 이는 K-POP 댄스 동작의 복잡성을 고려할 때 경쟁력 있는 성능치이다.

GIS를 이용한 배전설비고장예측 알고리즘의 구현 (Implementation of Distribution Outage Prediction Algorithm Using GIS)

  • 배명석
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2002년도 춘계학술대회 논문집
    • /
    • pp.89-94
    • /
    • 2002
  • 본 논문에서는 배전분야 설비관리 시스템을 대상으로 배전설비 고장시 GIS 기능을 이용하여 고장설비를 예측할 수 있는 방법과 구현 실례를 소개하고자 한다. 배전설비관리를 위한 지리정보 데이터 모델은 가공과 지중, 전기와 비전기, 점형과 선형의 특성을 가지는 배전설비의 특성을 분석하여 모델링된다. 모델링의 결과 생성된 데이터베이스는 실세계에 존재하는 대부분의 객체에 대한 정보를 포함하고 있으므로 매우 크고 그 구조 또한 복잡하다. 그러므로 응용프로그램이 필요로 하는 데이터를 추출하기 위하여 많은 시간이 요구된다. 그러나 고장복구업무를 위한 시스템은 사용자의 만족도를 위하여 추론의 정확성과 더불어 응답속도를 최소화하는 것이 필수조건이다. 이를 위하여 GIS 데이터베이스 모델을 좀 더 개량할 필요가 있으며, 본 논문에서는 이에 대한 한가지 방안으로 배전설비의 GIS 모델의 축약된 형태인 관계형 데이터베이스 모델을 제시한다. 고장점 추론은 이렇게 만들어진 축약모델을 이용하여 진행되며 고장신고 고객별로 회선, 개폐기, 변압기, 인입주 등 정보를 추출하고 추출된 설비들의 계통상 위치의 유사성을 추론하여 최종 예측점을 파악한다.

  • PDF

XML을 이용한 웹 정보 추출 및 다차원 분석 (Web Information Extraction and Multidimensional Analysis Using XML)

  • 박병권
    • 한국멀티미디어학회논문지
    • /
    • 제11권5호
    • /
    • pp.567-578
    • /
    • 2008
  • 인터넷에 있는 방대한 양의 웹 페이지들을 분석하기 위해서는 웹 페이지에 내재된 정보를 추출하는 것이 필요하다. 본 논문에서는 웹 페이지로부터 정보를 추출하고 이를 XML 문서로 변환하여 다차원적으로 분석하는 방법을 제안한다. 웹 페이지로부터 정보를 추출하기 위하여 두 종류의 언어를 제안한다. 하나는 객체지향 모델에 의거하여 웹 정보 추출 규칙을 기술하기 위한 것이고, 다른 하나는 추출하고자 하는 정보를 찾기 위한 HTML 태그 패턴을 정규식으로 기술하기 위한 것이다. XML 문서에 대한 다차원 분석을 위하여 관계형 데이터에 대해 하는 것처럼 웨어하우스를 구축하고 이로부터 다양한 큐브를 생성하는 방법을 제안한다. 마지막으로 본 논문에서 제안한 방법을 미국특허 웹 페이지에 적용한 예를 통해 그 타당성을 보인다.

  • PDF

관계형 데이터베이스를 OWL 2 웹 온톨로지로 사용하기 위한 OWL/관계형 매핑 규칙 (OWL/Relational Mapping Rules to Use Relational Databases as OWL 2 Web Ontologies)

  • 최지웅;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권7호
    • /
    • pp.35-47
    • /
    • 2011
  • 본 논문은 관계형 데이터베이스로부터 OWL 온톨로지를 자동으로 생성할 수 있는 규칙을 제안한다. 이 규칙의 목적은 기존 관계형 데이터베이스 데이터를 데이터베이스 스키마 변형과 데이터 마이그레이션과 같은 별도의 과정을 거치지 않고도 시맨틱 웹 환경에서 사용할 수 있도록 하는 것이다. 즉, 이 규칙은 RDBMS가 웹 온톨로지 저장소 역할을 동시에 수행하는 것을 돕는다. 그러나 기존의 관계형 데이터베이스와 OWL 사이의 매핑 규칙들을 본 연구의 목적을 위하여 사용하고자 할 경우 다음과 같은 문제가 발생한다. 첫째, 특정 구조의 테이블이 존재하는 데이터베이스로부터는 OWL 온톨로지를 생성할 수 없다. 둘째, 하나의 개체 추출을 위하여 높은 비용의 데이터베이스조인 연산 혹은 여러 개의 SQL 질의가 불필요하게 수반된다. 반면에 본 논문에서 제안하는 규칙은 이러한 문제들을 방지하도록 설계되었으며, 데이터베이스 스키마로부터 OWL 클래스와 프로퍼티를 생성하며, 데이터베이스 인스턴스로 부터 OWL 개체를 생성한다. 또한 이 규칙을 적용하여 생성한 OWL 온톨로지는 OWL 2 DL 사양을 만족시킨다.

R&D 회의를 위한 Ontology 기반의 적응형 컨텐츠 생성에 관한 연구 (A study of Ontology based Adaptive Contents Generation for R&D Meeting)

  • 진효정;황경은;하성도
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.537-540
    • /
    • 2007
  • 본 논문의 목적은 인간과 시스템의 상호작용에 의한 컨텐츠 생성을 가능하게 함으로써 회의공간에서의 지식창조 프로세스를 지원하는데 있다. 회의에 있어서 발표자료는 기존의 조직이 보유 하고 있는 유형 지식인 컨텐츠 리소스들에 발표자의 지식이 더해진 산물로서 기존의 조직의 지식과 회의에서 창조되는 새로운 지식 사이의 가교역할을 담당한다. 본 논문에서는 R&D 회의를 대상으로 이러한 회의에서의 새로운 지식 창조의 기반이 되는 발표자료의 작성을 지원하는 적응형 컨텐츠 생성 시스템 (Adaptive Contents Generation System)을 제안하였다. 제안 시스템을 구현하기 위하여 먼저 기존의 조직이 가지고 있는 자원인 구성원 정보, 프로젝트 및 미팅 정보, 컨텐츠 리소스들을 체계적으로 관리하기 위한 Ontology를 구축하였다. 이렇게 구축된 Ontology를 기반으로 제안 시스템은 회의, 발표자, 참가자들의 상황과 생성되는 컨텐츠의 종류에 적합한 Fragment 들을 추출하고 이들을 하나의 컨텐츠로 구조화하여 사용자에게 제공한다. 또한 사용자가 시스템으로부터 생성된 컨텐츠를 수정하고 시스템은 이를 반영할 수 있는 환경을 제공함으로써 시스템이 가지고 있는 지식에 사용자 자신의 지식을 더하여 표현할 수 있도록 하였다. 본 논문은 시스템과 인간의 협업 작업에 의한 인간 기능의 확장뿐만 아니라 조직의 지식경영 및 효율적인 컨텐츠 관리를 지원하는 데에 그 의의를 둘 수 있다.

  • PDF

오토인코더와 변이형 오토인코더를 활용한 공유 킥보드 사용자 인증 시스템 강화 (Reinforcement of user authentication system of shared kick scooter using autoencoder and variational autoencoder)

  • 강예준;김현지;임세진;김원웅;서화정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.643-646
    • /
    • 2021
  • 경찰청에 따르면 도로교통법이 개정된 이후 3개월단 개인형 이동장치(PM)를 단속한 결과 무면허 운전이 3199건에 달하는 것으로 나타났다. 공유 킥보드 서비스의 경우 회원가입을 할 때 운전면허증 취득 여부를 확인하긴 하지만 서비스를 이용할 때는 별도의 확인 절차 없이 대여할 수 있기 때문에 운전면허증을 취득하지 않았어도 대여하는 경우가 발생한다. 본 논문에서는 공유 킥보드 서비스의 보안 취약점을 보완하기 위해 오토인코더와 변이형 오토인코더를 사용한 딥러닝 기반의 공유 킥보드 대리 대여 방지 시스템을 제안한다. 오토인코더는 지문 데이터로부터 특징만을 추출할 수 있어, 사용자의 지문 원본을 서버에게 노출시키지 않을 수 있다. 변이형 오토인코더는 생성형 모델로써, 사용자의 지문 데이터를 증폭 시켜 합성곱 신경망의 성능을 높이는데 도움을 준다. 이러한 오토인코더와 변이형 오토인코더의 특징을 이용해 사용자의 지문을 서버에 노출시키지 않으면서 적은 데이터로 신뢰성 높은 사용자 인증이 가능한 전동 킥보드 대여 시스템을 제안한다.

온톨로지 및 사례기반추론을 이용한 맞춤형 통합 정보 생성 프레임워크의 제안 (Framework for Information Integration and Customization Using Ontology and Case-based Reasoning)

  • 이현정;손미애
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.141-158
    • /
    • 2009
  • 다양한 정보자원들로부터 사용자가 요구하는 맞춤화된 정보를 추출해 내는 것은 더욱 어려워지고 있다. RSS를 비롯하여 개선된 다양한 정보 수집 방법들이 개발되었지만, 여전히 정보가공자인 사람의 도움 없이 필요한 정보들을 수집하여 정리 및 가공하는 작업이 쉽지는 않다. 따라서 본 연구에서는 정보사용자들이 사용 목적에 맞게 정보를 가공하는 부담을 줄여주기 위해 사례기반추론과 온톨로지에 기반한 맞춤형 통합정보생성 프레임워크를 제안한다. 본 프레임워크는 세 단계로 구성된다. 첫째, 수집된 웹 정보를 정보가공의 용이성을 위해 사례로 변환한다. 둘째, 동적 유사도 검색을 통해 수집된 사례들로부터 정보 사용자의 동적 요구사항에 적합한 사례를 검색한다. 셋째, 전 단계에서 추출된 사례를 정보사용자의 요구사항에 보다 적합한 지식으로 가공하기 위해 집중 유사도를 적용한다. 본 프레임워크는 여행자들의 정보수집을 위한 여행정보시스템에 적용되어 그 효과를 입증하였다.

  • PDF

특질기반 테스트 대상 함수 추출을 위한 함수탐색기 (A function finder for property-based extraction of test target functions)

  • 김동우;박민규;최윤자
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.954-957
    • /
    • 2013
  • 고안전성이 요구되는 내장형 소프트웨어의 경우 극히 낮은 확률로 발생하는 오류로 인하여 전체시스템의 안전에 치명적인 상황을 야기할 수 있으므로, 철저한 안전성 검증이 요구된다. 모든 가능한 실행경로를 고려해야 하는 안전성 검증의 고비용 문제를 해결하기 위하여, 기존연구에서는 안전성 특질기반 테스트 대상함수를 추출하여 테스트 시나리오 생성하는 생성기를 개발하여 검증 효율을 높이는데 기여하였다. 그러나 기존의 도구는 함수포인터를 탐색 하지 못한 문제와, 변수에 대한 규칙 부족문제 그리고 모듈화 되지 않아 유지 및 보수가 어려운 문제가 있었다. 본 논문에서는 기존도구의 문제점들을 개선하여 정확도를 높인 새로운 함수탐색기를 소개한다. 개발된 함수탐색기는 모듈화 되어 차후에 수정 및 보완 문제에 대하여 유연하게 대처할 수 있게 하였다. 개선된 함수탐색기를 OSEK/VDX[1] 기반의 개방형 차량전장용 운영체제인 Trampoline을 대상으로 테스트 해 본 결과 기존 도구보다 약 68%의 높은 정확도를 보였다.