• 제목/요약/키워드: 패턴 유사성 검색

검색결과 50건 처리시간 0.032초

KM 기반의 기록관리 및 일반 정보관리 통합화 연구 - 공기업을 중심으로 - (A Study of Integrated RM & IM with KM Governance: Public Enterprise Centered)

  • 정기애;남영준
    • 한국비블리아학회지
    • /
    • 제19권2호
    • /
    • pp.23-43
    • /
    • 2008
  • 기업의 지식자원은 내부성과물인 기록과 외부에서 획득한 정보자료로 구분된다. 지식자원의 디지털화로 인해 내부 생산 기록과 외부 획득 정보자료의 생산 및 획득과정, 저장 및 검색기술, 이용자의 자료이용 패턴등이 유사해지고 그로 인해 생산에서 유통, 저장, 보존까지의 수명주기도 유사해졌다. 따라서 기록과 일반 정보자료의 구분 혹은 분리 개념의 전통적인 관리 방법에서 벗어난 통합관리의 필요성이 대두되고 있다. 이 연구는 기록관리와 정보자료 관리의 분야 특성을 비교하고 통합관리를 위해 KM 기반의 구축 전략의 필요성과 구체적인 방법론을 제시하였다. 특히 정부예산의 상당부분이 투입되는 공기업의 지식자원 관리를 중심으로 통합대상의 선정과 통합방법, 통합주체에 대한 방안을 제시하였다.

유사어 벡터 확장을 통한 XML태그의 유사성 검사 (Similarity checking between XML tags through expanding synonym vector)

  • 이정원;이혜수;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.676-683
    • /
    • 2002
  • XML(extensible Markup Language)문서가 웹 문서의 표준으로 자리 매김 할 수 있는 가장 큰 성공요인은 사용자가 문서 타입을 기술할 수 있는 유연성(flexibility)이다. 그러나 XML의 유연성으로 야기되는 문제점은 동일한 의미를 표현하기 위해 XML문서 작성자마다 서로 다른 태그명과 구조를 사용한다는 점이다. 즉 서로 다른 태그 집합, 요소(element), 속성(attribute)에 대한 서로 다른 이름 또는 다른 문서 구조로 인해 다른 태그로 표현된 문서는 서로 다른 부류의 문서로 간주되기 쉽다. 따라서 본 논문은 XML태그에 내재된 의미 정보(semantic information)와 구조 정보(structured information)를 추출하여 의미적으로 최대한 유사한 동의어로 확장하고, XML문서의 확장된 태그간의 의미적 유사도를 비교 분석할 수 있는 개념 기반의 태그 패턴 매처(Tag Pattern Matcher)를 설계 구현하였다. 두 XML문서의 태그간의 의미적 유사도에 가중치를 부여하여 기존의 비구조적인(semi-structured) 문서를 위한 벡터 스페이스 모델(vector space model)을 확장함으로써 두 XML문서가 유사한지를 파악할 수 있다.

사운드 실감성 증진을 위한 사운드 감지 알고리즘 기반 촉각진동자극 생성 (Vibration Stimulus Generation using Sound Detection Algorithm for Improved Sound Experience)

  • 지동주;오성진;전경구;성미영
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.158-162
    • /
    • 2009
  • 적절한 촉각자극은 사운드 효과의 실감성을 증진시킬 수 있다. 예를 들어, 게임이나 영화 등에서 총소리와 함께 발생하는 진동자극은 감상자의 몰입감을 향상시킬 수 있다. 이러한 맥락에서 음향만을 담고 있는 기존 사운드 파일에 촉각자극정보를 부가하여 사운드 플레이와 함께 햅틱장치를 통해 진동자극을 준다면 좀 더 사실감 있는 사운드 체험을 할 수 있을 것이다. 본 논문에서는 사운드 파일을 분석하여 그에 따른 촉각자극정보를 생성하는 방법을 제안한다. 촉각자극정보란 사운드 파일 내에서 특정 소리가 발생하는 시간위치와 발생시켜야 하는 촉각자극패턴이다. 수작업으로 이러한 촉각자극정보를 생성하는 것은 많은 수고를 필요로 한다. 본 논문은 이러한 수작업을 대체할 수 있도록, 사운드 파일에서 특정 소리의 발생시점을 검색할 수 있는 사운드 감지 알고리즘과 촉각자극정보 생성방식을 제안한다. 사운드 감지 알고리즘은 검색하고자 하는 사운드의 주파수 특성을 이용하여 유사한 특성을 가지는 시점들을 찾아낸다. 개발한 알고리즘을 실험한 결과, 5가지 서로 다른 사운드에 대해 98% 이상의 감지 성공률을 얻을 수 있었다. 연구 결과를 종합하여 GUI기반의 진동패턴 생성 유틸리티를 개발하였다. 이 유틸리티를 이용하면 사운드 파일에서 특정 소리의 발생 부분을 자동으로 검색하고, 그 시점마다 원하는 진동정보를 손쉽게 생성할 수 있다.

  • PDF

PHR 기반 개인 맞춤형 건강정보 탐사 알고리즘 설계 (Design of knowledge search algorithm for PHR based personalized health information system)

  • 신문선
    • 디지털융복합연구
    • /
    • 제15권4호
    • /
    • pp.191-198
    • /
    • 2017
  • PHR(Personal Health Record)기반 헬스케어 서비스 플랫폼 지능화를 위해서는 사용자 맞춤형 건강정보 제공서비스가 필요하다. 본 논문에서는 개인 맞춤형 건강정보 추천을 위해서 온톨로지 기반 건강 정보 모델을 제안하였다. 또한 기계학습과 데이터마이닝 기법을 적용한 유사 건강정보 탐사 알고리즘을 설계하였다. 기존의 데이터마이닝 기법중 연관규칙 알고리즘을 확장하여 속성을 기반으로 연관규칙 탐사를 수행하여 지식탐사의 연관성을 높이고 효율적인 탐사시간을 제공할 수 있도록 하였다. 머신러닝의 한 기법인 K근접이웃 알고리즘을 적용하여 사용자 프로파일별 그룹화를 수행하고 유사패턴의 사용자 프로파일을 검색할 수 있도록 하였다. 이는 사용자의 질환과 건강상태에 따른 맞춤형 건강정보 탐사 수행의 효율성을 높인다. 제안된 알고리즘은 개인 맞춤형 헬스케어 서비스 플랫폼에서 추론과정에 적용되어 사용자에게 개인맞춤형건강정보를 추천하는 것을 가능하게 한다. 이는 고령화사회에서 스마트한 자가 건강관리에 활용될 수 있다.

시계열 데이터베이스에서 인덱스 보간법을 기반으로 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘 (An Index Interpolation-based Subsequence Matching Algorithm supporting Normalization Transform in Time-Series Databases)

  • 노웅기;김상욱;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.217-232
    • /
    • 2001
  • 본 논문에서는 시계열 데이터베이스에서 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘을 제안한다. 정규화 변환을 시계열 데이터 간의 절대적인 유클리드 거리에 관계 없이, 구성하는 값들의 상대적인 변화 추이가 유사한 패턴을 갖는 시계열 데이터를 검색하는 데에 유용하다. 기존의 서브시퀀스 매칭 알고리즘을 확장 없이 정규화 변환 서브시퀀스 매칭에 단순히 응용할 경우, 질의 결과로 반환되어야 할 서부시퀀스를 모두 찾아내지 못하는 착오 기각이 발생한다. 또한, 정규화 변환을 지원하는 기존의 전체 매칭 알고리즘의 경우, 모든 가능한 질의 시퀀스 길이 각각에 대하여 하나씩의 인덱스를 생성하여야 하므로, 저장 공간 및 데이터 시퀀스 삽입/삭제의 부담이 매우 심각하다. 본 논문에서는 인덱스 보간법을 이용하여 문제를 해결한다. 인덱스 보간법은 인덱스가 요구되는 모든 경우 중에서 적당한 간격의 일부에 대해서만 생성된 인덱스를 이용하며, 인덱스가 필요한 모든 경우에 대한 탐색을 수행하는 기법이다. 제안된 알고리즘은 몇 개의 질의 시퀀스 길이에 대해서만 각각 인덱스를 생성한 후, 이를 이용하여 모든 가능한 길이의 질의 시퀀스에 대해서 탐색을 수행한다. 이때, 착오 기각이 발생하지 않음을 증명한다. 제안된 알고리즘은 질의 시에 주어진 질의 시퀀스의 길이에 따라 생성되어 있는 인덱스 중에서 가장 적절한 것을 선택하여 탐색을 수행한다. 이때, 생성되어 있는 인덱스의 개수가 많을수록 탐색 성능이 향상된다. 필요에 따라 인덱스의 개수를 변화함으로써 탐색 성능과 저장 공간 간의 비율을 유연하게 조정할 수 있다. 질의 시퀀스의 길이 256 ~ 512중 다섯 개의 길이에 대해 인덱스를 생성하여 실험한 결과, 탐색 결과 선택률이 $10^{-2}$일 때 제안된 알고리즘의 탐색 성능이 순차 검색에 비하여 평균 2.40배, 선택률이 $10^{-5}$일 때 평균 14.6배 개선되었다. 제안된 알고리즘의 탐색 성능은 탐색 결과 선택률이 작아질수록 더욱 향상되므로, 실제 데이터베이스 응용에서의 효용성이 높다고 판단된다.

  • PDF

고객의 선호 특성 정보를 이용한 상품 추천 시스템 (Goods Recommendation Sysrem using a Customer’s Preference Features Information)

  • 성경상;박연출;안재명;오해석
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1205-1212
    • /
    • 2004
  • 전자상거래 시스템의 보급이 활성화되기 시작하면서, 사용자의 필요와 욕구에 밀착한 적응형 전자상거래 에이전트의 필요성이 증대되고 있다. 이와 같은 적응형 전자상거래 에이전트는 사용자의 행위를 모니터하고 자동 분류하여 사용자의 취향을 학습하는 기능을 요하게 되었다. 이러한 기능을 가지는 적응형 전자상거래 에이전트를 구축하기 위해서, 본 논문에서는 사용자 개인의 관심정보와 선호하는 상품에 대한 호감도를 고려한 적응형 전자 상거래 에이전트 시스템을 제안한다. 제안하는 시스템은 사용자의 구매 행위에 적응력을 가질 수 있도록 보다 정확한 사용자 프로파일을 구축하고, 이와 같은 사용자 프로파일을 기반으로 사용자에게 불필요한 검색과정 없이 필요한 상품 정보를 제공 할 수 있도록 한다. 본 시스템에서는 모니터링을 통하여 사용자 의도를 파악하는 모니터 에이전트, 사용자의 행동성향을 학습 한 후 행동 패턴이 유사한 그룹을 참조하는 유사도 참조 에이전트, 사용자의 행위의 변화에 따른 개인화된 행동 DB를 구축할 수 있는 관심 추출 에이전트로 구성하였다.

거리반경기반 대표문자열 문제의 NP-완전 (The Consensus String Problem based on Radius is NP-complete)

  • 나중채;심정섭
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권3호
    • /
    • pp.135-139
    • /
    • 2009
  • 여러 문자열들을 비교하여 유사성 또는 거리(오차)를 계산하는 문제는 패턴매칭, 웹검색 바이오인포매틱스, 컴퓨터 보안 등 다양한 응용 분야와의 연관성으로 인해 활발히 연구되어 왔다. 주어진 문자열 집합 내의 여러 문자열들의 거리를 비교하기 위해 주어진 집합 내의 모든 문자열들을 대표하는 한 문자열(대표문자열)을 찾는 방법이 있다. 대표문자열 방법은 주어진 문자열 집합과 가장 유사한 한 문자열을 찾는 방법으로 주로 이용되는 목적함수는 거리반경과 거리합이 있다. 거리반경은 집합 내의 문자열들과 특정 문자열과의 거리들의 최대값으로 정의되며, 모든 문자열들 중에서 최소의 거리반경을 만드는 문자열을 주어진 문자열 집합에 대한 거리반경기반 대표문자열이라 한다. 거리합은 집합 내의 문자열들과 특정 문자열과의 거리들의 합으로 정의되며, 모든 문자열들 중에서 최소의 거리합을 만드는 문자열을 주어진 문자열집합에 대한 거리합기반 대표문자열이라 한다. 본 논문에서는 메트릭 거리함수에 대해 거리반경기반 대표문자열 문제가 NP-완전임을 증명한다.

들깻잎과 생산환경에서 분리한 Bacillus cereus의 독소 유전자와 항생제 감수성 분석 (Profiles of Toxin Genes and Antibiotic Susceptibility of Bacillus cereus Isolated from Perilla Leaf and Cultivation Areas)

  • 김세리;이지영;이서현;류경열;박경훈;김병석;윤요한;심원보;김경열;하상도;윤종철;정덕화
    • 한국식품과학회지
    • /
    • 제43권2호
    • /
    • pp.134-141
    • /
    • 2011
  • 본 연구는 들깻잎과 들깻잎 생산환경을 대상으로 276개의 시료를 채취하여 B. cereus를 분리 하였다. 분리된 B. cereus 200주의 toxicity를 평가하고자 독소유전자와 항생제내성을 검색하였다. 그 결과 분리된 균주에서 11개의 서로 다른 독소유전자 패턴은 확인하였으며 5개의 설사형독소와 구토형 독소를 모두 생성할 수 있는 균주는 21%였다. 가장 빈번하게 검출되는 독소유전자는 nheA(100%), enFM(100%), hblA, C, D(66.5%)였으며 EM은 가장 낮은 빈도(21.0%)로 검출되었다. 항생제 내성평가결과 분리된 대부분의 B. cereus는 18종의 항생제 중 10개의 항생제에 대해서는 감수성이었으나 ${\beta}$-lactam계 항생제인 penicillin(100%), ampicillin(100%), oxacillin(94.9%), amoxicillin-clavulanic acid(95.6%), cefazolin(78.2%)과 비${\beta}$-lactam계 항생제 rifampicin(58.0%)에 대해서 저항성을 보이는 것으로 나타났다. 들깻잎과 들깻잎 생산환경에서 분리된 B. cereus의 독소유전자와 항생제내성 패턴은 서로 유사하였다. 따라서 본 연구결과는 들깻잎에 오염된 B. cereus에 의하여 설사형 뿐만 아니라 구토형 식중독이 발생할 가능성을 시사하며 들깻잎과 생산환경에서 항생제 저항성 B. cereus가 검출되어 의약계뿐만 아니라 농업현장에서도 항생제내성균주 출현을 예방하는 대책이 요구된다.

Denaturing gradient gel electrophoresis와 real time PCR 방법을 이용한 연어 유전자들의 DNA 이형 다양성 검색 (DNA Heteropolymorphism of Chum Salmon Detected by Denaturing Gradient Gel Electrophoresis and Real Time PCR)

  • 함승협;이석근;한현섭;진덕희
    • 한국수산과학회지
    • /
    • 제35권5호
    • /
    • pp.490-496
    • /
    • 2002
  • 한국, 미국, 일본지역에 서식하는 연어에서 추출한 genomic DNA를 이용하여 연어의 mtDNA NDI 영역, D-loop 영역, growth hormone, IGF-I, MCH2, histone H3의 염기서열을 분석하여, 최적의 primer를 제작하여 PCR을 실시한 결과, mtDNA NDI 영역은 Ks12, Ks24, As11, As14, Js13, Js15에서 증폭된 DNA를 확인하였으며, D-loop 영역, growth hormone, IGF-I, histone H3, MCH2에서는 모든 시료에서 증폭된 DNA를 확인하였다. DGGE 분석의 결과, mtDNA NDI 영역 (AF133701, 449-880), D-loop 영역 (AF125518, 11-514)과 growth hormone (AFO05927, 181-530)에서는 이형다양성을 확인하였으며, IGF-I (AF063216, 962-1461)과 MCH2 (M27281, 70-593)는 모두 이형다양성이 나타났으나, histone H3 (AF017147, 7-487)는 모두 이형다양성이 관찰되지 않았다. 그리고 real time PCR 관찰 결과는 DGGE의 결과와 유사한 점을 찾을 수 없었지만, real time PCR도 각각의 유전자에 따라 서로 다른 DNA 생성 패턴을 보여 DNA 변이를 쉽게 구별하는데 보조적인 도움이 되었다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.