• 제목/요약/키워드: 그래프 검색

검색결과 227건 처리시간 0.024초

Balanced Canopy Clustering에 기반한 일반적 k-인접 이웃 그래프 생성 알고리즘 (A Generic Algorithm for k-Nearest Neighbor Graph Construction Based on Balanced Canopy Clustering)

  • 박영기;황혜수;이상구
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권4호
    • /
    • pp.327-332
    • /
    • 2015
  • k-인접 이웃 그래프는 모든 정점에 대한 k-NN 정보를 나타내는 데이터 구조로서, 많은 정보검색 및 추천 시스템에서 k-인접 이웃 그래프를 활용하고 있다. 현재까지 k-인접 이웃 그래프를 생성하는 다양한 방법들이 제안되었지만, 다음의 두 조건을 동시에 만족하는 알고리즘은 제안되지 못했다: (1) 특정유사도 척도를 가정하지 않는다. (2) 정점 또는 차원의 수가 증가하더라도 정확도가 감소하지 않는다. 본 논문에서는 balanced canopy clustering을 이용하여 위 두 조건을 모두 만족하는 k-NN 그래프 생성 알고리즘을 제안한다. 실험 결과, 정점과 차원의 수에 상관없이 기본 알고리즘에 비해 5배 이상 빠르면서 약 92%의 정확도를 유지했다. 본 알고리즘은 새로운 유사도 척도를 사용하거나, 높은 정확도를 보장해야 할 경우 효과적으로 사용될 수 있다.

소셜 네트워크 서비스에서의 그래프 마이닝 기법에 관한 조사 (A Survey on Graph Mining in Social Network Service)

  • 이지현;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1270-1271
    • /
    • 2011
  • 소셜 네트워크 서비스는 가트너에서 2011년에 이어 2012년에도 각광받을 기술의 하나로 선정된 만큼 미래 인터넷의 핵심 키워드 중 하나로도 뽑히며, 엔터테인먼트, 검색, 방송, 커머스 등의 여러 가지 서비스와 직접 연결된다. 이러한 소셜 네트워크 서비스 가운데 하이브리드형 서비스는 사용자의 정보를 관리 및 파악하여 사용자가 원하는 제품을 예측하고 추천해주고 있으며, 이를 위해 그래프 마이닝 기술을 적용하고 있다. 하지만 그래프 마이닝 기술은 아직 복잡한 그래프 구조의 데이터에서 정보를 추출하기에 제약사항들이 발생하므로 이에 대하여 많은 연구가 활발히 이루어지고 있다. 이러한 그래프 마이닝 기술을 나아가 더 발전시켜 활용하면 기존의 하이브리드형 서비스에서 사용자의 정보를 파악하여 충성도를 높여줄 뿐 아니라 기업에서의 타켓 마케팅과 원투원 마케팅을 가능하게 해주고 기존 사용자에 대한 교차 판매와 격상판매의 전략들을 도출할 수 있을 것이다.

Text to SPARQL을 위한 지식 증강 프롬프팅 연구 (Study on Knowledge Augmented Prompting for Text to SPARQL)

  • 이연진;남정재;김우영;김우주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.185-189
    • /
    • 2023
  • Text to SPARQL은 지식 그래프 기반 질의응답의 한 형태로 자연어 질문을 지식 그래프 검색 쿼리로 변환하는 태스크이다. SPARQL 쿼리는 지식 그래프의 정보를 기반으로 작성되어야 하기 때문에 기존 언어 모델을 통한 코드 생성방법으로는 잘 동작하지 않는다. 이에 우리는 거대 언어 모델을 활용하여 Text to SPARQL를 해결하기 위해 프롬프트에 지식 그래프의 정보를 증강시켜주는 방법론을 제안한다. 이에 더하여 다국어 정보 활용에 대한 영향을 검증하기 위해 한국어, 영어 각각의 레이블을 교차적으로 실험하였다. 추가로 한국어 Text to SPARQL 실험을 위하여 대표적인 Text to SPARQL 벤치마크 데이터셋 QALD-10을 한국어로 번역하여 공개하였다. 위 데이터를 이용해 지식 증강 프롬프팅의 효과를 실험적으로 입증하였다.

  • PDF

의학용어 비교 검색을 지원하는 SNOMED CT 브라우저 설계 (Design of a SNOMED CT Browser Supporting Comparative Search of Clinical Terminology)

  • 류우석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.418-420
    • /
    • 2015
  • SNOMED CT 브라우저는 SNOMED CT 용어체계에 포함되어 있는 방대한 양의 의학용어들을 검색하고 브라우징하기 위한 검색 시스템이다. 기존의 브라우저는 검색 결과로 나타나는 유사한 용어들을 단순 나열식으로 제시함으로써 적합한 용어 선택에 대한 사용자의 혼란을 야기한다. 본 논문에서는 용어 검색 결과들을 효율적으로 비교 검색하기 위한 새로운 브라우저 시스템을 설계한다. 제안하는 시스템은 검색 결과 용어들 간 직관적인 비교 검색을 위해 용어 검색 모듈, 위상 관계 검색 모듈, 검색 결과 서브-그래프 생성 모듈을 포함하는 특징이 있다.

  • PDF

온톨로지 스키마 추론을 위한 향상된 개념 검색방법 (An Enhanced Concept Search Method for Ontology Schematic Reasoning)

  • 권순현;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권11호
    • /
    • pp.928-935
    • /
    • 2009
  • 온톨로지 스키마 추론은 개념의 정합성을 테스트하고 계층구조를 자동으로 생성해 준다. 이를 위해 개념의 검색과정은 반드시 수행하여야 한다. 온톨로지 스키마 추론은 온톨로지에 정의된 모든 개념들간의 포함관계를 테스트함으로써 수행된다. 이러한 포함관계 테스트 결과는 개념의 완전 그래프 생성여부에 따라 결정되며 이는 추론의 전체적인 성능에 결정적인 영향을 준다. 일반적으로 완전 그래프 생성 과정은 복잡도가 높은 과정으로 알려져 있으며 이는 낮은 추론성능을 유발시키는 원인이 되고 있다. 본 논문에서는 개념들간의 포함관계 테스트시 개념의 향상된 검색방법을 통해 불필요한 포함관계 테스트를 생략함으로써 온톨로지 스키마 추론의 성능을 향상시키는 방법을 제시하고자 한다. 이 향상된 검색방법은 개념의 포함관계 테스트 결과를 정의상 연관된 다른 개념에 전파함으로써 이루어진다.

멀티미디어 상연그래프 질의언어와 대수를 이용한 질의처리방법 (A Query Language for Multimedia Presentation Graphs and Query Processing Techniques with Algebra)

  • 이태경
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.185-198
    • /
    • 2000
  • 최근 폭발적인 증가를 보이고 있는 멀티미디어 자료의 양과 그 자료들을 이용할 수 있는 하드웨어의 발전은 멀티미디어 상연물을 이용하는 여러 응용 분야에 대한 관심을 촉발시키고 있다. 이에 멀티미디어 상연물의 효과적인 이용을 위해서는 멀티미디어 상연물과 DBMS와의 통합이 필요하다. 이 논문에서는 내용(content)에 근거한 상연물 검색과 검색 처리 기술의 문제를 다룬다. 현재 멀티미디어 상연물 제작 도구(authoring tool)들은 멀티미디어 상연물을 상연 그래프(presentation graph)를 이용하여 표현하고 있으며 상연 그래프는 DAG(directed acyclic graph)이다. 각 노드는 같은 타입의 미디어 스트림을 나타내며 에지는 스트림간의 상연 순서와 동기화 (synchronization) 방법을 나타낸다. 각각의 스트럼에 포함된 정보, 이 정보들간의 순서, 그리고 스트럼간의 상연 순서는 상연의 내용을 구성한다. GCalculus/S(GCalculus with Set Operators)는 calculus에 바탕을 둔 검색언어이며 멀티미디어 자료들의 물리적 특정과 내용을 다룰 수 있다. 개개의 노드 안에서의 정보의 변화와 노드 사이의 순서는 시간 연산자(temporal operator) Next, Connected, Until을 이용하여 표현한다. 검색의 처리를 위하여 객체 대수(object algebra)인 O-Algebra를 확장한다.

  • PDF

3차원 영상 검색을 위한 중심축 변환에 의한 그래프 표현 기법 (Graph Representation by Medial Axis Transform Image for 3D Retrieval)

  • 김덕훈;윤일동;이상욱
    • 대한전자공학회논문지SP
    • /
    • 제38권1호
    • /
    • pp.33-42
    • /
    • 2001
  • 최근 거리 데이터와 CAD로부터 생성된 3차원 영상에 대한 관심이 급격하게 증가하여 다양한 3차원 영상 데이터베이스가 구축되고 있다. 원하는 영상 자료를 효과적이면서 고속으로 검색할 수 있는 시스템은 인터넷과 디지털 도서관 분야에서 중요한 문제로 부각되고 있다. 그러나, 3차원 영상 자료의 방대한 크기로 인하여 데이터베이스 관리에 어려움이 있다. 따라서 영상의 효율적 관리와 함께 내용 기반의 검색을 위한 적합한 기술자가 필요하게 된다. 본 논문에서 제안하는 형상 기술자는 3차원 영상에 대한 체적소화(voxelization)를 기반으로 한다. 체적소화된 3차원 영상에 대하여 수학적 형태학에서 파생된 골격화를 수행하고, 골격으로부터 노드(node)와 에지(edge)로 구성된 그래프를 생성한다. 생성된 그래프는 3차원 영상의 기하학적인 정보를 소실하지 않고, 인간의 직관과 유사하여 새로운 현상 기술자로 적합하다. 따라서 제안하는 형상 기술자는 3차원 물체 인식과 압축 그리고 내용 기반의 검색에 유용하게 사용할 수 있다.

  • PDF

제품 설계 정보 재사용을 위한 그래프 기반의 부품 영상 정보와 설계 정보의 병합 (Integration of Component Image Information and Design Information by Graph to Support Product Design Information Reuse)

  • 이형재;양형정;김경윤;김수형;김선희
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.1017-1026
    • /
    • 2006
  • 최근에는 제품 개발의 효율성 증대를 위해서 다양한 분야의 전문가들이 참여하는 분산된 협업적 개발 환경이 필수적으로 인식되고 있으며 이에 따른 제품 설계 정보의 재사용 문제가 새롭게 부각되고 있다. 본 논문에서는 제품 설계 정보의 재사용을 위해 멀티미디어 기기에서 획득된 제품 영상을 부품 단위로 분할하여 속성 관계 그래프를 생성하고 이를 통해 제품 설계 정보를 검색하는 시스템을 제안한다. 본 논문에서 제안한 시스템은 라벨링 방법으로 제품 영상을 분할하고, 각 분할 영역의 속성과 영역간의 관계를 표현하는 속성 관계 그래프를 생성한다. 속성 관계 그래프는 제품 설계 정보를 추가하여 확장함으로써 영상 검색을 통한 제품 설계 정보의 재사용이 가능하다. 본 시스템의 주요 이점은 다음과 같다. 첫째, 주변 장치로부터 쉽게 획득할 수 있는 멀티미디어 영상을 이용하므로 특정 설계 툴에 종속적이지 않다. 둘째, 비율을 이용한 특징 벡터에 의해 다양한 크기의 유사 부품을 포함하는 영상의 검색이 가능하다. 셋째, 분할된 각 부품의 영역에 대한 다양한 영상 정보와 그들의 관계를 적용하기 때문에 검색 능력이 뛰어나다.

일본군 '위안부' 지식그래프: 파편화된 디지털 기록의 연결 (A Knowledge Graph on Japanese "Comfort Women": Interlinking Fragmented Digital Archival Resources)

  • 박하람;김학래
    • 한국기록관리학회지
    • /
    • 제21권3호
    • /
    • pp.61-78
    • /
    • 2021
  • 일본군 '위안부'에 대한 기록은 민간 기관에서 개별적으로 관리하고 있다. 일부 기록은 디지털 아카이브로 구축되어 온라인으로 접근할 수 있다. 그러나, 디지털 아카이브의 기록은 기관에 따라 메타데이터의 구성과 표현 방식이 다르다. 한편, 기록 사이의 관계를 정의할 수 있는 체계가 미흡하기 때문에, 현재 구축된 일본군 '위안부' 기록은 서로 연결되지 않고 파편적인 형식으로 남아있다. 본 연구는 일본군 '위안부' 디지털 기록을 연계하기 위한 지식 모델을 제안하고, 분산화된 디지털 아카이브의 기록을 통합하여 일본군 '위안부' 지식그래프를 구축한다. 일본군 '위안부' 디지털 아카이브의 메타데이터를 분석하여 공통 요소를 도출하고, 표준 어휘를 적용하여 디지털 기록의 다양한 개체와 개체 사이의 관계를 의미적으로 표현한다. 특히, 흩어져 있는 기록을 연계하고 검색하기 위해 수집한 데이터의 정제가 이루어지고, 외부데이터를 활용하여 기록의 맥락 정보를 강화하고 있다. 구축된 지식그래프의 검증은 분산된 기록의 탐색 여부를 측정하는 질의를 통해 수행된다. 검증 결과, 지식그래프는 흩어져 있는 기록을 연계하여 검색할 수 있고, 외부데이터로부터의 강화로 기록의 맥락 정보를 풍부하게 제공하며, 의미 기반의 검색을 통해 사용자의 의도에 맞춘 정확한 검색이 가능하다.

그래프 탐색 기법을 이용한 효율적인 웹 크롤링 방법들 (Effective Web Crawling Orderings from Graph Search Techniques)

  • 김진일;권유진;김진욱;김성렬;박근수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제37권1호
    • /
    • pp.27-34
    • /
    • 2010
  • 웹 크롤러는 웹에서 링크를 따라다니며 웹 페이지들을 자동으로 다운로드하는 프로그램으로 주로 웹 환경을 연구하거나 검색 엔진을 만들기 위해 사용된다. 기존의 연구들에서는 웹 크롤러가 인기 있는 웹 페이지들을 먼저 크롤링 할 수 있도록 몇 가지 방법들이 제안되었으나 그래프 이론 분야에서 연구되어 온 몇몇 그래프 탐색 기법들은 아직 웹 크롤링 방법으로 고려되지 않았다. 이 논문에서는 잘 알려진 너비 우선 탐색, 깊이 우선 탐색 뿐 아니라 사전식 너비 우선 탐색, 사전식 깊이 우선 탐색 및 최대 크기 탐색을 웹 크롤링 방법으로 고려하여 이 중에서 선형적인 시간복잡도를 가지면서도 인기 있는 웹 페이지를 효율적으로 수집할 수 있는 웹 크롤링 방법을 찾는다. 특히 선형 구현이 단순하지 않은 최대 크기 탐색과 사전식 너비 우선 탐색에 대해서는 분할 정제 방법을 이용한 선형 시간 웹 크롤링 방법을 제시한다. 실험 결과는 최대 크기 탐색이 다른 그래프 탐색 방법에 비해 시간 복잡도 및 크롤링 된 페이지들의 질에 있어서 바람직한 성질을 가짐을 보여준다.