• 제목/요약/키워드: 확장 정보

검색결과 9,262건 처리시간 0.041초

롱테일 질의 확장을 위한 추출 및 생성 기반 모델 (Long-tail Query Expansion using Extractive and Generative Methods)

  • 김래선;김성순;장헌석;박석원;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.267-273
    • /
    • 2020
  • 검색 엔진에 입력되는 질의 중 입력 빈도는 낮지만 상대적으로 길이가 긴 질의를 롱테일 질의라고 일컫는다. 롱테일 질의가 전체 검색 로그에서 차지하는 비중은 높은 반면, 그 형태가 매우 다양하고 검색 의도가 상세하며 개별 질의의 양은 충분하지 않은 경우가 많기 때문에 해당 질의에 대한 적절한 검색어를 추천하는 것은 어려운 문제다. 본 논문에서는 롱테일 질의 입력 시 적절한 검색어 추천을 제공하기 위하여 질의-문서 클릭 정보를 활용한 추출기반 모델 및 Seq2seq와 GPT-2 기반 생성모델을 활용한 질의 확장 방법론을 제안한다. 실험 및 결과 분석을 통하여 제안 방법이 기존에 대응하지 못했던 롱테일 질의를 자연스럽게 확장할 수 있음을 보였다. 본 연구 결과를 실제 서비스에 접목함으로써 사용자의 검색 편리성을 증대하는 동시에, 언어 모델링 기반 질의 확장에 대한 가능성을 확인하였다.

  • PDF

의미적 연결 관계에 기반한 전자 카탈로그에서의 확장된 어휘 인덱스 구축 및 이를 이용한 검색 성능 향상 기법 (Construct ion of Keyword Index and Improved Search Methods for e-Catalogs Eased on Semantic Relationship)

  • 이동주;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.67-69
    • /
    • 2005
  • 본 논문에서는 기 구축된 전자 카탈로그를 의미적 연결 관계에 기초한 확장된 전자 카탈로그로 변환하는 방법을 제안한다. 이를 통해 구축된 확장된 전자 카탈로그에서 의미적 태깅에 의한 확장된 어휘 인덱스 구축 방안과, 이를 이용한 검색 성능 향상 기법을 제안한다. 기존의 전자 카탈로그는 상품 정보가 분류별로 생성된 테이블에 저장되고 저장된 테이블로부터 생성된 키워드 인덱스로부터 검색이 이루어 졌다. 이러한 검색은 상품이 가지는 정보를 데이터베이스에 구축된 테이블에만 한정하게 되어 전자 카탈로그에 포함된 상품이나 분류간의 의미적 연결 관계들을 충분히 이용하지 못하였다 전자 카탈로그에 내재된 의미적 요소를 충분히 활용하기 위해서는 전자 카탈로그를 의미적 연결 관계에 기초한 모델로 구성할 필요가 있다. 본 논문에서는 의미적 모델 기반 전자 카탈로그 시스템으로의 전환 과정을 XML형태의 명세를 이용해 반자동적으로 전환할 수 있는 툴을 구현하며, 단순 키워드 어휘 인덱스 구축이 아닌, 어휘 인덱스의 의미적 확장을 제안하고, 이를 위한 태그 요소로써 어휘에 대한 형태소 분석 결과, 수치 환산 및 확장 요소, 속성간의 도메인 정보 등을 제시하였다. 이를 기반으로 최적의 검색 결과를 얻어 내도록 하는 인접도 평가 함수에 적용하는 방법을 제시한다.

  • PDF

내부 버퍼가 있는 확장 배년 네트워크의 성능 분석 (Performance of Dilated Banyan Networks with Internal Buffers)

  • 송효정;권보섭;윤현수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권5호
    • /
    • pp.595-601
    • /
    • 1999
  • 기본 배년 네트워크의 내부 링크를 확장계수배만큼 확장한 확장 배년 네트워크는 기존 병렬처리 컴퓨터나 ATM 스위칭 시스템을 위한 효율적인 통신하부구조로서 여겨져왔다. 본 논문에서는 특히 각 스위치 소자 내부 버퍼가 있는 확장 배년 네트워크의 성능 분석 모델을 마코프 체인에 기초하여 제안한다. 제안한 분석모델에 의해 도출된 네트워크 지연시간과 정규처리율의 값을 모의실험결과와 비교하고, 네트워크 부하가 높고 확장계수가 작은 경우를 제외하고는 두 결과값이 항상 일치함을 보인다. 이러한 확장 배년 네트워크는 스위치의 크기와 관계없이 확장 계수가 3 이상이면 이상적인 처리율과 지연시간을 나타낸다.

무선 인터넷 프록시 서버 클러스터를 위한 동적 해싱 기법 (Dynamic Hashing Method for A Wireless Internet Proxy Server Cluster)

  • 곽후근;정규식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.526-531
    • /
    • 2006
  • 무선 인터넷 프록시 서버 클러스터는 성능 및 저장 공간의 확장성이 보장되어야 한다. 일반적으로 사용되는 RR 스케줄링의 경우 성능의 확장성은 보장되지만, 요청 URL 데이터의 중복 저장으로 인해 저장 공간의 확장성이 없는 단점을 가진다. 또한 저장 공간의 확장성을 위해 많이 사용되는 해싱 스케줄링의 경우, 요청 URL이 캐시 서버에 고정되어 있어 사용자의 요청 패턴 혹은 Hot-Spot 시에 성능의 확장성이 없는 단점을 가진다. 이에 본 논문에서는 성능 및 저장 공간의 확장성을 보장하는 새로운 동적 해싱 기법을 제안한다. 제안된 동적 해싱 기법은 캐시 서버의 부하 상태에 따라 요청 URL을 캐시 서버들 사이로 이동함으로써 사용자의 요청 패턴 혹은 Hot-Spot 시에 성능의 확장성을 보장한다. 제안된 방법은 16대의 컴퓨터를 사용하여 실험을 수행하였고, 실험 결과를 통해 제안된 방법이 기존 방법에 비해 성능 및 저장 공간의 확장성을 보장함을 확인하였다.

  • PDF

RTP/RTCP를 위한 확장성 있는 피드백 제어 기법 (A Scalable Feedback Control Technique for RTP/RTCP)

  • 모수정;안종석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.477-479
    • /
    • 1998
  • 인터넷상에서의 다자간 회의는 수천명의 참가하는 대규모의 회의가 될 수 있으므로 다자간 회의 시스템에서는 확장성이 중요하다. 현재의 인터넷상에서의 다자간 회의 시스템은 대부분 RTP/RTCP를 이용하는데. RTCP를 이용한 피드백 정보 전송의 빈도 수와 전송 시간의 동기화 현상이 다자간 회의 시스템의 확장성에 큰 영향을 준다. 즉, 세션 참가자 수가 증가함에 따라 네트워크에 전송되는 RTCP 패킷의 숫자가 기하급수적으로 증가하게 된다. 피드백 정보의 전송 빈도 수 감소와 동기화 현상을 방지하기 위해 도입한 무작위 지연기법은 너무 단순하여 수많은 참가자들이 동시에 피드백 정보를 교환할 때에 피드백 정보 전송시간의 동기화 현상을 피하지 못해 네트워크에 혼잡 상태를 유발할 수 있다. 이러한 혼잡을 예방하기 위한 기존의 RTP/RTCP 확장 기법의 피드백 정보 전송지연은 송신자가 수신자의네트워크 상태에 따라 효율적으로 전송을 제어할 수 없게 한다. 본 논문에서는 RTP/RTCP 확장성을 증가시키는 기존의 기법들의 성능을 평가하고, 확장성 증가와 동시에 성능이 향상된 RTP/RTCP 확장 기법을 제안한다. 본 논문에서는 확장성 증가와 피드백 지연 정도를 줄이기 위해 빠른 제고 기법을 제안한다. 빠른 재고 기법은 두가지 세부 기법으로 나누어지는데, 첫째는 네트워크의 상태의 변화에 따라 RTCP피드백 정보의 전송지연 정도를 조절하는 것이고, 둘째는 무작위 지연을 선택적으로 조정하려 피드백 정보를 오랜 기간 동안에 보내지 못한 참가자에게 우선권을 주는 것이다. 본 논문에서는 시뮬레이션을 통해 제안된 확장성 기법을 이용할 때에 기존 방식에 비해 거의 비슷한 확장성을 보이면서도 초기 RTCP패킷 전송지연이 50%정도 감소함을 보여준다.구현되고 있다.팔일 전송 기법을 각각 제시하고 실험을 통해 이들의 특성을 비교분석하였다.미에서 uronic acid 함량이 두 배 이상으로 나타났다. 흑미의 uronic acid 함량이 가장 많이 용출된 분획은 sodium hydroxide 부분으로서 hemicellulose구조가 polyuronic acid의 형태인 것으로 사료된다. 추출획분의 구성단당은 여러 곡물연구의 보고와 유사하게 glucose, arabinose, xylose 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의 임신 기간에, 출산시체중(出産時體重) $3.50{\sim}3.99kg$사이의 아이에서 그 주산기사망률(周産基死亡率)이 각각 가장 낮았다. 2. 사산(死産)과 초생아사망(初生兒死亡)을 구분(區分)하여 고려해

  • PDF

타원곡선에서 스칼라 곱의 고속연산 (A fast scalar multiplication on elliptic curves)

  • 박영호;한동국;오상호;이상진;임종인;주학수
    • 정보보호학회논문지
    • /
    • 제12권2호
    • /
    • pp.3-10
    • /
    • 2002
  • Koblitz 타원곡선에서 스칼라 곱을 효율적으로 구현하기 위하여 프로베니우스 자기준동형 (Frobenius endomorphism)이 유용하게 사용된다. 스칼라 곱 연산시 스칼라를 이진 전개하는 대신에 프로베니우스 확장을 사용하여 고속연산을 가능하게 할 수 있으며 따라서 연산의 속도는 확장길이와 밀접한 관계가 있다. 본 논문은 스칼라의 프로베니우스 확장길이를 줄임으로써 스칼라 곱의 고속연산을 가능하게 하는 새로운 방법을 제안한다. 타원곡선의 위수를 노름(Norm)으로 갖는 원소대신 큰 소수 위수를 노름으로 갖는 원소를 사용하여 프로베니우스 확장길이를 최적화시키는 이 방법은 Solinas, Smart가 제안한 방법보다 프로베니우스 확장길이를 더 감소시킬 수 있다.

Text Embedded JPEG을 이용한 Image Retrieval System의 설계 및 구현 (Design and Implementation of Image Retrieval System using Text Embedded JPEG)

  • 천시영;곽미라;조동섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.99-102
    • /
    • 2003
  • 본 논문에서는 JPEG 이미지파일을 효율적으로 검색하기 위해서 확장된 JPEG파일의 포맷을 제안하고자 한다. 확장된 JPEG 파일의 포맷 안에는 JPEG 파일을 검색할 때에 사용될 키워드에 대한 설명, 이미지가 만들어진 날짜, 만든 이, 해상도와 같은 이미지에 대한 정보가 들어가게 된다. 이렇게 확장된 포맷을 어떻게 검색에 이용하는지 보이기 위해서 검색 어플리케이션을 설계하였다. 이 어플리케이션은 사용자가 검색 시에 찾고자 하는 이미지의 정보 값들을 지정해 줌으로써 자시의 의도에 적합한 이미지를 보다 정확하게 찾을 수 있게 된다. 피리고 이렇게 찾아진 이미지들은 여러 이미지 정보값들에 따라 다양한 방식으로 정렬되어 보여 지도록 하였다. 또한 이렇게 확장된 JPEG 파일포맷에 사용자가 접근하여 정보를 변경하거나 추가할 수 있는 인터페이스도 제공하도록 하였다.

  • PDF

동사 레벨의 사용자 관심사 이해를 위한 오픈 디렉토리 프로젝트 확장 기법 (Open Directory Project Extension Scheme to Understand Verb-level User Interests)

  • 소슬기;정다운;류병걸;이상근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1258-1259
    • /
    • 2011
  • 개인화 서비스를 효과적으로 제공하기 위하여 사용자의 관심사를 이해하는 것은 매우 중요하다. 최근 많은 연구들이 사용자의 관심사를 이해하기 위하여 오픈 디렉토리 프로젝트를 이용하여 그 관심사를 주제별로 분류하는 방법을 제안하였다. 본 논문에서는 사용자의 관심사를 더욱 정확하게 이해하기 위하여 명사로 표현되어 있는 오픈 디렉토리 프로젝트를 동사 레벨로 확장하는 기법을 제안한다. 또한 실험 결과를 통하여 제안된 기법이 디렉토리와 연관된 동사를 효과적으로 확장하였음을 입증한다. 확장된 오픈 디렉토리 프로젝트는 사용자의 관심사를 동사 레벨로 이해하도록 함으로써 다양한 개인화 서비스에 활용될 것이다.

선형중심 객체 관리를 위한 확장된 IFC 기반 철도 궤도부 정보모델링 방안 (The Information Modeling Method based on Extended IFC for Alignment-based Objects of Railway Track)

  • 권태호;박상일;서경완;이상호
    • 한국전산구조공학회논문집
    • /
    • 제31권6호
    • /
    • pp.339-346
    • /
    • 2018
  • 건축물을 중심으로 개발된 데이터 스키마인 Industry Foundation Class(IFC)를 토목구조물에 적용하기 위하여 IFC 요소를 확장하는 노력이 진행되고 있지만, BIM소프트웨어에서 확장 IFC 기반의 정보모델을 생성하는 방법이 충분하지 않아 어려움이 따른다. 본 연구에서는 정보관리가 가능한 확장 IFC 기반의 철도 궤도부 정보모델을 생성하기 위하여 독립적인 선형중심의 철도 궤도부 요소모델을 생성하고, 생성된 모델을 기반으로 확장 IFC 기반의 모델을 생성하는 방법론을 제시하였다. 이를 위하여 첫째, 철도 궤도부 요소를 연속적 구조물과 비연속적 구조물로 분류하였다. 연속적 구조물은 선형 기반 소프트웨어에서 생성하였고 이산화된 선형정보 연계를 통해 비연속 구조물을 독립적인 객체로 생성하고 이들을 통합하여 철도 궤도부 정보모델을 생성하였다. 둘째, 철도 궤도부의 정보관리를 위한 분류체계 및 확장 IFC 스키마를 제시하였다. 마지막으로 속성정보와 User-interface를 활용하여 객체의 의미정보를 식별하여 확장 IFC 요소와 매핑하였다. 제시한 방법론을 통하여 오송 철도종합시험선로를 대상으로 정보관리가 가능한 확장 IFC 기반의 정보모델을 생성됨을 확인하고 실용성을 검증하였다.

의미 기반의 질의 분석 및 확장 (Question Analysis and Expansion based on Semantics)

  • 신승은;박희근;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제7권7호
    • /
    • pp.50-59
    • /
    • 2007
  • 본 논문에서는 효율적인 정보검색을 위한 의미 기반의 질의 분석 및 확장을 제안한다. 기존의 정보검색 시스템들은 사용자 질의로 자연언어 질의를 허용하고 있지만 단순히 명사 단어의 색인어를 사용자 질의로부터 추출하여 정보검색에 활용하기 때문에 사용자의 질의 의도를 반영한 정보검색을 하지 못한다. 이러한 문제점을 해결하기 위해서 의미 기반 질의 분석 및 확장은 사용자의 질의를 의미적으로 분석하여, 질의유형을 결정하고 의미 자질들을 추출한다. 추출된 의미 자질들과 정답을 표현하기 위해 사용되는 구문구조를 이용하여 사용자 질의를 확장한다. 또한 확장된 질의를 이용하여 정답을 포함하는 관련문서들을 정보검색 결과의 상위에 랭크시킬 수 있는 방법을 제시한다. 비교적 짧지만 사용자의 질의 의도를 충분히 표현하고 있는 자연언어 질의에 대한 의미 기반의 질의 분석 및 확장을 통해 정보검색의 정확률을 향상시킬 수 있음을 보였다.