• Title/Summary/Keyword: 재순위

Search Result 286, Processing Time 0.034 seconds

Paragraph Re-Ranking and Paragraph Selection Method for Multi-Paragraph Machine Reading Comprehension (다중 지문 기계독해를 위한 단락 재순위화 및 세부 단락 선별 기법)

  • Cho, Sanghyun;Kim, Minho;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.184-187
    • /
    • 2020
  • 다중 지문 기계독해는 질문과 여러 개의 지문을 입력받고 입력된 지문들에서 추출된 정답 중에 하나의 정답을 출력하는 문제이다. 다중 지문 기계독해에서는 정답이 있을 단락을 선택하는 순위화 방법에 따라서 성능이 크게 달라질 수 있다. 본 논문에서는 단락 안에 정답이 있을 확률을 예측하는 단락 재순위화 모델과 선택된 단락에서 서술형 정답을 위한 세부적인 정답의 경계를 예측하는 세부 단락 선별 기법을 제안한다. 단락 순위화 모델 학습의 경우 모델 학습을 위해 각 단락의 출력에 softmax와 cross-entroy를 이용한 손실 값과 sigmoid와 평균 제곱 오차의 손실 값을 함께 학습하고 키워드 매칭을 함께 적용했을 때 KorQuAD 2.0의 개발셋에서 상위 1개 단락, 3개 단락, 5개 단락에서 각각 82.3%, 94.5%, 97.0%의 재현율을 보였다. 세부 단락 선별 모델의 경우 입력된 두 단락을 비교하는 duoBERT를 이용했을 때 KorQuAD 2.0의 개발셋에서 F1 83.0%의 성능을 보였다.

  • PDF

A Cell Loss Constraint Method of Bandwidth Renegotiation for Prioritized MPEG Video Data Transmission in ATM Networks (ATM망에서 우선 순위가 주어진 MPEG 비디오 데이터 전송시 대역폭 재협상을 통한 셀 손실 방지 기법)

  • Yun, Byoung-An;Kim, Eun-Hwan;Jun, Moon-Seog
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.7
    • /
    • pp.1770-1780
    • /
    • 1997
  • Our problem is improvement of image quality because it is inevitable cell loss of image data when traffic congestion occurs. If cells are discarded indiscriminately in transmission of MPEG video data, it occurs severe degradation in quality of service(QOS). In this paper, to solve this problem, we propose two method. The first, we analyze the traffic characteristics of an MPEG encoder and generate high priority and low priority data stream. During network congestion, only the least low priority cells are dropped, and this ensures that the high priority cells are successfully transmitted, which, in turn, guarantees satisfactory QoS. In this case, the prioritization scheme for the encoder assigns components of the data stream to each priority level based on the value of a parameter ${\beta}$. The second, Number of high priority cells are increased when value of ${\beta}$ is large. It occurs the loss of high priority cell in the congestion. To prevent it, this paper is regulated to data stream rate as buffer occupancy with UPC controller. Therefore, encoder's bandwidth can be calculated renegotiation of the encoder and networks. In this paper, the encoder's bandwidth requirements are characterized by a usage parameter control (UPC) set consisting of peak rate, burstness, and sustained rate. An adaptive encoder rate control algorithm at the Networks Interface Card(NIC) computes the necessary UPC parameter to maintain the user specified quality of service. Simulation results are given for a rate-controlled VBR video encoder operating through an ATM network interface which supports dynamic UPC. These results show that dynamic bandwidth renegotiation of prioritized data stream could provided bandwidth saving and significant quality gains which guarantee high priority data stream.

  • PDF

Priority Assignment and Synchronization Technique for Avatar Behavior Composition (아바타 행위 조합을 위한 우선순위 지정 및 동기화 기법)

  • 오재균;김재경;최윤철;임순범
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.577-579
    • /
    • 2004
  • 사이버 공간 활용을 위한 여러 연구 분야 중 아바타 활용 기술 분야 역시 나날이 발전을 하고 있다. 본 논문에서는 이러한 아바타의 행위 표현 및 제어를 효율적으로 하기 위해 다양한 도메인 환경에서 적용할 수 있는 아바타 행위 표현의 계층적인 방식에 대한 간단한 소개, 기존의 연구들을 비교 분석함으로써 이전 연구에서 제시하고 있는 행위 표현 방식에서 제공되지 않고 있는 동시진행 가능한 모션들 간의 우선순위 분야와 모션 간 동기화 문제를 해결할 수 있는 방법에 대해 제안한다. 기존 연구에서 사용되었던 XML 기반의 스크립트 언어를 재사용 함으로써 효용성을 높일 수 있다. 아바타 동작에 대한 행위 우선순위 지정 및 동기화를 통하여 하위레벨에서 정의된 동작들을 조합하여 상위레벨에서 재사용 가능하게 되므로 좀 더 효율적으로 동작의 생성이 가능친지고 하위레벨 스크립트의 재사용성을 높일 수 있다.

  • PDF

Method of Document Retrieval Using Word Embeddings and Disease-Centered Document Clusters (단어 의미 표현과 질병 중심 의학 문서 클러스터 기반 의학 문서 검색 기법)

  • Jo, Seung-Hyeon;Lee, Kyung-Soon
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.51-55
    • /
    • 2016
  • 본 논문에서는 임상 의사 결정 지원을 위한 UMLS와 위키피디아를 이용하여 지식 정보를 추출하고 질병중심 문서 클러스터와 단어 의미 표현을 이용하여 질의 확장 및 문서를 재순위화하는 방법을 제안한다. 질의로는 해당 환자가 겪고 있는 증상들이 주어진다. UMLS와 위키피디아를 사용하여 병명과 병과 관련된 증상, 검사 방법, 치료 방법 정보를 추출하고 의학 인과 관계를 구축한다. 또한, 위키피디아에 나타나는 의학 용어들에 대하여 단어의 효율적인 의미 추정 기법을 이용하여 질병 어휘의 의미 표현 벡터를 구축하고 임상 인과 관계를 이용하여 질병 중심 문서 클러스터를 구축한다. 추출한 의학 정보를 이용하여 질의와 관련된 병명을 추출한다. 이후 질의와 관련된 병명과 단어 의미 표현을 이용하여 확장 질의를 선택한다. 또한, 질병 중심 문서 클러스터를 이용하여 문서 재순위화를 진행한다. 제안 방법의 유효성을 검증하기 위해 TREC Clinical Decision Support(CDS) 2014, 2015 테스트 컬렉션에 대해 비교 평가한다.

  • PDF

Conceptual reranking using single document feedback (단일 문서 피드백을 이용한 개념적인 재순위화)

  • Han, Yong-Jin;Park, Se-Young;Park, Seong-Bae;Lee, Sang-Jo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.276-278
    • /
    • 2012
  • 모바일 환경에서 정보 검색 시, 사용자가 질의를 구체적으로 입력하는 것이 번거로운 문제점이 있다. 본 논문은 모바일 환경에서의 효율적인 검색 성능 향상을 위해 단일 문서 피드백을 이용한 개념적인 재순위화 방법을 제안한다. 사용자는 질의 의도와 관련있는 문서 하나를 시스템에 피드백한다. 제안한 방법은 피드백된 문서와 앞서 검색된 문서들을 위키피디아의 표제어로 표현되는 개념적인 차원으로 맵핑함으로써 개념적인 수준에서 검색 결과를 재순위화한다. 최근 한국어 뉴스 및 블로그를 대상으로 한 실험 결과 키워드 기반 피드백 방법에 비해 제안한 방법이 높은 성능을 보였다.

Performance Control of the Capacitated Re-entrant Line using Genetic Approach (유전자 알고리즘을 이용한 유한용량 재진입 라인 성능 제어)

  • Choi, Jin-Young
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.31 no.4
    • /
    • pp.106-113
    • /
    • 2008
  • 본 논문에서는 유한용량 재진입 생산라인에서의 스케줄링 문제에 대한 유전자적 접근 방법을 제안하였다. 알고리즘에서 사용되는 염색체의 구조는 워크스테이션의 버퍼레벨에 대한 모든 가능한 경우를 고려하여 정의되었으며, 염색체의 각 유전자에는 그에 대응되는 시스템 상태에서 우선 순위를 갖는 작업 단계의 값이 할당되도록 하였다. 또한, 제안된 알고리즘의 구현 방법으로서 워크스테이션의 버퍼와 프로세싱 자원을 할당할 때 작업 간 우선 순위를 고려하는 동시에 각 워크스테이션의 로컬 유휴 상태를 지양하는 우선순위 기반 랜덤화 정책 알고리즘을 제안하였다. 실험을 통하여 제안된 알고리즘의 성능을 평가하였으며, 기존에 무한용량 재진입 생산라인 스케줄링 문제에 많이 이용되었던 휴리스틱과 비교하여 보다 효율적임을 보였다.

Reranking Clusters based on Query Term Position and Context (질의의 위치와 문맥을 반영한 클러스터 기반 재순위화)

  • Jo, Seung-Hyeon;Jang, Gye-Hun;Lee, Kyung-Soon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.471-474
    • /
    • 2010
  • 질의와 질의 주변에 나오는 어휘는 의미적으로 연관되어있다는 가정하에 질의뿐만 아니라 질의 주변에 나오는 문맥 어휘들도 가중치를 높여준다면 검색에 효율을 높일 수 있을 것이다. 본 논문에서는 질의와 질의 주변에 나오는 문맥 어휘들에게 가중치를 주어 질의 어휘의 위치 가중치를 반영한 문서를 표현하고, 위치 가중치가 반영된 문서 벡터들 사이의 유사도를 계산하여 클러스터 기반 재순위화를 하여 성능을 향상시키는 방법을 제안한다. 뉴스 집합인 TREC AP 문서를 이용하여 언어모델, 위치 가중치를 이용한 언어모델, 클러스터 기반 재순위화 모델의 비교실험을 통해 유효성을 검증한다.

Passage Re-ranking Model using N-gram attention between Question and Passage (질문-단락 간 N-gram 주의 집중을 이용한 단락 재순위화 모델)

  • Jang, Youngjin;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.554-558
    • /
    • 2020
  • 최근 사전학습 모델의 발달로 기계독해 시스템 성능이 크게 향상되었다. 하지만 기계독해 시스템은 주어진 단락에서 질문에 대한 정답을 찾기 때문에 단락을 직접 검색해야하는 실제 환경에서의 성능 하락은 불가피하다. 즉, 기계독해 시스템이 오픈 도메인 환경에서 높은 성능을 보이기 위해서는 높은 성능의 검색 모델이 필수적이다. 따라서 본 논문에서는 검색 모델의 성능을 보완해 줄 수 있는 오픈 도메인 기계독해를 위한 단락 재순위화 모델을 제안한다. 제안 모델은 합성곱 신경망을 이용하여 질문과 단락을 구절 단위로 표현했으며, N-gram 구절 사이의 상호 주의 집중을 통해 질문과 단락 사이의 관계를 효과적으로 표현했다. KorQuAD를 기반으로한 실험에서 제안모델은 MRR@10 기준 93.0%, Top@1 Precision 기준 89.4%의 높은 성능을 보였다.

  • PDF

Analysis on the parameters of IPTV VOD access rank function (IPTV 주문형 비디오 시청 순위 함수의 모수에 영향을 끼치는 요인 분석)

  • Yoon, Hyoup-Sang;Lee, Sueng-Jae;Joeng, Sang-Hyoun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.07a
    • /
    • pp.148-149
    • /
    • 2010
  • 최근 널리 보급되고 있는 IPTV의 주요 서비스인 주문형 비디오 서비스의 시청 순위는 Zipf의 법칙을 따른다고 알려져 있으며 이를 기반으로 계층형 네트워크 스토리지 구조로 서비스를 제공하여 네트워크 비용과 스토리지 비용을 절감하고 있다. 그러나, 최근 연구에 의하면 미디어 시청 순위는 stretched exponential 함수에 더 근사함이 알려졌다. 본 연구에서는 국내에서 현재 상용 서비스 중인 대규모 주문형 비디오 서비스의 시청 순위-회수 데이터를 분석하여, 시청 순위로부터 stretched exponential 함수의 모수를 추정하여 시청 순위의 분포함수를 파악하고자 한다. 특히, 콘텐츠 파일 크기, 콘텐츠 파일 전달방식, 콘텐츠 장르 등의 요인과 시청 순위 분포함수의 모수 사이에 상관관계가 있는지 분석하고자 한다.

  • PDF

A Double-Ended Priority Queue with O(1) Insertion Amortized Time (상수 삽입 전이 시간을 가지는 양단 우선순위 큐)

  • Jung, Hae-Jae
    • The KIPS Transactions:PartA
    • /
    • v.16A no.3
    • /
    • pp.217-222
    • /
    • 2009
  • Priority queues can be used in applications such as scheduling, sorting, retrival based on a priority like gene searching, shortest paths computation. This paper proposes a data structure using array representation for double-ended priority queue in which insertion and deletion takes O(1) amortized time and O(logn) time, respectively. To the author's knowledge, all the published array-based data structures for double ended priority queue support O(logn) time insertion and deletion operations.