• 제목/요약/키워드: coverage algorithm

검색결과 366건 처리시간 0.024초

질의 응답 시스템에서 심층적 질의 카테고리의 개념 커버리지에 기반한 의미적 질의 확장 (Semantic Query Expansion based on Concept Coverage of a Deep Question Category in QA systems)

  • 김혜정;강보영;이상조
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.297-303
    • /
    • 2005
  • 질의응답(Question Answering) 시스템은 질의에서 요구하는 정답 유형(Answer type) 및 질의에 사용된 용어를 적용하여 보다 정확한 답을 추출하고자 한다. 그러나 질의에 사용된 용어들이 문서에 그대로 사용되지 않고 같은 의미의 다른 어휘로 출현하기도 하며, 흑은 다른 문법적 정보를 가진 카테고리에 등장하여 정답 추출에 어려움이 따른다. 만약, 질의에서 요구하는 정보유형을 보다 깊게 세분화하고, 세분화된 질의 유형과 개념적으로 유사한 문장을 대상으로 정답 추출을 수행할 수 있다면 보다 정확한 정답을 추출할 수 있을 것이다. 따라서, 본 논문은 심층 질의 카테고리의 개념 커버리지에 기반한 효과적인 의미적 질의 확장 방법론을 제안한다. 질의에서 요구하는 정보 유형을 보다 세분화된 심충 질의 카테고리로 나누고, 이러한 심층 질의 카테고리를 표현하기 위해 동원되는 어휘 집합에 질의 확장을 적용함으로써 정답 추출의 성능을 향상시키고자 하였다. 제안된 시스템의 성능 평가를 위하여, TREC 문서 중 1991년도 WSJ(Wall Street Journal) 42,654건과 TREC-9의 질의를 대상으로 실험한 결과 질의 확장을 수행하지 않는 시스템의 경우 MRR(Mean reciprocal ratio) 측정에서 0.223의 결과를 보인 반면 제안된 시스템의 경우 0.50의 향상된 결과를 보였다.

영어 구문 분석의 효율 개선을 위한 3단계 구문 분석 (Three-Phase English Syntactic Analysis for Improving the Parsing Efficiency)

  • 김성동
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권1호
    • /
    • pp.21-28
    • /
    • 2016
  • 영어 구문 분석기는 영한 기계번역 시스템의 성능에 가장 큰 영향을 미치는 부분이다. 본 논문에서의 영어 구문 분석기는 규칙 기반 영한 기계번역 시스템의 한 부분으로서, 많은 구문 규칙을 구축하고 차트 파싱 기법으로 구문 분석을 수행한다. 구문 규칙의 수가 많기 때문에 구문 분석 과정에서 많은 구조가 생성되는데, 이로 인해 구문 분석 속도가 저하되고 많은 메모리를 필요로 하여 번역의 실용성이 떨어진다. 또한 쉼표를 포함하는 긴 문장들은 구문 분석 복잡도가 매우 높아 구문 분석 시간/공간 효율이 떨어지고 정확한 번역을 생성하기 매우 어렵다. 본 논문에서는 실제 생활에서 나타나는 긴 문장들을 효율적으로 번역하기 위해 문장 분할 방법을 적용한 3단계 구문 분석 방법을 제안한다. 구문 분석의 각 단계는 독립된 구문 규칙들을 적용하여 구문 분석을 수행함으로써 구문 분석의 복잡도를 줄이려 하였다. 이를 위해 구문 규칙을 3가지 부류로 분류하고 이를 이용한 3단계 구문 분석 알고리즘을 고안하였다. 특히 세 번째 부류의 구문 규칙은 쉼표로 구성되는 문장 구조에 대한 규칙으로 구성되는데, 이들 규칙들을 말뭉치의 분석을 통해 획득하는 방법을 제안하여 구문 분석의 적용률을 지속적으로 개선하고자 하였다. 실험을 통해 제안한 방법이 문장 분할만을 적용한 기존 2단계 구문 분석 방법에 비해 유사한 번역 품질을 유지하면서도 시간/공간 효율 면에서 우수함을 확인하였다.

한반도 주변의 해수 고유광특성과 해색 알고리즘의 관계 분석 (An Analysis of the Relationship between Inherent Optical Properties and Ocean Color Algorithms Around the Korean Waters)

  • 민지은;유주형;박영제
    • 대한원격탐사학회지
    • /
    • 제31권5호
    • /
    • pp.473-490
    • /
    • 2015
  • 우리나라 주변을 한 시간 간격으로 관측하고 있는 GOCI의 관측영역 안에는 매우 맑은 대양의 성격을 띠는 동해부터 세계적인 큰 강인 양쯔강 하구의 극심하게 탁한 해역까지 매우 폭 넓은 해수 환경이 포함되어 있다. 따라서 본 연구에서는 대표적인 해수 구성 성분인 식물 플랑크톤, 부유물질, 용존유기물질의 흡광 특성자료를 이용하여 각 해역별 해수 환경의 차이를 상세하게 분석하였다. 이를 위하여 2009 ~ 2014년까지 6년 동안 한반도 주변 해역의 총 959개 정점에서 얻어진 해양 광학 자료 및 해양 환경 자료가 사용되었다. 그 결과 동해, 남해, 동중국해, 황해 외해역은 DOM과 식물 플랑크톤의 기여도가 높은 비슷한 분포 패턴을 나타냈고, 이와는 달리 목포 및 경기만 연안 해역은 부유물질과 용존유기물질의 기여도가 높은 분포 패턴을 보였다. 클로로필 및 부유물질 알고리즘의 정확도를 검증해 본 결과, 클로로필은 주로 과대 추정되고, 부유물질은 주로 과소 추정되는 경향을 보였다. 큰 오차의 경우 클로로필, 부유물질, 용존유기물질 중에서 부유물질에 의해 가장 많은 영향을 받았으며, $a_{SPM}$의 기여도가 60% 이상으로 높을 때 연안 해역에서 나타났다.

결측되었거나 구간중도절단된 중간사건을 가진 준경쟁적위험 자료에 대한 가산위험모형 (Additive hazards models for interval-censored semi-competing risks data with missing intermediate events)

  • 김자연;김진흠
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.539-553
    • /
    • 2017
  • 본 논문에서는 사망과 같은 종말사건의 발생 유무는 알고 있지만 치매 발병과 같은 중간사건이 구간중도절단 되었거나 연구 기간 도중에 추적이 끊겨 결측된 준경쟁적위험 자료에 대해 다중상태모형을 적용하여 모수를 추정하는 방법을 제안하였다. 이를 위해 본 논문에서는 상태 간의 전이강도는 로그정규 프레일티를 랜덤효과로 가진 Lin과 Ying(1994)의 가산위험모형을 따른다고 가정하였다. 다섯 가지 상태를 가진 다중상태모형에서 가능한 여섯 가지 경로별로 조건부우도를 정의하였고, 주변우도를 구하기 위해 조정중요표본추출법을 적용하였으며 반복유사뉴튼 방법으로 최적해를 구하였다. 소표본 모의실험을 통해 모수의 95% 신뢰구간 포함률이 명목값에 얼마나 가까운지 살펴보았으며, 제안한 모형을 Persones $Ag{\acute{e}}es$ Quid (PAQUID) 자료 (Helmer 등, 2001)에 적용하고 그 결과를 해석하였다.

Teaklite DSP Core 를 이용한 이동통신 단말기용 음향반향제거기의 실시간 구현 (Real-Time Implementation of Acoustic Echo Canceller for Mobile Handset Using TeakLite DSP Core)

  • 권홍석;김시호;장병욱;배건성
    • 대한전자공학회논문지SP
    • /
    • 제39권2호
    • /
    • pp.128-136
    • /
    • 2002
  • 본 논문에서는 이동통신 단말기의 음성부호화기에 탑재할 수 있도록 TeakLite DSP Core를 이용한 음향반향제거기(Acoustic Echo Canceller)를 실시간으로 구현하였다. 음성부호화기에서 음향반향제거기가 사용할 수 있는 연산량의 제한때문에 적응필터는 NLMS(Normalized Least Mean Square) 알고리즘을 이용한 FIR 필터를 사용하였다. 먼저 음향반향제거기를 부동소수점 C-언어로 구현한 다음 고정소수점 시뮬레이션을 통하여 고정소수점 연산으로 바꾸었다. 그리고 고정소수점 연산 결과를 기반으로 어셈블리 언어로 프로그램을 작성하고 최적화 과정을 거쳐 실시간으로 동작하도록 하였다. 최종적으로 구현된 반향제거기는 프로그램 메모리가 624 words이고 데이터 메모리는 811 words이었다. 샘플링 주파수를 8 ㎑로 하였을 때, 32 msec의 반향경로 지연시간에 해당되는 256 차수의 필터를 이용한 경우에는 14.12 MIPS의 연산량을, 16 msec의 반향경로 지연시간에 해당되는 128 차수의 필터를 이용한 경우에는 9.00 MIPS의 연산량을 필요로 하였다.

Identification of copy number variations using high density whole-genome single nucleotide polymorphism markers in Chinese Dongxiang spotted pigs

  • Wang, Chengbin;Chen, Hao;Wang, Xiaopeng;Wu, Zhongping;Liu, Weiwei;Guo, Yuanmei;Ren, Jun;Ding, Nengshui
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제32권12호
    • /
    • pp.1809-1815
    • /
    • 2019
  • Objective: Copy number variations (CNVs) are a major source of genetic diversity complementary to single nucleotide polymorphism (SNP) in animals. The aim of the study was to perform a comprehensive genomic analysis of CNVs based on high density whole-genome SNP markers in Chinese Dongxiang spotted pigs. Methods: We used customized Affymetrix Axiom Pig1.4M array plates containing 1.4 million SNPs and the PennCNV algorithm to identify porcine CNVs on autosomes in Chinese Dongxiang spotted pigs. Then, the next generation sequence data was used to confirm the detected CNVs. Next, functional analysis was performed for gene contents in copy number variation regions (CNVRs). In addition, we compared the identified CNVRs with those reported ones and quantitative trait loci (QTL) in the pig QTL database. Results: We identified 871 putative CNVs belonging to 2,221 CNVRs on 17 autosomes. We further discarded CNVRs that were detected only in one individual, leaving us 166 CNVRs in total. The 166 CNVRs ranged from 2.89 kb to 617.53 kb with a mean value of 93.65 kb and a genome coverage of 15.55 Mb, corresponding to 0.58% of the pig genome. A total of 119 (71.69%) of the identified CNVRs were confirmed by next generation sequence data. Moreover, functional annotation showed that these CNVRs are involved in a variety of molecular functions. More than half (56.63%) of the CNVRs (n = 94) have been reported in previous studies, while 72 CNVRs are reported for the first time. In addition, 162 (97.59%) CNVRs were found to overlap with 2,765 previously reported QTLs affecting 378 phenotypic traits. Conclusion: The findings improve the catalog of pig CNVs and provide insights and novel molecular markers for further genetic analyses of Chinese indigenous pigs.

극지 해양환경 관측 및 고위도 해색 검보정을 위한 초분광 HyperSAS 자료구축 (HyperSAS Data for Polar Ocean Environments Observation and Ocean Color Validation)

  • 이성재;김현철
    • 대한원격탐사학회지
    • /
    • 제34권6_2호
    • /
    • pp.1203-1213
    • /
    • 2018
  • 북극해 및 남극해는 접근이 어려운 지역으로 해양환경 모니터링을 위해 원격탐사 기술을 이용한 관측이 효과적이다. 원격탐사 플랫폼인 인공위성, 무인기와 선박 등에 관측센서를 장착하여 연구지역의 환경변화를 모니터링하고 있지만 극지역의 다양한 환경에서는 시계열자료 및 광범위한 데이터가 필요하다. 특히 고위도 지역에서는 낮은 태양고도의 영향으로 광학원격탐사를 적용하기는 쉽지않다. 본 논문에서는 2010년도 부터 극지연구소 쇄빙연구선 아라온호에 초분광계 HyperSAS(Satlantic inc.)를 설치하여 연구항해 및 이동항해 동안 해수의 분광학적 정보를 연속적으로 획득하고, 극지 해색 원격탐사자료 성능개선을 위해 현장에서 해수샘플을 채수하며 수행하고 있는 연구를 소개한다. 해수 상부의 반사도와 현장 해수샘플링은 2010년부터 연속적으로 획득하고 있어 동일 지역에 대한 반사도의 시계열 변화를 모니터링할 수 있다. 또한 고위도에서부터 저위도까지 연속적으로 관측하여 위도별 반사도 값의 연속 변화를 파악할 수 있다. 본 논문에서 취득한 자료는 극지역에서 남극해, 북극해 해수의 반사도가 어떻게 변화하는지 이해하고, 반사도를 통한 엽록소, 부유물질 등의 다양한 인자를 추정하는 알고리즘 개발에 활용될 것이다.

Comparison of Dosimetrical and Radiobiological Parameters on Three VMAT Techniques for Left-Sided Breast Cancer

  • Kang, Seong-Hee;Chung, Jin-Beom;Kim, Kyung-Hyeon;Kang, Sang-Won;Eom, Keun-Yong;Song, Changhoon;Kim, In-Ah;Kim, Jae-Sung
    • 한국의학물리학회지:의학물리
    • /
    • 제30권1호
    • /
    • pp.7-13
    • /
    • 2019
  • Purpose: To compare the dosimetrical and radiobiological parameters among various volumetric modulated arc therapy (VMAT) techniques using restricted and continuous arc beams for left-sided breast cancer. Materials and Methods: Ten patients with left-sided breast cancer without regional nodes were retrospectively selected and prescribed the dose of 42.6 Gy in 16 fractions on the planning target volume (PTV). For each patient, three plans were generated using the $Eclipse^{TM}$ system (Varian Medical System, Palo Alto, CA) with one partial arc 1pVMAT, two partial arcs 2pVMAT, and two tangential arcs 2tVMAT. All plans were calculated through anisotropic analytic algorithm and photon optimizer with 6 MV photon beam of $VitalBEAM^{TM}$. The same dose objectives for each plan were used to achieve a fair comparison during optimization. Results: For PTV, dosimetrical parameters such as Homogeneity index, conformity index, and conformal number were superior in 2pVMAT than those in both techniques. $V_{95%}$, which indicates PTV coverage, was 91.86%, 96.60%, and 96.65% for 1pVMAT, 2pVMAT, and 2tVMAT, respectively. In most organs at risk (OARs), 2pVMAT significantly reduced the delivered doses compared with the other techniques, excluding the doses to contralateral lung. For the analysis of radiobiological parameters, a significant difference in normal tissue complication probability was observed in ipsilateral lung while no difference was observed in the other OARs. Conclusions: Our study showed that 2pVMAT had better plan quality and normal tissue sparing than 1pVMAT and 2tVMAT but not for all parameters. Therefore, 2pVMAT could be considered the priority choice for the treatment planning for left breast cancer.

소형민수헬기 능동진동제어시스템 개발 (Development and Verification of Active Vibration Control System for Helicopter)

  • 김남조;곽동일;강우람;황유상;김도형;김찬동;이기진;소희섭
    • 한국항공우주학회지
    • /
    • 제50권3호
    • /
    • pp.181-192
    • /
    • 2022
  • 헬기의 능동진동제어시스템(AVCS)은 주로터로부터 발생되는 진동을 제어하며, 수동형 진동저감장치 대비 저중량으로 우수한 진동저감 성능을 발휘한다. 본 논문에서는 FxLMS 알고리즘을 기반으로 타코미터 및 가속도 센서 신호를 통해 연산된 제어명령을 하중발생기(CFG)로 전달하여 소형민수헬기의 진동을 제어하는 소프트웨어 개발 및 검증 내용을 제시하였다. DO-178C /DO-331 표준에 따라 모델 기반 설계 기법을 통해 진동제어 소프트웨어를 개발하였으며, PILS 및 HILS 환경에서 실시간 작동 성능을 평가하였다. 특히, PILS 환경에서는 LDRA 기반 검증 커버리지를 통해 소프트웨어의 신뢰성을 향상시켰다. AVCS를 소형민수헬기에 적용하기 위해 지상/비행시험을 통해 대상 헬기 동적응답특성 모델을 획득하였다. 이를 기반으로 시스템 최적화 분석 및 비행시험을 통해 최적 성능을 발휘하는 AVCS 형상을 결정하고, STC 인증을 획득하였다.

머신러닝 알고리즘을 이용한 포유류 종 풍부도 매핑 구축 연구 (Mapping Mammalian Species Richness Using a Machine Learning Algorithm)

  • 김지영;이동근;김은섭;최지영;전윤호
    • 환경영향평가
    • /
    • 제33권2호
    • /
    • pp.53-63
    • /
    • 2024
  • 생물다양성은 환경영향평가 제도의 목표에 중요한 부문으로, 개발대상지 입지 선정, 주변 환경 파악 및 교란으로 인한 생물종 영향 등에서 활용되고 있다. 환경영향평가 분야에서 새로운 기술과 모델을 활용하여 생물다양성을 보다 정확하게 평가하고 예측하는 방안에 대한 연구가 많이 진행되고 있다. 비록 현장, 문헌조사를 통한 데이터를 바탕으로 종 풍부도 지수를 평가하고 있으나, 현장 데이터는 시·공간적으로 미흡하므로 고해상도의 종 풍부도 매핑을 통한 기초자료를 활용함으로서, 모니터링 실효성 문제 해결이 필요하다. 따라서 본 연구에서는 제4차 전국자연환경조사 데이터와 환경변수를 바탕으로 Random forest 모델을 활용하여 종 분포모형을 개발하였다. 해당 모델은 24종의 포유류 종 분포 매핑 결과를 species richness index를 활용하여 100m 해상도의 종 풍부도 매핑 결과를 도출하였다. 연구 결과, 종 분포모형은 평균 0.82의 AUC값으로 우수한 예측 정확도를 보였다. 또한, 전국자연환경조사 데이터와 비교결과, 고 해상도의 종 풍부도 매핑 결과의 종 풍부도 분포는 정규분포의 형태를 가지고 있어 환경영향평가에서의 기초자료로 사용함에 있어 신뢰성이 높다. 본 연구의 분석결과는 추후 도시개발과 사업을 함에 있어 생물다양성 평가, 서식지 보전 등에 새로운 참고자료로 활용될 수 있을 것으로 사료된다.