• 제목/요약/키워드: 정렬문제

검색결과 295건 처리시간 0.029초

다중 지역 정렬을 위한 알고리즘 (An Algorithm for multiple local alignment)

  • 장석봉;이계성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.2337-2340
    • /
    • 2002
  • 본 연구는 생물정보학(Bioinformatics)의 가장 기초적인 분야중 하나인, 새롭게 밝혀진 유전자 서열과 이미 밝혀진 유전자 서열 사이의 유사성(similarity)이나 상동성(homology)을 찾기 위한 방법에 대한 연구 중 지역 서열정렬로 사용하는 알고리즘인 Smith-Waterman 알고리즘이 갖고 있는 문제를 파악한다. 긴 서열에 대한 선호를 막고 대신 부분적인 지역 정렬을 다수 개 찾아 정렬시키는 알고리즘을 제안하기로 한다.

  • PDF

문장 길이와 단어 정렬에 기반한 한-영 문장 정렬 (Korean-English Sentence Alignment Based on Sentence Length and Word Alignment)

  • 임재수;서희철;이상주;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.302-309
    • /
    • 2001
  • 말뭉치를 통한 통계적인 자연 언어 처리에 관한 연구가 다국어 처리 분야에서도 활발히 진행되고 있는 가운데, 본 논문에서는 병렬 말뭉치 구축 및 활용의 기본이 되는 문장 정렬을 위한 효과적인 방법을 제안한다. 먼저, 기존의 문장 길이를 이용한 방법을 한-영 문장 정렬에 적용해 보고, 길이 정보만을 이용했을 때의 한계점을 지적한다. 그리고, 사전과 품사 대응 확률을 이용한 단어 정렬을 통하여, 길이 기반의 정렬 방식이 갖는 문제점을 보완할 수 있는 방법을 제시한다. 실험을 통하여 제안한 방법이 길이에 기반한 방법에 비하여 높은 성능을 나타냄을 알 수 있었다. 또한 한-영 문장 정렬에의 어휘 정보 활용에 있어서 문제가 될 수 있는 요소가 어떤 것들이 있는지 알아본다.

  • PDF

지문법과 서열정렬법을 결합한 다단계 정렬 방법의 문서 유사도 비교 (A method for comparing documents using fingerprinting and sequence alignment.)

  • 서종규;옥창석;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.576-579
    • /
    • 2012
  • 문서유사도를 비교하는 방법은 지문법과 서열 정렬법이 널리 알려져 있다. 지문법은 계산속도가 빠른 대신 정확도가 떨어지며, 서열정렬법은 계산속도가 느린 대신 정확도가 높다. 다단계 정렬은 두 방법의 비중을 조절하여 문서 유사도를 비교할 수 있는 방법으로, 각 방법의 장점을 얻으면서 단점을 보완하도록 고안되었다[1]. 이 논문에서는 다단계 정렬방법에 대해 설명하고, 다단계정렬 방법에서 발생 가능한 단편화 문제를 제거하여 정확도를 향상시키는 방법에 대해 소개한다.

음성인식과 변경된 동적계획법을 이용한 VOD 콘텐트와 자막의 동기화 (Synchronization of VOD Content and Captions Using Speech Recognition and Modified Dynamic Programming)

  • 오주현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.131-134
    • /
    • 2021
  • 지상파 방송에서는 청각장애인을 위해 폐쇄자막(closed caption) 서비스가 제공되고 있지만, 이를 저장하여 VOD 서비스 등에 제공하고자 할 때는 영상과의 비동기화(desynchronization) 문제로 인해 활용할 수 없는 문제가 있다. 본 논문에서는 이를 해결하기 위해 자동 음성인식(automatic speech recognition)과, 자막 동기화 문제에 맞게 변경된 동적계획법(modified dynamic programming)을 이용하는 방법을 제안한다. 문자열 정렬에서 삽입과 삭제 등 간격(gap)의 발생을 제어하는 제약조건과 그에 따른 점수 구조를 적용함으로써 문자열 정렬 성능을 개선한다. 또한 정렬된 폐쇄자막과 음성인식 문자열로부터 시간 동기정보를 복원하고 동기화된 자막을 생성하는 방법을 제안한다. 실제 TV 프로그램과 자막에 적용하여 기존 방법에 비해 성능의 향상이 있음을 확인하였다.

  • PDF

임의 추출 분할 방식을 이용한 동적 문제 출제 시스템 (A System to Generate Dynamic Test Using a Random Sampling Division Method)

  • 원대희;강태호;김원진;방훈;이재영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.592-594
    • /
    • 2001
  • 원격 교육에서 시간과 장소에 제한을 받지 않도록 하기 위해서 비슷한 난이도의 문제를 출제할 수 있는 동적 문제 출제시스템이 필요하다. 이 시스템은 웹 서버에서 문제를 임의 추출하고, 추출된 문제를 임의 정렬하여, 정렬된 문제를 출력하는 방법을 사용하였다. 이 방법은 서버의 부하를 가중시켜 실행시간을 증가시키는 문제점이 있다. 이러한 문제점을 해결하기 위해서 임의 추출 기능들을 데이터베이스 서버, 웹 서버, 클라이언트로 분할하여 실행시간을 단축시키는 시스템을 제안하고 구현하였다.

  • PDF

전도와 전치 연산을 사용하여 정렬하는 빠르고 간단한 알고리즘 (Fast and simple algorithm for sorting by reversals and transpositions)

  • 한보형;박근수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.674-676
    • /
    • 2000
  • 최근 들어 계산분자생물학 분야에서 문자열 알고리즘과 관련된 유전자 재배열 문제가 많은 관심을 끌고 있다. 특히 이러한 문제에는 전도(reversal)나 전치(transpositon)와 같은 재배열 연산들이 사용되고 있다. 전도와 전치 두 가지 연산을 모두 사용하는 정렬은 필요한 최소 연산 회수의 3배 이내의 연산 수행만으로 가능하다고 알려져 있다. 이 논문에서는 기존의 알고리즘을 분석하고 휴리스틱을 사용함으로써 실제 연산 수행 회수를 대폭 줄일수 있음을 보였다. 또한, 기존의 알고리즘보다 간단한 새로운 알고리즘을 제시하고, 이 알고리즘과 휴리스틱을 같이 사용하는 경우 수행 시간과 근사비(approximation ratio)에 있어서 매우 효과적임을 보였다.

  • PDF

비정렬격자계와 체적포착법을 사용한 표면장력이 지배적인 다상유동 수치해석 (Numerical Simulation of Surface Tension-Dominant Multiphase Flows by Using Volume-Capturing Method and Unstructured Grid System)

  • 명현국
    • 대한기계학회논문집B
    • /
    • 제35권7호
    • /
    • pp.723-733
    • /
    • 2011
  • 본 연구에서는 비정렬격자계와 체적포착법을 사용하여 표면장력이 지배적인 다상유동의 수치해석 방법을 제시하였다. 먼저 표면장력에 대한 CSF(Continuum Surface Force) 모델을 비정렬격자계에 적용할 수 있도록 수치해석 방법을 확립시켜 Myong(2009)이 개발한 비정렬격자계와 체적포착법을 사용한 수치 해석코드에 삽입하였다. 테스트 문제로 오직 표면장력만이 존재하는 평형상태의 정적(static) 액적 및 비평형상태의 동적(dynamic) 액적 문제에 적용하여, 이 해석방법의 유용성과 정확도를 평가하였다. 연구결과, 매끄러운 곡률 계산을 위해 필요한 필터로 본 연구에서 제안한 Laplacian 필터와 함께 CSF 모델로는 밀도보정(density-scaled)한 CSF 모델이 예측성능이 우수한 것으로 나타났다. 또한 표면장력 계산을 위한 이 모델을 채용한 본 수치해석방법은 표면장력이 지배적인 다상유동인 평형상태의 정적 액적 및 비평형상태의 동적 액적 문제 모두에 대해 정확성과 유용성이 입증되었다.

하다마드 복원 알고리즘을 적용한 다중 채널 광섬유 능동정렬용 검출기 구현 (Embodiment of a detector for the active alignment of multichannel optical fiber using Hadamard algorithm)

  • 조남원;곽기석;윤태성;박진배
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 하계학술대회 논문집 D
    • /
    • pp.2118-2120
    • /
    • 2003
  • 다중 채널 광학 정렬 시스템에서 가장 중요한 문제는 각 채널별 정렬이 얼마나 정밀하게 이루어지며 향후 패널의 다중화가 어느 선까지 가능할 수 있는가이다. 기존 시스템은 채널 양쪽에 검출기를 설치하여 광량의 최대 지점을 정렬 위치로 결정하는 방식을 사용했다. 그러나 시스템 채널이 증가함에 따라 정밀한 정렬과 만족할 만한 성능을 얻기에는 어느 정도 한계가 있음을 알 수 있었다. 이러한 단점을 보완하기 위해 본 논문은 단일 검출기를 사용하여 패널별 광량을 측정할 수 있는 방법을 제안한다. 그리고 복원 알고리즘을 통해 기존의 시스템과 다른 측정법과 만족할 만한 결과를 도출하는 방법을 소개하고자 한다.

  • PDF

RNA-Seq 정렬 알고리즘의 동향 (Recent Trends in RNA-Seq Alignment Algorithms)

  • 유승학;최민석;윤성로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.669-671
    • /
    • 2014
  • High Throughput Sequencing (HTS) 기술의 발달로 인해 시퀀싱 비용이 감소함에 따라 다양한 분야에서 이를 활용한 융합 연구가 활발하게 진행되고 있다. HTS 기술에서 가장 중요한 부분은 수백만개의 short read 들을 표준유전체 (reference genome)에 정렬시키는 것인데 RNA 시퀀싱 (RNA-Seq) 의 경우 RNA splicing 으로 인해 일반적인 aligner 로 처리가 불가능하다. 복잡한 RNA-Seq 정렬 문제를 해결하기 위해 그동안 다양한 알고리즘들이 제안되어 왔다. 본 논문에서는 RNA-seq 정렬분야에서 잘 알려진 알고리즘들과 최신 알고리즘들을 살펴봄으로써 RNA-seq 정렬 알고리즘의 동향을 살펴보고자 한다.

출구조사를 위한 투표소 확률추출 방법 (Probability Sampling to Select Polling Places in Exit Poll)

  • 김영원;엄윤희
    • 한국조사연구학회지:조사연구
    • /
    • 제6권2호
    • /
    • pp.1-32
    • /
    • 2005
  • 출구조사에서 투표소 추출방법은 출구조사의 정확성을 결정하는 중요한 요소이다. 본 연구에서는 대표구 추출법을 대신할 수 있는 정렬계통추출법을 제안하고 그 활용 가능성 및 효율성을 분석한다. 아울러 제시된 정렬계통추출법을 사용하는 경우 추정량의 표본추출오차(sampling error)가 어느 정도 되며, 원하는 목표 오차를 만족하기 위한 표본크기를 결정하는 문제를 고려한다. 2004년 17대 총선 개표자료를 토대로 경험적인 분석을 통해 제시된 정렬계통추출법이 기존의 대표구 추출법에 비해 평균예측오차 관점에서 효율적이라는 사실을 규명하고, 기존의 출구조사에서 표본크기 및 추정오차를 해석하는 과정에서 발생하는 오류를 집락효과를 이용해 설명했다. 아울러 제안한 정렬추출법에서 얻어지는 추정량의 분산을 구하고, 설계효과 개념을 이용해 표본크기 결정문제를 다루었다.

  • PDF