• 제목/요약/키워드: 가중편집거리

검색결과 5건 처리시간 0.018초

문자열의 근사커버 찾기 (Finding Approximate Covers of Strings)

  • 심정섭;박근수;김성렬;이지수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권1호
    • /
    • pp.16-21
    • /
    • 2002
  • 반복적인 문자열에 대한 연구는 최근 들어 여러 분야에서 활발히 진행되어 왔다. 특히, DNA 염기서열의 분석 등 분자생물학에서 그 필용성이 대두되어 있다. 주기 커버, 시드 시퀘어 등이 반복적인 문자열의 대표적인 예들이다. 근사문자열 매칭 분야에서도 근사주기, 근사스퀘어 등 반복적인 문자열에 관 한 연구가 진행되고 있다. 본 논문에서는 근사커버의 개념을 제시한다. 길이가 각각 m, n 인 두 문자열 P. T가 주어졌을 때, P가 T의 근사커버가 되는 최소의 편집거리를 O(mn) 시간, 최소의 가중편집거리를 $O(mn^2)$시간에 찾는 알 고리즘을 제시한다. 또한 문자열 T만 주어졌을 때. T의 최소 근사커버 거리를 갖는 문자열 P를 찾는 문제가 NP-완전 결과임을 증명한다.

거리합기반 문자열의 최소 주기거리 찾기 (Finding the minimum period distance based on distance sum)

  • 정주희;김영호;심정섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.391-393
    • /
    • 2012
  • 반복적인 문자열에 대한 연구는 압축알고리즘이나 모티프검출, 염기서열 분석 등 다양한 분야와 관련되어 연구되고 있다. 반복문자열 연구 중에서도 어느 정도의 불일치를 허용하는 근사반복문자열 연구가 활발히 이루어지고 있다. 본 논문에서는 길이가 각각 m과 n인 문자열 p와 x가 주어졌을 때, p의 x에 대한 거리합기반 근사주기에 대해 정의하고 최소 주기거리를 찾는 문제를 제시한다. 그리고 가중편집거리를 사용했을 때 O($mn^2$)시간, 편집거리를 사용했을 때 O(mn)시간, 해밍거리를 사용했을 때 O(n)시간에 문제를 해결하는 알고리즘을 제시한다.

DNA 서열분석을 위한 거리합기반 문자열의 근사주기 (Approximate Periods of Strings based on Distance Sum for DNA Sequence Analysis)

  • 정주희;김영호;나중채;심정섭
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권2호
    • /
    • pp.119-122
    • /
    • 2013
  • 주기와 같은 반복문자열에 대한 연구는 데이터압축, 컴퓨터활용 음악분석, 바이오인포매틱스 등 다양한 분야에서 진행되고 있다. 바이오인포매틱스 분야에서 주기는 유전자 서열이 반복적으로 나타나는 종렬중복과 밀접한 관련이 있으며 이는 근사문자열매칭을 이용한 근사주기 연구와 관련이 있다. 본 논문에서는 기존의 근사주기에 대한 정의를 보완하는 거리합기반 근사주기를 정의하고 이에 대한 연구 결과를 제시한다. 길이가 각각 m과 n인 문자열 p와 x가 주어졌을 때, p의 x에 대한 거리합기반 최소 근사주기거리를 가중편집거리에 대해 $O(mn^2)$ 시간, 편집거리에 대해 O)(mn) 시간, 해밍거리에 대해 O(n) 시간에 계산하는 알고리즘을 제시한다.

문맥가중치가 반영된 문장 유사 척도 (Context-Weighted Metrics for Example Matching)

  • 김동주;김한우
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.43-51
    • /
    • 2006
  • 본 논문은 영한 기계번역을 위한 예제기반 기계번역에서 예제 문장의 비교를 위한 척도에 관한 것으로 주어진 질의 문장과 가장 유사한 예제 문장을 찾아내는데 사용되는 유사성 척도를 제안한다. 제안하는 척도는 편집거리 알고리즘에 기반을 둔 것으로 표면어가 일치하지 않는 단어에 대해 기본적으로 단어의 표제어 정보와 품사 정보를 이용하여 유사도를 계산한다. 편집거리 척도는 비교 단위의 순서에 의존적이기는 하지만 순서만 일치하면 동일한 유사성 기여도를 갖는 것으로 판단하기 때문에 완전 문맥을 반영하지는 못한다. 따라서 본 논문에서는 완전 문맥 반영을 위해 추가적으로 이들 정보 외에 일치하는 단위 정보를 갖는 연속된 단어들에 대해 연속 정보를 반영한 문맥 가중치를 제안한다. 또한 비유사성 정도를 의미하는 척도인 편집거리 척도를 유사성 척도로 변경하고, 문맥 가중치가 적용된 척도를 문장 비교에 적용하기 위하여 정규화를 수행하며, 이를 통하여 유사도에 따른 순위를 결정한다. 또한 언어적 정보를 이용한 기존 방법류들에 대한 일반화를 시도하였으며, 문맥 가중치가 적용된 척도의 우수성을 증명하기 위해 일반화된 기존 방법류들과의 비교 실험을 수행하였다.

의료보호대상자의 의료이용양상 (Comparision of Medical Care Utilization Patterns between Beneficiaries of Medical Aid and Medical Insurance)

  • 김복연;김석범;김창윤;강복수;정종학
    • Journal of Yeungnam Medical Science
    • /
    • 제8권2호
    • /
    • pp.185-201
    • /
    • 1991
  • 의료보호대상자의 상병 및 의료이용 양상, 의료이용에 대한 만족도를 의료보험대상자와 비교분석하기 위하여 1990년 7월 2일부터 7월 14일까지 대구시 1개 동 의료보호대상자 총 89가구와 의료보험대상자 총 96가구를 단순임의 표본추출한 다음 면접조사를 실시하였다. 대상자 1,000명당 15일간의 급성질환 이환율은 의료보호대상자 63, 의료보호대상자 62로 비슷하였으나, 표준화 이환율은 각각 73 및 69로 의료보호대상자가 다소 높았다. 연령별로는 19세 이하군이 각각 94 및 93으로 비교적 높았다. 1년간 만성질환 이환율은 의료보호대상자 123, 의료보험대상자 73이며 표준화한 이환율도 각각 87 및 57로 의료보호대상자가 월등히 높았다. 두 군 모두에서 연령이 증가할수록 이환율이 높았으며, 의료보호 중에는 1종의 의료보호대상자가 의료보험 중에서는 직장의료보험대상자가 그 이환율이 가장 높았다. 15일간의 급성질환 이환율은 의료보호대상자와 의료보험대상자 모두에서 호흡기질환이 각각 33.3%, 37.5%로 가장 많았으며, 1년간의 만성질환 이환율은 의료보호대상자에서는 근골격계 질환이 22.9%로 가장 많았었던 반면에 의료보험대상자에서는 위장관계 질환이 25.0%로 가장 높았다. 급성질환의 평균이환기간은 의료보호대상자가 3.8일로 의료보험대상자의 6.8일에 비해 짧았으나 만성질환의 경우는 11.5개월로 의료보험대상자의 7.8개월에 비해 월등히 길었다. 급성 이환자들의 1차 의료이용시 가장 많이 방문하는 의료기관은 의료보호대상자에서는 약국(55.6%)이었고, 의료보험대상자에서는 의원(45.8%)이었다. 만성질환 이환자의 지난 1년간 1차 의료이용은 두 군 모두에서 각각 31.4%, 53.6%로 의원을 가장 많이 이용하였다. 급성질환 이환자의 15일간 전체 의료기관 평균 이용일수를 보면 1차 의료이용은 두 군 모두에서 각각 31.4%, 53.6%로 의원을 가장 많이 이용하였다. 급성질환 이환자의 15일간 전체 의료기관 평균 이용일수를 보면 1차 이용에서 의료보호대상자 3.6일, 의료보험대상자 5.0일 이었으며 2차 이용에서는 각각 2.8일, 5.4일 이었다. 만성질환 이환자의 지난 15일간 평균이용일수는 1차 이용은 의료보험대상자는 7.2일 이었으며 2차 및 3차 이용은 의료보호대상자 15.0일 및 13.1일, 의료보험대상자 7.7일 및 6.8일 이었다. 급성질환 이환자가 1차 의료이용시 병원, 의원 그리고 약국을 방문하는 가장 많은 이유는 의료보호대상자 및 의료보험대상자 두 군 모두에서 '가까운 거리'였다. 만성질환 이환자에서 1차 의료이용시 병원을 이용하는 가장 많은 이유는 두 군 모두에서 '의료인의 명성'이었으며, 의원이용의 이유는 의료보호대상자의 경우 '의료보호혜택'이었고 의료보험대상자에서는 '가까운 거리'였다. 약국의 이용시에도 '가까운 거리'가 중요한 이유였다. 의료보장제도의 재원에 대한 물음의 정답률은 의료보호대상자 53.4%, 의료보험대상자 48.8%였다. 의료보장제도의 실시 목적에 대한 물음에 두 군 모두에서 의료비용절감이라고 대답한 경우가 각각 55.3% 및 55.7%였다. 의료기관 이용만족도 평가에서 의료인의 태도에 대한 만족도는 의료보호대상자 및 의료보험대상자 두 군 모두 약국이 47.9%, 46.5% 로 가장 높았으며 의료의 질에 대한 만족도는 병원이 각각 50.5%, 45.1%로 가장 높았다. 의료비에 대한 만족도는 의원이 각각 55.8%, 35.9%로 가장 높았고 의료기관의 환경에 대해 가장 만족하는 경우가 병원으로 각각 54.3%, 34.8%였다. 의료기관 이용절차에 대한 만족도는 약국이 각각 70.6%와 78.5%로 가장 높았다. 이상의 소견으로 우리나라 의료보호대상자는 만성질환 이환율이 의료보험대상자에 비해 매우 높아 이로 인한 경제적 어려움이 가중될 것으로 생각되며, 급성질환 이환자의 의료이용이 약국 중심으로 이루어지고 만성질환 이환자의 의료 이용이 약국중심으로 이루어지고 만성질환 이환자의 미치료율이 의료보험대상자에 비해 높다는 사실 등은 현재 의료보호제도가 효과적으로 실시되지 못하고 있을 가능성을 시사하며 병의원이용과 관련하여 의료인과 의료보호대상자의 의료보호사업에 대한 인식 및 태도 변화를 위한 홍보 및 계몽이 요구되며 또한 이용절차의 간소화를 위한 제도마련이 이루어져야 할 것으로 생각된다.

  • PDF