• 제목/요약/키워드: 편집 알고리즘

검색결과 153건 처리시간 0.026초

한글 편집거리 알고리즘을 이용한 한국어 철자오류 교정방법 (A Method for Spelling Error Correction in Korean Using a Hangul Edit Distance Algorithm)

  • 박승현;이은지;김판구
    • 스마트미디어저널
    • /
    • 제6권1호
    • /
    • pp.16-21
    • /
    • 2017
  • 컴퓨터가 상용화되면서 일반인들은 문서를 작성하기 위해 컴퓨터를 이용하는 방법을 자주 사용하게 되었다. 컴퓨터를 이용하여 문서를 작성하는 방법은 작성 속도가 빠르고 손의 피로가 적지만 철자오류가 발생할 확률이 매우 높다. 보통 철자오류는 발견하기 쉽기 때문에 곧바로 수정이 가능하지만, 사용자의 지식 부족 혹은 눈에 잘 띄지 않는 철자오류도 존재하기 때문에 철자오류가 존재하지 않는 문서를 작성하기 어렵다. 온라인상에서는 문서 작성에 대한 규칙 및 예절이 미비하기 때문에 철자오류에 의한 문제가 적지만 중요문서에서 발생하는 철자오류는 신뢰도 하락과 같은 큰 문제를 일으킨다. 철자오류 교정은 전문가 또한 완벽하게 수행하기 힘들기 때문에 비전문가인 일반인들을 위한 교정방법연구가 필요하다. 본 논문에서는 한글 편집거리 알고리즘을 이용해 철자오류를 교정하는 연구를 진행한다. 이전 연구를 통해 검출한 철자오류를 수집한 말뭉치 사전에서 등장하는 단어 중 철자오류 단어와 가장 유사한 단어를 발견하여 주위 단어와의 동시등장빈도를 계산하는 것으로 철자오류 교정을 수행하게 된다.

Hierarchical ART2 알고리즘을 이용한 악보 인식 (Musical Score Recognition Using Hierarchical ART2 Algorithm)

  • 김광백;우영운
    • 한국정보통신학회논문지
    • /
    • 제13권10호
    • /
    • pp.1997-2003
    • /
    • 2009
  • 음악 연구에 따른 컴퓨터의 역할이 점차 중요한 비중을 차지함에 따라 효과적인 악보 인식과 효율적인 악보의 편집 및 수정 방법이 요구된다. 기존의 수동 입력 방식에서는 악보를 부정확하게 입력하여 수정하는 경우에는 작업시간이 많이 소요되며, 각 수정 프로그램에서 만든 악보는 특정 프로그램에서만 재수정이 가능하다는 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위하여 이미 작성 되어있는 악보들을 자동으로 인식하는 방법을 제안한다. 제안된 악보 인식 방법은 수평 히스토그램을 이용하여 악보 이미지의 오선을 제거한 후, 4 방향 윤곽선 추적 알고리즘을 적용하여 잡음을 제거하고 Grassfire 알고리즘을 적응하여 악보 구성 기호들을 추출한다. 추출된 악보 구성 기호들은 hierarchical ART2 알고리즘을 적용하여 인식된다. 제안된 악보 인식 방법 의 성능을 평가하기 위해 100장의 악보 영상을 대상으로 실험한 결과, 제시된 hierarchical ART2 알고리즘을 이용한 악보 영상의 인식 방법이 효율적임을 확인하였다.

문맥가중치가 반영된 문장 유사 척도 (Context-Weighted Metrics for Example Matching)

  • 김동주;김한우
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.43-51
    • /
    • 2006
  • 본 논문은 영한 기계번역을 위한 예제기반 기계번역에서 예제 문장의 비교를 위한 척도에 관한 것으로 주어진 질의 문장과 가장 유사한 예제 문장을 찾아내는데 사용되는 유사성 척도를 제안한다. 제안하는 척도는 편집거리 알고리즘에 기반을 둔 것으로 표면어가 일치하지 않는 단어에 대해 기본적으로 단어의 표제어 정보와 품사 정보를 이용하여 유사도를 계산한다. 편집거리 척도는 비교 단위의 순서에 의존적이기는 하지만 순서만 일치하면 동일한 유사성 기여도를 갖는 것으로 판단하기 때문에 완전 문맥을 반영하지는 못한다. 따라서 본 논문에서는 완전 문맥 반영을 위해 추가적으로 이들 정보 외에 일치하는 단위 정보를 갖는 연속된 단어들에 대해 연속 정보를 반영한 문맥 가중치를 제안한다. 또한 비유사성 정도를 의미하는 척도인 편집거리 척도를 유사성 척도로 변경하고, 문맥 가중치가 적용된 척도를 문장 비교에 적용하기 위하여 정규화를 수행하며, 이를 통하여 유사도에 따른 순위를 결정한다. 또한 언어적 정보를 이용한 기존 방법류들에 대한 일반화를 시도하였으며, 문맥 가중치가 적용된 척도의 우수성을 증명하기 위해 일반화된 기존 방법류들과의 비교 실험을 수행하였다.

집합 기반 POI 검색을 이용한 문장 유사도 측정 기법 (Sentence Similarity Measurement Method Using a Set-based POI Data Search)

  • 고은별;이종우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권12호
    • /
    • pp.711-716
    • /
    • 2014
  • 최근 논문 표절 논란과 지능형 텍스트 검색서비스에 대한 관심이 증가하면서 문장 유사도 측정의 필요성이 증가하고 있다. n-gram, 편집거리, LSA 등 기존의 다양한 방향으로 선행 연구가 있었지만 각 기법마다 장단점이 존재한다. 본 논문에서는 집합 기반 POI 검색 기법을 이용한 새로운 방향의 문장 유사도 측정 기법을 제안한다. 집합 기반 POI 검색 기법은 하드매칭에 비해 단어의 도치, 누락, 삽입, 변경에 현저한 성능 향상을 보인다. 이 기법을 이용하면 보다 정확하고 빠른 문장 유사도 측정이 가능하다. 제안하는 기법은 기존 집합 기반 POI 검색 기법의 데이터 로딩 알고리즘과 텍스트 검색 알고리즘을 변형하고 어절 연산 알고리즘을 추가하여 두 문장의 유사도를 백분율로 표현한다. 실험을 통해 본 논문에서 제시하는 기법이 정확도와 속도에서 n-gram과 기존 집합 기반 POI 검색 기법에 비해 우수함을 확인하였다.

DTV 방송프로그램의 온라인 불법전송 차단을 위한 비디오 복사본 검출 알고리즘 (Video Copy Detection Algorithm Against Online Piracy of DTV Broadcast Program)

  • 김주섭;남제호
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.662-676
    • /
    • 2008
  • 본 논문은 불법복제된 DTV 방송프로그램의 온라인 불법전송을 차단하기 위한 비디오 복사본 검출 알고리즘을 제안한다. 제안한 알고리즘은 급격한 휘도 변화가 나타나는 방송영상의 비디오 프레임을 선별하여 키프레임(keyframe)을 구성한 후, 키프레임의 시 공간적 특징정보를 추출하여 사전에 등록된 방송영상 저작물들의 특징정보와 비교함으로써 해당 방송영상의 불법복제 여부를 판별하는 동영상 필터링(filtering) 기능을 제공한다. 특히 모든 프레임을 이용하지 않고 키프레임만을 추출함으로써 대용량 방송영상물의 저작권 침해 여부를 효율적으로 판단할 수 있으며, 온라인 전송과정에서 빈번히 적용되는 영상비 변환, 로고 삽입, 자막 삽입, 화질 열화 및 해상도 감소 등의 다양한 동영상 편집효과에도 강인함을 실험을 통하여 확인하였다. 또한 기존 알고리즘들과의 성능비교실험을 통하여 상대적 우수성을 평가하였다.

선형성 지형자료의 일반화에 대한 효율적인 알고리즘에 관한 연구 (A Study on the Effective Algorithms for tine Generalization)

  • 김감래;이호남
    • 한국측량학회지
    • /
    • 제12권1호
    • /
    • pp.43-52
    • /
    • 1994
  • 본 연구는 대축척 실측지도를 이용한 소축척 편집지도의 자동제작과 디지탈지도 데이타베이스 구축 등의 활용분야에 필수적 요소인 일반화에 대한 연구로서 기존에 가장 잘 알려진 Douglas 알고리즘을 국립지리원 발행 1/25,000 지도에 포함되어 있는 남제주군 표선 일대의 해안선에 적용, 다양한 축적으로 디지탈 지도를 제작하여 도해적 표현에 대한 문제점을 분석하였다. 디지탈 환경하에서 일반화된 지도는 수작업을 통해 제작된 지도와 상당부분 시각적인 표현의 차이 및 위상구조의 상실 등에 대한 문제점을 내포하고 있음을 알 수 있었다. 이러한 문제점을 해결하기 위하여 지형의 특성을 소축척 지도에 반영할 수 있도록 최소 지형인지계수를 원과 격자로 설정하여 처리하는 기법과 이들을 혼용한 기법의 알고리즘을 토대로 선형성 지형요소에 대한 일반화 프로그램을 개발하여 성과를 도출하였다. 또한 최소 지형인지 계수를 축척별로 매개변수화 하여 개발된 프로그램에 적용하고 수작업에 의해 제작된 지도와 비교하였으며, 각 알고리즘 별로 최소 지형인지계수의 선택에 따른 효율성을 판단하기 위하여 일반화 처리 결과의 데이타 용량을 분석하였다.

  • PDF

시나리오 기반의 3D 객체 재사용 알고리즘 (Scenario-based 3D Objects Reuse Algorithm Scheme)

  • 강미영;이형옥;손승철;허권;김봉태;남지승
    • 한국콘텐츠학회논문지
    • /
    • 제6권11호
    • /
    • pp.302-309
    • /
    • 2006
  • 본 논문에서는 3D 객체들의 재사용과 확장을 위해 실용적인 알고리즘을 제안하였다. 이 알고리즘은 Motion Path Modification rule에 바탕을 두고 있으며, 기존 3D 객체의 Motion을 재사용하여 새로운 Motion을 가진 3D객체를 재생성하여 사용하는데 있다. 논문에서 사용된 선형과 비선형 곡선 맞춤 알고리즘은 keyframe 보간에 의해 애니메이션을 수정하고 실제적인 움직임을 만드는데 적용된다. 본 논문에서는 또한 기존에 제작된 애니메이션의 세그먼트를 이용한 시나리오 기반 3D 이미지 합성시스템 프레임워크를 제안하였으며, 이 프레임워크는 기존에 만들어진 3D 객체 정보를 이용함으로써 게임 프로그래밍 및 시나리오 기반의 3D 애니메이션을 설계하는데 있어서 드는 많은 비용과 시간을 효율적으로 이용할 수 있다.

  • PDF

자율 학습을 이용한 선형 정렬 말뭉치 구축 (Construction of Linearly Aliened Corpus Using Unsupervised Learning)

  • 이공주;김재훈
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.387-394
    • /
    • 2004
  • 본 논문에서는 자을 선형 정렬 알고리즘을 이용하여 선형 정렬 말뭉치를 구축하는 방법을 제안한다. 기존의 자율 선형 정렬 알고리즘을 이용하여 선형 정렬 말뭉치를 구축할 경우, 두 문자열의 길이가 서로 다르면 정렬된 두 문자열(입력열과 출력열)에 모두 공백문자가 나타난다. 이 방법을 그대로 사용하면 정렬 말뭉치의 구축은 용이하나 정렬된 말뭉치를 이용하는 응용 시스템에서는 탐색 공간이 기하급수적으로 늘어날 뿐 아니라 구축된 정렬 말뭉치는 다양한 기계학습 방법에 두루 사용될 수 없다는 문제가 있다. 본 논문에서는 이들 문제를 최소화하기 위해서 입력열에는 공백문자가 나타나지 않도록 기존의 자을 선형 정렬 알고리즘을 수정하였다. 이 알고리즘을 이용해서 한영 음차 표기 및 복원, 영어 단어의 발음 생성, 영어 발음의 단어 생성, 한국어 형태소 분리 및 복원을 위한 정렬 말뭉치를 구축하였으며, 간단한 실험을 통해, 그들의 실용성을 입증해 보였다.

시소러스 브라우저 자동구현을 위한 Metadata를 이용한 색인어 처리방안에 대한 연구 (A Theoretical Study on Indexing Methods using the Metadata for the Automatic Construction of a Thesaurus Browser)

  • 서휘
    • 한국도서관정보학회지
    • /
    • 제35권4호
    • /
    • pp.451-467
    • /
    • 2004
  • 본 연구에서는 시소러스 브라우저를 자동으로 구성하기 위한 방법에 대한 이론적인 연구와 함께 시소러스 브라우저 구성과정의 핵심인 자동색인과 용어 간 계층을 자동으로 형성하는 클러스터링 알고리즘에 대한 선행 연구결과를 제시하였다. 그리고 웹 문헌에서 전통적인 종이 형태 문헌의 서지사항에 해당하는 메타데이터를 분석하고 이를 처리하는 방안을 조사함에 의해 웹 문헌에서 색인어를 자동으로 추출할 수 있는 방안에 대하여 연구하였다. 또한 대부분의 웹 문헌에 메타데이터가 수록되어 있지 않음에 착안하여 기존의 웹 문헌에 메타데이터 자동 편집기를 이용하여 메타데이터를 수록하는 방안에 대한 연구결과를 제시하였다.

  • PDF

마코프 특징을 이용하는 고속 위조 영상 검출 알고리즘 (Fast Image Splicing Detection Algorithm Using Markov Features)

  • 김수민;박천수
    • 전기전자학회논문지
    • /
    • 제22권2호
    • /
    • pp.227-232
    • /
    • 2018
  • 이미지 편집 툴의 발전으로 일반 사용자도 원본 이미지를 조작하여 실제와 다른 영상 정보를 전달하는 것이 가능하게 되었다. 이러한 사회적 변화에 따라 이미지의 신뢰도는 매우 낮아지게 되었고 이미지의 조작여부를 검출하는 시스템의 필요성이 제기되고 있다. 본 논문에서는 마코프 특징을 이용하여 이미지 조작 여부를 검출하는 알고리즘을 제안한다. 제안하는 방법은 전체 입력 이미지에서 마코프 특징을 추출하고, 그 중 위조 여부 검출에 사용되지 않는 불필요한 특징을 제거한다. 따라서 제안하는 기술은 위조 검출에 사용되는 마코프 특징의 수를 감소시켜 전체 검출 속도를 향상시키는 효과가 있다. 실험을 통해 제안하는 방법은 상대적으로 낮은 복잡도로 우수한 위조 검출 성능을 보임을 확인하였다.