Search | Korea Science

A New Method for Nonparametric Document Layout Analysis (매개변수에 무관한 새로운 문서 구조 분석 방법)

류대석;강선미;이성환
- Proceedings of the Korean Information Science Society Conference
- /
- 1999.10b
- /
- pp.482-484
- /
- 1999
본 논문에서는 매개변수 없이 입력 문서 영상을 최대 동질 영역들로 분할한 다음, 각 동질 영역을 텍스트, 그림, 표 그리고 선으로 자동 분류하는 새로운 방법을 제안한다. 다단계 분석과 하향식 접근 방법을 사용하기 위하여 문서 영상을 피라미드 구조로 계층화하였으며, 어떤 영역을 분할할 지의 여부를 결정하기 위하여 그 영역의 주기성을 이용하여 판단하였다. 이러한 주기성 정보를 이용함으로써, 어떠한 매개변수 없이도 활자체 크기와 행간에 무관하게 텍스트 영역을 정확히 분석할 수 있었으며, 피라미드 구조를 만드는데 걸리는 시간이 질감 분석 접근방법보다 빠른 방법으로 설계되었다. Washington 대학의 문서 영상 데이터베이스를 이용한 실험 결과, 제안된 방법이 기존의 방법들보다 더 정확하게 문서 영상을 분할 및 분류할 수 있음을 확인할 수 있었다.
PDF

Open Sourced and Collaborative Method to Fix Errors of Sejong Morphologically Annotated Corpora (공개와 협업을 통한 세종 형태 분석 말뭉치 오류 개선 방법)

Han, Gyeong-Eun;Baek, Seul-Ye;Lim, Jae-Soo
- Annual Conference on Human and Language Technology
- /
- 2017.10a
- /
- pp.228-232
- /
- 2017
본 논문에서는 21세기 세종계획 "현대문어 형태 분석 말뭉치"에서 나타나는 오류를 개선하는 방법으로 패치 시스템을 제안한다. 이 패치 시스템은 패치 파일과 패치 적용-생성 스크립트로 구성되며, 사용자들은 패치 파일을 사용하여 원래의 말뭉치에서 어떤 파일과 어절을 수정하였는지 확인할 수 있어 개발 목적에 맞는 학습 말뭉치를 생성할 수 있다. 또한 이 시스템을 이용해 서로의 수정 사항을 공유하고, 지속적으로 세종 말뭉치의 오류를 개선할 수 있다. 본 논문에서는 총 1,015만 어절을 대상으로 31만여 개의 오류를 수정하였다. 오류의 유형으로는 문장, 어절 분리 오류, 철자 오류, 불일치 오류, 분석 오류, 형식 오류가 있으며, 오류 수정 사항을 패치 파일에 반영하였다.
PDF

A Study of Korean Subdialogues and Discourse Markers (한국어 대화체의 부 대화 유형 및 담화표지에 관한 연구)

Lee, Hyon-Ho;Lim, Hye-Won;Kim, Young-Mi;Yang, Young-Ha
- Annual Conference on Human and Language Technology
- /
- 1997.10a
- /
- pp.477-492
- /
- 1997
본 연구에서는 한국어 대화체에 사용되는 담화표지와 부 대화의 유형을 분석하였다. 한국어 대화체에 사용되는 각종 담화표지에 대한 기존의 언어학적 연구를 정리하였고, 실제 한국어 대화자료를 녹취, 전사하여 연구에 필요한 데이터를 만들었으며, 이 데이터를 분석하여 한국어 대화체에서 관찰되는 부 대화의 유형을 분류하고자 하였다. 또한 각 부 대화와 담화표지들간의 관계를 규명하려는 시도를 하였다. 이것은 인간과 컴퓨터간의 특정 목적 대화를 구현하는 데도 중요한 역할을 한다. 특히 인간과 컴퓨터가 예약, 상담 등 특정 목적을 달성하기 위한 대화를 수행할 수 있는 프로그램을 구축하는 데 있어서, 인간이 실제로 사용하는 담화표지 및 의사소동 책략 등을 반영할 수 있게 해줄 것이다. 담화분석 연구자들이 실제 대화 자료를 분석하여 한국어 대화체의 기저에 흐르는 대화의 메카니즘을 다방면에서 종합적으로 정리하면 그 결과를 토대로 전산학 연구자들이 한층 바람직한 한국어 대화인지 모형을 만들어낼 수 있을 것으로 기대된다.
PDF

Rapid Detection of Important Events in Baseball Video Using multi-Modal Analysis (멀티 모달 분석을 통한 야구 동영상에서의 실시간 중요 이벤트 검출 알고리즘)

Lee, Jin-Ho;Kim, Hyoung-Gook
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2009.11a
- /
- pp.133-136
- /
- 2009
본 논문에서는 야구 동영상에서 실시간으로 중요 이벤트 장면을 검출하는 알고리즘을 제안한다. 제안하는 알고리즘은 영상정보를 분석하여 Pitching 신과 Close Up 신을 추출하여 Play 구간을 검출하고, 오디오 정보를 분석하여 오디오 이벤트 구간을 검출한다. Play 구간의시작인 Pitching 신을 검출하기 위해서는 오프라인 모델과 온라인 모델을 혼용하여 다양한 환경에 상관없이 높은 성능을 보일 수 있도록 하였으며, 아나운서의 억양 및 관중의 함성의 고조도가 높아지는 구간을 기반으로 검출된 오디오 이벤트 구간을 영상 정보 분석을 통해 획득된 Play 장면구간을 결합하여 중요 이벤트 장면 검출의 정확도를 높일 수 있도록 하였다. 실험에 의하면 제안하는 알고리즘은 1초의 동영상 데이터를 처리하는데 0.024초의 소요 시간이 필요하고, 0.89의 Recall과 0.975의 Precision 검출 성능을 보임을 알 수 있었다.
PDF

A Noun Extractor based on Dictionaries and Heuristic Rules Obtained from Training Data (학습데이터를 이용하여 생성한 규칙과 사전을 이용한 명사 추출기)

Jang, Dong-Hyun;Myaeng, Sung-Hyon
- Annual Conference on Human and Language Technology
- /
- 1999.10d
- /
- pp.151-156
- /
- 1999
텍스트로부터 명사를 추출하기 위해서 다양한 기법이 이용될 수 있는데, 본 논문에서는 학습 데이터를 이용하여 생성한 규칙과 사전을 이용하는 단순한 모델을 통해 명사를 효과적으로 추출할 수 있는 기법에 대하여 기술한다. 사용한 모델은 기본적으로 명사, 어미, 술어 사전을 사용하고 있으며 명사 추정은 학습 데이터를 통해 생성한 규칙을 통해 이루어진다. 제안한 방법은 복잡한 언어학적 분석 없이 명사 추정이 가능하며, 복합명사 사전을 이용하지 않고 복합 명사를 추정할 수 있는 장점을 지니고 있다. 또한, 명사추정의 주 요소인 규칙이나 사전 등록어의 추가, 갱신 등이 용이하며, 필요한 경우에는 특정 분야의 텍스트 분석을 위한 새로운 사전의 추가가 가능하다. 제안한 방법을 이용해 "제1회 형태소 분석기 및 품사 태거 평가대회(MATEC '99')"의 명사 추출기 분야에 참가하였으며, 본 논문에서는 성능평가 결과를 제시하고 평가결과에 대한 분석을 기술하고 있다. 또한, 현재의 평가기준 중에서 적합하지 않은 부분을 규정하고 이를 기준으로 삼아 자체적으로 재평가한 평가결과를 제시하였다.
PDF

English-to-Korean Machine Translation System for Air Force Intelligence : ALKOL (공군 정보 영한 기계번역 시스템 L ALKOL)

이현아;임철수;최명석;강인호;김길창
- Proceedings of the Korean Society for Cognitive Science Conference
- /
- 2000.06a
- /
- pp.315-322
- /
- 2000
본 논문에서는 공군 정보 번역을 위한 영한 기계번역 시스템 ALKOL에 대해서 소개한다. ALKOL은 어휘화된 규칙에 기반한 번역 시스템으로, 어휘화된 규칙은 어휘-분석-변환-생성의 네 단계의 정보가 연결된 형태로 사전에 저장된다. 이와 같은 사전 구조에 의해 번역 과정의 효율성을 높일 수 있고, 어휘화된 규칙에 의해 정확하고 자연스러운 번역 결과를 얻을 수 있다. ALKOL의 번역 과정은 형태소 분석, 품사 태깅, 분석 전처리, 구문 분석, 변환, 생성의 단계로 이루어진다. 각 단계에서는 전/후처리를 보강하여 실제 번역 환경에서 나타나는 문제들을 해결하고, 하나 이상의 번역 결과를 출력하여 사용자가 원하는 결과를 선택할 수 있게 한다.
PDF

Video Segmentation Using DCT and Guided Filter in real time (DCT와 Guided Filter를 이용한 실시간 영상 분류)

Shin, hyun-hak;Lee, zu-cheul;Kim, won-ha
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2015.11a
- /
- pp.161-164
- /
- 2015
본 논문에서는 고정된 카메라에서 초기 프레임을 참조하여 현재 프레임에 새롭게 유입된 물체의 실시간 분류 방법을 제안한다. 제안한 알고리즘의 실시간 분류 처리를 위하여 복잡도를 최소화 하였다. 먼저 전경과 배경을 구분하는 이진 분류 영상을 추출하기 위하여 DCT(Discrete Cosine Transform) 기법을 사용한다. DCT는 기존 공간영역에서 Texture를 분석하는 방식보다 더욱 정확하게 Texture를 분석할 수 있다. 이는 주파수 영역에서 Texture 특징 분석이 더욱 용이하고 각 요소 안에 intensity와 texture 정보를 종합적으로 고려할 수 있기 때문이다. 또한 DCT 계산 복잡도를 최소화하기 위하여 DCT 수행 전에 색 정보를 이용하여 미리 분류 영역을 분석함으로써 처리 효율을 극대화 하였다. 마지막으로 생성된 이진 분류 영상을 자연스럽게 matting하기 위하여 Guided 필터 사용을 제안한다. Guided 필터는 guidance 정보를 통해 입력 영상을 전반적으로 개선할 수 있지만 intensity가 평탄한 영역 등에서 그 한계를 보여주므로 본 논문에서는 Guided 필터의 단점을 개선하는 방법을 추가적으로 제안한다.
PDF

기준국 네트워크 선정에 따른 GNSS 광역보정시스템 성능 분석

Han, Deok-Hwa;Yun, Ho;Gi, Chang-Don
- Proceedings of the Korean Institute of Navigation and Port Research Conference
- /
- 2013.06a
- /
- pp.108-110
- /
- 2013
GPS 신호에는 여러 가지 오차가 포함되어 사용자가 이를 그대로 이용할 경우 높은 정확도의 위치를 얻을 수 없다. 따라서 신호의 오차를 제거하고 높은 위치 정확도를 얻기 위하여 여러 가지 보정시스템들이 개발되어왔다. 그 중에서 광역보정시스템은 여러 개의 기준국 네트워크로부터 데이터를 수집하여 3차원 위성궤도 오차, 위성 시계오차, 서비스 지역의 전리층 지연 오차를 추정하여 사용자에게 보정정보를 제공한다. 사용자는 보정정보를 수신하여 자신의 위치에 맞는 오차정보를 계산하여 정확도를 높일 수 있다. 이러한 광역보정시스템의 성능은 기준국의 배치에 따라 차이를 보일 수 있으므로 적절한 기준국 선정을 위해서는 기준국 네트워크 변화에 따른 성능 분석이 필수적이다. 본 논문에서는 국토해양부 NDGPS 기준국 중에서 후보군을 선정한 후 시뮬레이션을 통하여 기준국 네트워크 변화에 따른 사용자 정확도, 가용성을 분석하였다. 그리고 실제 기준국에서 수집된 측정치를 처리하여 성능분석을 수행하였다.
PDF

Visualization Tool for Standard Cell Placement (표준 셀 배치를 위한 가시화 도구)

Kim, Dong-Hyun;Hur, Sung-Woo
- Proceedings of the Korean Information Science Society Conference
- /
- 2005.07a
- /
- pp.694-696
- /
- 2005
VLSI 셀 배치문제는 셀(노드)과 넷으로 구성된 회로를 최소의 비용과 제약조건을 만족하면서 칩 위에 배치하는 문제로 지금까지 여러가지 다양한 배치 알고리즘들이 제시되어왔다. 배치 알고리즘은 입력으로 회로정보를 받아서 결과를 숫자 데이터로 출력하기 때문에 알고리즘 개발자는 배치결과를 숫자 데이터로 분석할 수 밖에 없다. 이런 점에서 실험 결과에 대한 신뢰성 문제가 발생될 수 있는데 2003년 발표된 밴치마킹에 관한 논문[1]에 따르면 뛰어난 성능을 가진 대표적인 알고리즘들을 비교 분석한 결과 실제 최종 배치된 결과에서 셀들의 오버랩 현상과 균일하지 못한 배치 등 몇 가지 문제점들이 지적되었다. 본 논문에서는 이러한 문제점들을 해결하기 위해 알고리즘 개발자가 실험 결과를 가시화해서 직접 확인하고 분석할 수 있는 가시화 도구를 제안한다. 또한 가시화 도구는 결과분석을 통해 보다 향상된 알고리즘 개발에 도움을 주는 것을 목적으로 한다.
PDF

Analysis of Corelations between Network Line Utilization and Response-Time Based-on Real Environment Data (실측 데이터를 통한 네트워크 선로 이용율과 응답시간의 관계 분석)

Seo, Sang-Hyeon;Choi, Young-Su;Chung, Jin-Wook
- Annual Conference of KIPS
- /
- 2000.04a
- /
- pp.624-628
- /
- 2000
이 논문에서는 네트워크 성능을 파악할 수 있는 관리 정보 중의 하나인 선로 이용율과 응답시간의 관계 분석을 위해 실험 네트워크를 구축하고, 패킷 생성기와 SNMP 데이터 수집기를 구현하였다. 그리고 분석 결과가 사용자에게 일정 응답시간 이내의 서비스를 제공하는 동시에 네트워크 자원을 경제적으로 유지하기 위한 지침으로 활용될 수 있도록 선로 이용율과 응답시간의 관계를 분석한다.
PDF

Search Result 39,995, Processing Time 0.061 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)