• 제목/요약/키워드: Text Boundary

검색결과 82건 처리시간 0.022초

텍스트마이닝을 활용한 도로분야 ITS 정책이슈 탐색기법 정립 (Establishment of ITS Policy Issues Investigation Method in the Road Section applied Textmining)

  • 오창석;이용택;고민수
    • 한국ITS학회 논문지
    • /
    • 제15권6호
    • /
    • pp.10-23
    • /
    • 2016
  • 본 연구는 빅데이터를 활용하여 감사 시 유의해서 살펴보아야 할 ITS 관련 정책이슈 탐색방법 개발 및 적용을 목적으로 한다. 이를 위해 본 연구에서는 William Dunn이 제안한 경계분석을 이론적 토대로 하여, 여기에 감사원 감사실무 프로세스를 접목한 감사이슈 분석 틀을 제안했다. 그리고 이 분석 틀을 전산으로 구현하기 위해 메타문제를 추정하는 개념이 경계분석과 유사한 텍스트마이닝 기법을 응용했다. 텍스트마이닝의 구체적 모형은 David Blei가 제안한 Latent Dirichlet Allocation(LDA) 모형을 기반으로 하는 비대칭-대칭 혼합 어휘소 기반 LDA를 응용했다. 사례분석 결과, 경찰청에서 운영하는 도시교통정보시스템의 교통정보 수집률 저조와 국토교통부의 첨단교통관리시스템과의 중복 문제, 디지털 운행기록계의 주행거리 조작 등이 주요 이슈로 도출됐다.

에지 및 컬러 양자화를 이용한 모바일 폰 카메라 기반장면 텍스트 검출 (Mobile Phone Camera Based Scene Text Detection Using Edge and Color Quantization)

  • 박종천;이근왕
    • 한국산학기술학회논문지
    • /
    • 제11권3호
    • /
    • pp.847-852
    • /
    • 2010
  • 자연 영상 내에 포함된 텍스트는 영상의 다양하고 중요한 특징을 갖는다. 그러므로 텍스트를 검출하고 추출하여 인식하는 것이 중요한 연구대상으로 연구되고 있다. 최근 모바일 폰 카메라를 기반으로 다양한 분야에서 많은 응용 기술이 연구 개발되고 있다. 본 논문은 에지 및 연결요소를 이용한 장면 텍스트 검출 방법을 제안한다. 그레이스케일 영상으로부터 에지 성분 검출과 지역적 표준편차를 이용하여 텍스트 영역의 경계선을 검출하고, RGB 컬러공간의 유클리디안 거리를 기준으로 연결요소를 검출한다. 검출된 에지 및 연결요소를 레이블링하고 각각 영역의 외곽사각형을 구한다. 텍스트의 휴리스틱 이용하여 후보 텍스트를 추출한다. 후보 텍스트 영역을 병합하여 하나의 후보 텍스트 영역을 생성하고, 후보 텍스트의 지역적 인접성과 구조적 유사성으로 후보 텍스트를 검증함으로서 최종적인 텍스트 영역을 검출하였다. 실험결과 에지 및 컬러 연결요소 특징을 상호 보완함으로서 텍스트 영역의 검출률을 향상시켰다.

MULTIPLE SOLUTIONS OF A PERTURBED YAMABE-TYPE EQUATION ON GRAPH

  • Liu, Yang
    • 대한수학회지
    • /
    • 제59권5호
    • /
    • pp.911-926
    • /
    • 2022
  • Let u be a function on a locally finite graph G = (V, E) and Ω be a bounded subset of V. Let 𝜀 > 0, p > 2 and 0 ≤ λ < λ1(Ω) be constants, where λ1(Ω) is the first eigenvalue of the discrete Laplacian, and h : V → ℝ be a function satisfying h ≥ 0 and $h{\not\equiv}0$. We consider a perturbed Yamabe equation, say $$\{\begin{array}{lll}-{\Delta}u-{\lambda}u={\mid}u{\mid}^{p-2}u+{\varepsilon}h,&&\text{ in }{\Omega},\\u=0,&&\text{ on }{\partial}{\Omega},\end{array}$$ where Ω and ∂Ω denote the interior and the boundary of Ω, respectively. Using variational methods, we prove that there exists some positive constant 𝜀0 > 0 such that for all 𝜀 ∈ (0, 𝜀0), the above equation has two distinct solutions. Moreover, we consider a more general nonlinear equation $$\{\begin{array}{lll}-{\Delta}u=f(u)+{\varepsilon}h,&&\text{ in }{\Omega},\\u=0,&&\text{ on }{\partial}{\Omega},\end{array}$$ and prove similar result for certain nonlinear term f(u).

코퍼스 방식 음성합성에서의 개선된 운율구 경계 예측 (AP, IP Prediction For Corpus-based Korean Text-To-Speech)

  • 권오일;홍문기;강선미;신지영
    • 음성과학
    • /
    • 제9권3호
    • /
    • pp.25-34
    • /
    • 2002
  • One of the most important factor in the performance of Korean text-to-speech system is the prediction of accentual and intonational phrase boundary. The previous method of prediction shows only the 75-85% which is not proper in the practical and commercial system. Therefore, more accurate prediction must be needed in the practical system. In this study, we propose the simple and more accurate method of the prediction of AP, IP.

  • PDF

Local Similarity based Document Layout Analysis using Improved ARLSA

  • Kim, Gwangbok;Kim, SooHyung;Na, InSeop
    • International Journal of Contents
    • /
    • 제11권2호
    • /
    • pp.15-19
    • /
    • 2015
  • In this paper, we propose an efficient document layout analysis algorithm that includes table detection. Typical methods of document layout analysis use the height and gap between words or columns. To correspond to the various styles and sizes of documents, we propose an algorithm that uses the mean value of the distance transform representing thickness and compare with components in the local area. With this algorithm, we combine a table detection algorithm using the same feature as that of the text classifier. Table candidates, separators, and big components are isolated from the image using Connected Component Analysis (CCA) and distance transform. The key idea of text classification is that the characteristics of the text parallel components that have a similar thickness and height. In order to estimate local similarity, we detect a text region using an adaptive searching window size. An improved adaptive run-length smoothing algorithm (ARLSA) was proposed to create the proper boundary of a text zone and non-text zone. Results from experiments on the ICDAR2009 page segmentation competition test set and our dataset demonstrate the superiority of our dataset through f-measure comparison with other algorithms.

섭입경계에서의 마그마 형성에 대한 고등학교 「과학」 교과서 분석 (Analysis of High School 「science」 Textbook on the Magma Formation in the Subduction Boundary)

  • 박경은;안건상;임동일
    • 한국지구과학회지
    • /
    • 제25권4호
    • /
    • pp.222-231
    • /
    • 2004
  • 본 연구에서는 제7차 교육과정에 의해 편찬된 21종의 과학 교과서와 지도서에 나타난 섭입경계에서의 마그마 형성 관련 내용에 대한 본문 진술과 제시된 그림들을 분석하여 문제점을 지적하고 그 개선방안을 모색하였다. 분석 결과 교과서간 마그마의 정의에 일관성이 없었으며, 대부분의 교과서에서 마그마의 생성기원에 관한 과학적 개념 진술이 정확하지 않거나 기재되지 않았다. 또한 교과서에 제시된 그림들은 본문 내용과 일치하지 않았으며, 판구조론과 섭입경계에서의 화성활동에 대한 학생들의 과학적 개념형성에 부족하고 잘못된 내용을 포함하고 있다. 이들은 주로 마그마의 생성기작(형성과정), 기원물질, 생성위치와 관련된 것들로서, 본 연구에서는 최근에 발표된 연구결과들을 바탕으로 섭입경계에서 분출되는 대부분의 중성마그마가 쐐기맨틀의 부분용융에 의해 형성된다는 사실을 종합적으로 이해할 수 있는 적절한 개념도를 제시하였다.

운율구 경계현상 분석 및 텍스트에서의 운율구 추출 (Analysis and Prediction of Prosodic Phrage Boundary)

  • 김상훈;성철재;이정철
    • 한국음향학회지
    • /
    • 제16권1호
    • /
    • pp.24-32
    • /
    • 1997
  • 이 논문에서는 첫 번째로 운율구 경계를 자동으로 추출하고자 할 때 인간의 지각과 관련하여 어떠한 자질을 이용하는 것이 좋은가 하는 점을 밝혀 보았다. 운율구 경계의 유형은 크게 경계가 없는 강도(zero), 약한 경계 강도(minor break strength), 강한 경계 강도(major break strength) 3 단계로 정하는 것이 통계적으로 의의가 있으며 지속시간의 정보가 강한 경계 유형의 결정에 중요하게 작용하는 자질이었음을 알 수 있었다. 두 번째로는 운율구 경계현상 분석결과를 바탕으로 운율구 경계의 경계 강도를 약한 경계 강도(zero를 포함)와 강한 경계 강도로 나누고, 2단계의 경계 강도를 텍스트상에서 문장성분의 bigram, trigram을 정보를 이용하여 자동으로 할당하였다. Bigram의 경우 Test-I, Test-II 텍스트 DB에 대해 각각 46.0%, 38.2%의 강한 경계 강도 예측정확률과 22.8%, 8.4%의 삽입오류율의 성능을 내었으며, Trigram인 경우 Test-I, Test-II 텍스트 DB 각각에 대해 58.3%, 42.8%의 강한 경계 강도 예측정확률과 30.0%, 11.8%의 삽입오류율를 나타냈다.

  • PDF

일본어 TTS의 가변 Break를 이용한 합성단위 선택 방법 (A Unit Selection Methods using Variable Break in a Japanese TTS)

  • 나덕수;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.983-984
    • /
    • 2008
  • This paper proposes a variable break that can offset prediction error as well as a pre-selection methods, based on the variable break, for enhanced unit selection. In Japanese, a sentence consists of several APs (Accentual phrases) and MPs (Major phrases), and the breaks between these phrases must predicted to realize text-to-speech systems. An MP also consists of several APs and plays a decisive role in making synthetic speech natural and understandable because short pauses appear at its boundary. The variable break is defined as a break that is able to change easily from an AP to an MP boundary, or from an MP to an AP boundary. Using CART (Classification and Regression Trees), the variable break is modeled stochastically, and then we pre-select candidate units in the unit-selection process. As the experimental results show, it was possible to complement a break prediction error and improve the naturalness of synthetic speech.

  • PDF

Image Comparison Using Directional Expansion Operation

  • Yoo, Suk Won
    • International Journal of Advanced Culture Technology
    • /
    • 제6권3호
    • /
    • pp.173-177
    • /
    • 2018
  • Masks are generated by adding different fonts of learning data characters in pixel unit, and pixel values belonging to each of the masks are divided into 3 groups. Using the directional expansion operators, we expand the text area of the test data character into 4 diagonal directions in order to create the boundary areas to distinguish it from the background area. A mask with a minimum average discordance is selected as the final recognition result by calculating the degree of discordance between the expanded test data and the masks. Image comparison using directional expansion operations more accurately recognizes test data through 4 subdivided recognition processes. It is also possible to expand the ranges of 3 groups of pixel values of masks more evenly such that new fonts can easily be added to the given learning data.

문자열 검출을 위한 슬라브 영역 추정 (Slab Region Localization for Text Extraction using SIFT Features)

  • 최종현;최성후;윤종필;구근휘;김상우
    • 전기학회논문지
    • /
    • 제58권5호
    • /
    • pp.1025-1034
    • /
    • 2009
  • In steel making production line, steel slabs are given a unique identification number. This identification number, Slab management number(SMN), gives information about the use of the slab. Identification of SMN has been done by humans for several years, but this is expensive and not accurate and it has been a heavy burden on the workers. Consequently, to improve efficiency, automatic recognition system is desirable. Generally, a recognition system consists of text localization, text extraction, character segmentation, and character recognition. For exact SMN identification, all the stage of the recognition system must be successful. In particular, the text localization is great important stage and difficult to process. However, because of many text-like patterns in a complex background and high fuzziness between the slab and background, directly extracting text region is difficult to process. If the slab region including SMN can be detected precisely, text localization algorithm will be able to be developed on the more simple method and the processing time of the overall recognition system will be reduced. This paper describes about the slab region localization using SIFT(Scale Invariant Feature Transform) features in the image. First, SIFT algorithm is applied the captured background and slab image, then features of two images are matched by Nearest Neighbor(NN) algorithm. However, correct matching rate can be low when two images are matched. Thus, to remove incorrect match between the features of two images, geometric locations of the matched two feature points are used. Finally, search rectangle method is performed in correct matching features, and then the top boundary and side boundaries of the slab region are determined. For this processes, we can reduce search region for extraction of SMN from the slab image. Most cases, to extract text region, search region is heuristically fixed [1][2]. However, the proposed algorithm is more analytic than other algorithms, because the search region is not fixed and the slab region is searched in the whole image. Experimental results show that the proposed algorithm has a good performance.