• Title/Summary/Keyword: 부분 후 분류

Search Result 362, Processing Time 0.027 seconds

Korean Text Classification Using Randomforest and XGBoost Focusing on Seoul Metropolitan Civil Complaint Data (RandomForest와 XGBoost를 활용한 한국어 텍스트 분류: 서울특별시 응답소 민원 데이터를 중심으로)

  • Ha, Ji-Eun;Shin, Hyun-Chul;Lee, Zoon-Ky
    • The Journal of Bigdata
    • /
    • v.2 no.2
    • /
    • pp.95-104
    • /
    • 2017
  • In 2014, Seoul Metropolitan Government launched a response service aimed at responding promptly to civil complaints. The complaints received are categorized based on their content and sent to the department in charge. If this part can be automated, the time and labor costs will be reduced. In this study, we collected 17,700 cases of complaints for 7 years from June 1, 2010 to May 31, 2017. We compared the XGBoost with RandomForest and confirmed the suitability of Korean text classification. As a result, the accuracy of XGBoost compared to RandomForest is generally high. The accuracy of RandomForest was unstable after upsampling and downsampling using the same sample, while XGBoost showed stable overall accuracy.

  • PDF

Handwritten Korean Word Recognition for Address Recognition (주소 인식 시스템을 위한 필기 한글 단어 인식)

  • 권진욱;이관용;변혜란;이일병
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1997.11a
    • /
    • pp.201-204
    • /
    • 1997
  • 최근 주소를 자동으로 인식하여 우편물 분류와 같은 업무를 효과적으로 수행하기 위한 연구가 진행되고 있다. 기존 연구들은 낱자 단위의 인식을 수행한 후 사전 형태의 간단한 DB를 통해 최종의 결과를 생성한다. 그러나 한글과 같은 복잡한 구조의 필기 문자에 대한 인식기의 성능은 아직도 미흡한 상태이다. 따라서 낱자 인식기의 성능에 의존하는 현재와 같은 방법으로는 만족할 만한 결과를 얻기가 힘들 것으로 생각된다. 본 논문에서는 낱자 인식 결과에 크게 의존하지 않고 주소에 나타나는 단어의 낱자들 사이간 연결 정보를 이용하여 단어를 인식할 수 있는 시스템을 제안한다. 본 시스템은 통계적 인식기를 사용하여 낱자를 인식하는 부분과 낱자 인식 결과를 조합하여 단어 수준의 인식과정을 통해 최종의 결과를 생성하는 부분으로 구성된다. 통계적 인식기는 Nearest neighborhood 방법을 사용하여 간단한 형태로 구현하였다. 단어인식 모듈은 단어에서 모든 문자간의 관계를 표현할 수 있도록 HMM 모형을 사용하여 어휘정보 네트워크를 구성하고 이를 이용하여 주소에 나타나는 단어를 인식하도록 하였다. PE92 한글 문자 데이터를 이용하여 실험을 수 璿\ulcorner 결과, 통계적 인식기의 성능이 저조함에도 불구하고 HMM을 이용한 어휘정보 네트워크가 이를 보완함으로써 좋은 결과를 얻었다. 이러한 단어 인식 방법을 주소 이외의 다른 단어 집합에 대해서도 쉽게 적용될 수 있을 것으로 예상된다.

  • PDF

Consolidation Characteristics of Mixed Soil (혼합토의 압밀 특성)

  • Yoon, Hyun-Suk;Lee, Ki-Ho;Park, Jun-Boum
    • Proceedings of the Korean Geotechical Society Conference
    • /
    • 2003.03a
    • /
    • pp.211-216
    • /
    • 2003
  • 굴폐각은 굴양식 후 남는 것으로 남해안에서 주로 집중적으로 발생하는데 연간 28만톤의 발생량 중 상당양은 폐기물로 계속 누적되고 혹은 불법매립되어 환경오염 문제까지 발생시키고 있다. 본 연구에서는 산업폐기물로 분류되는 굴패각을 지반공학 분야에서 활용하기 위한 대안으로 해성점토와 혼합하여 매립재료로써의 적용성을 평가하기 위하여 대형 압밀기를 이용하여 실험을 실시하고 이를 토대로 기초자료를 획득하고자 하였다. 원형의 굴패각을 파쇄하여 입도별로 분류하고 이중 사질토 입경 크기의 재료에 대한 기본 물성치를 평가하고 지반 재료로써의 적용성를 분석하였다. 해성점토 내의 굴패각입자의 혼합비를 변화시켜 만들어진 혼합토에 대한 압밀 실험 결과 굴패각의 혼합율이 증가할수록 체적변화율이 작게 되고, 침하 속도는 빠르게 증가함을 알 수 있었다. 이는 압밀응력의 일부를 굴패각 입자의 골격구조가 부담함으로써 실제 점토부분에 작용하는 압밀응력은 굴패각 혼합율이 증가할수록 작아지는 것으로 판단된다.

  • PDF

Fragile Watermarking for Integrity and Authentication (인증과 무결성을 위한 연성 워터마킹)

  • Lee, Hye-Ran;Park, Ji-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10b
    • /
    • pp.875-878
    • /
    • 2001
  • 본 논문에서는 디지털 영상의 변조를 확인함과 동시에 변조의 위치를 확인하는 연성 워터마킹(fragile watermarking)을 위하여 DCT를 통해 블록의 에너지를 계산한 후, 에너지의 단계별로 워터마크의 삽입량을 조절하는 방법을 제안한다. 디지털 영상의 소유권 확인을 위해 디지털 서명을 사용하며, 영상에 DCT를 수행함으로서 모든 픽셀에 워터마크를 삽입하지 않고서도 변조의 유무를 확인하는 것이 가능하 방식이다. DCT 계수로 각 블록의 에너지를 계산하여 블록의 관계를 분류하며 에너지가 작은 블록들과 큰 블록들은 이간의 시각에 민감한 부분이므로 워터마크의 삽입 양을 줄이고, 중간 단계의 블록일수록 워터마크의 삽입 양을 늘린다. 에너지의 단계 분류에 의해 가변적으로 워터마크를 삽입함으로 워터마크의 비가시성과 연성을 만족시키며 변조의 유무와 위치를 확인할 수 있게 된다.

  • PDF

Design of word prediction system for Assistive Communication System (통신보조기기용 어휘 예측 시스템의 구조)

  • 황인정;김효진;이은주;민홍기
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2000.08a
    • /
    • pp.169-172
    • /
    • 2000
  • 본 연구에서는 청각장애인용 통신보조기기에 적용하기 위한 어휘예측 시스템의 기본구조를 제안한다. 통신보조기기의 어휘는 사용자의 환경을 고려한 어휘이므로, 어휘 예측 시스템도 사용자의 환경과 실생활에서 쉽게 이용할 수 있는 방향으로 고안되어야 한다. 따라서 어휘예측 시스템은 사용자의 환경을 정의하고, 중심어휘와 장소별 도메인에서의 어휘를 발췌한다. 발췌된 어휘는 말뭉치와 의미함축의 원리를 이용하여 분류한다. 분류된 어휘는 문법적 지식을 바탕으로 가상 네트워크를 구성한다. 가상네트워크에서의 어휘는 명사, 조사, 동사의 3부분으로 나눈 후 의미함축과 말뭉치로부터 파생된 어휘를 근접한 거리에 위치시킨다. 동일한 네트워크상에서 어휘의 위치는 문법적 연관성, 빈도수 등을 이용하여 정한다. 따라서 본 연구에서는 어휘예측은 명사, 조사, 동사에서 가장 근접한 어휘를 연결하여 간단한 문장을 작성할 수 있는 어휘 예측 시스템의 기본구조를 제안한다.

  • PDF

Automatic Image Classification Web Service using Deep Neural Network (Deep Neural Network를 이용한 사진 자동 분류 웹 서비스)

  • Kwon, Yong-Hoon;Kim, Sang-Yun;Choi, Dong-Yun;Chae, Yi-Geun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.791-794
    • /
    • 2015
  • 최근 정보화 시대에 들어 개인 사진을 SNS 및 클라우드 서비스에 업로드 한다. 하지만 각각의 사진 데이터만 클라우드 및 SNS에 업로드 되며 사진 검색에 있어 불편한 부분이 많다. 따라서 사진에 태그 분류 서비스 및 카테고리를 자동으로 부여해 업로드를 완료한 후 자동 사진 정리 및 사진 검색의 편리함을 도모하고자 한다.

An Experimental Study on the Classification of landcover Materials by Hyperspectral image Division (실험수로 초분광영상을 통한 하상재료 분류 실험연구)

  • Kim, Ji Hyun;Kang, Jun Koo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.49-49
    • /
    • 2019
  • 국내의 하천생태계의 다양성 확보를 위한 유역 단위 하천환경 개선에 대한 관심은 꾸준히 증가하고 있는 추세이다. 하천환경 조사와 관리차원에서 적극적인 투자와 노력이 필요하며 이를 위해서는 현 상태를 확인하고 판단하는 것이 매우 중요한 부분이다. 초분광 영상은 하천의 하상재료, 수심 및 식생분포와는 관련 없는 고유의 분광정보 특성을 포함하고 있다. 본 연구는 한국건설기술연구원의 안동 하천실험센터의 실험수로에서 하천에서 흔히 볼 수 있는 대표적인 하상재료를 분포시켜 초분광영상과 RGB 영상자료를 취득한 후 각각의 하상재료의 특성에 대해 분석하였다. 실험수로는 폭 0.9 m, 길이 10 m수로에 모래, 큰돌, 흰자갈, 갈대, 식생 5가지 종류를 좌우, 상하대칭으로 분포시켰으며, 수심에 따라 취득된 영상정보의 특성값이 얼마나 변경되는지에 대해 파악하였다. 본 연구를 통해 하천의 다양한 하상재료에 대한 구분과 수리조건에 따른 분광정보의 왜곡, 계절별 식생특성 파악 및 분류에 대한 결과를 확인할 수 있을 것으로 판단된다.

  • PDF

A STUDY ON THE SOIL HARDNESS FLUCTUATION OF GREEN SPACE (녹지공간별 토양경도변화에 관한 연구)

  • 서주환;우궁유;김상범
    • Journal of the Korean Institute of Landscape Architecture
    • /
    • v.24 no.4
    • /
    • pp.74-84
    • /
    • 1997
  • 최근. 급격한 도시화 현상으로 인한 불투성 지표의 증가는 도시의 생태적 측면에 변화를 일으키고 있으며, 도시의 온난화 현상. 도시의 사막화 현상 등이 그 결과로 나타나고 있다. 특히, 분투수성 지표가 많은 도시에서는 그 수문학적 기능이 투수성 지표에 의존하고 있으며, 도시의 투수성 지표에는 오픈 스페이스와 주변의 생산녹지 등이 있다 이러한 관점에서 투수성 지표에 관한 연구가 필요함에도 불구하고 많지 않았고, 대부분 포인트별 연구였다. 본 연구는 도시 내의 수문기능 환경변화개선에 관한 기초자료로 동경의 대표적 도시공원인 코카네이 (소금정) 공원과 동경 근교의 치바현 (천엽현)위치한 치바(천엽)대학 부속 카시와 (상) 농장을 대상지로 선정 토양환경기능의 간접적 지표가 되는 토양경도를 나카야마식(산중식) 토양경도 계륵 사용하여 5120 Cm의 라인위에 10 Cm간격으로 512개씩 코카네이(소금정) 공원에서 9라인. 카시와(상) 농장에서 7라인을 공간별로 측정하고. 그 측정값을 다중비교검정과 Bartlett's 검정에 의하여 검정후에, 랜덤 데이타분석에 적합한 FFT(Fast Fourier Transform)를 사용하여 분석하였다 본 연구의 측정값을 다중비교검정과 Bartlett's 검정한 결과, 유의타가 없었고, 각 데이터를 분석한 결과. 공원의 9라인과 농장의 7라인은 분석 그래프의 유형에 의해 각각 2가지로 분류되었고, 전체적으로는 3가지로 분류할 수 있었다 특히 공원과 농장의 분석 그래프에서는 수평 방향으로의 변화에 대한 수직방향의 변화가 비슷한 스펙트럼이 공통적으로 나타났고. 각각 최대 값은 다르나 제1주기 부분에서는 답압과 같은 인위적인 요인에 의한 논은 수직방향의 스펙트럼 변화가 관찰되었다. 또한, 강우가 녹지의 경도변화에 미치는 가를 관찰하기 위하여 강우전과 강우후에 같은 라인(Line1과 Line2)을 측정하여 분석한 결과, 측정값의 평균에서는 차이를 보였으나. 주기의 변화는 거의 없었다. 전체적으로 분석 그래프에서는 공간별로 스펙트럼의 수평방향에 대한 수직방향의 변화량의 차이는 보였으나 비슷한 주기를 나타냈고, 가작의 유형은 공원의 녹지공간(lawn-area)과 나지공간(bare-area)으로, 농장을 녹지공간(lawn-area)과 경작공간(field-area)으로 분류할 수있었다. 종합적으로 녹지를 지질학적 구조의 고유한 특징이 아닌. 답압 등과 같은 인위적인 요인에 따른 속성들에 의하여 나타나는 스펙트럼의 분석을 통하여 녹지공간(lawn-area). 나지공간(bare-area)그리고, 경작공간(field-area)으로 분류할 수 있었다..

  • PDF

Text Verification Based on Sub-Image Matching (부분 영상 매칭에 기반한 텍스트 검증)

  • Son Hwa Jeong;Jeong Seon Hwa;Kim Soo Hyung
    • The KIPS Transactions:PartB
    • /
    • v.12B no.2 s.98
    • /
    • pp.115-122
    • /
    • 2005
  • The sub-mage matching problem in which one image contains some part of the other image, has been mostly investigated on natural images. In this paper, we propose two sub-image matching techniques: mesh-based method and correlation-based method, that are efficiently used to match text images. Mesh-based method consists of two stages, box alignment and similarity measurement by extracting the mesh feature from the two images. Correlation-based method determines the similarity using the correlation of the two images based on FFT function. We have applied the two methods to the text verification in a postal automation system and observed that the accuracy of correlation-based method is $92.7\%$ while that of mesh-based method is $90.1\%$.

Pattern Classification Algorithm for Wrist Movements based on EMG (근전도 신호 기반 손목 움직임 패턴 분류 알고리즘에 대한 연구)

  • Cui, H.D.;Kim, Y.H.;Shim, H.M.;Yoon, K.S.;Lee, S.M.
    • Journal of rehabilitation welfare engineering & assistive technology
    • /
    • v.7 no.2
    • /
    • pp.69-74
    • /
    • 2013
  • In this paper, we propose the pattern classification algorithm of recognizing wrist movements based on electromyogram(EMG) to raise the recognition rate. We consider 30 characteristics of EMG signals wirh the root mean square(RMS) and the difference absolute standard deviation value(DASDV) for the extraction of precise features from EMG signals. To get the groups of each wrist movement, we estimated 2-dimension features. On this basis, we divide each group into two parts with mean to compare and promote the recognition rate of pattern classification effectively. For the motion classification based on EMG, the k-nearest neighbor(k-NN) is used. In this paper, the recognition rate is 92.59% and 0.84% higher than the study before.

  • PDF