• 제목/요약/키워드: 후처리분석

검색결과 252건 처리시간 0.031초

상향식 계층분류의 최적화 된 병합을 위한 후처리분석과 피드백 알고리즘 (Reinforcement Post-Processing and Feedback Algorithm for Optimal Combination in Bottom-Up Hierarchical Classification)

  • 최윤정;박승수
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.139-148
    • /
    • 2010
  • 본 논문은 자동화된 분류시스템의 성능향상을 위한 것으로 오분류율이 높은 불확실성이 강한 문서들의 범주결정방식을 개선하기 위한 후처리분석 방법과 피드백 알고리즘을 제안한다. 전통적인 분류시스템에서 분류의 정확성을 결정하는 요인으로 학습방법과 분류모델, 그리고 데이터의 특성을 들 수 있다. 특성들이 일부 공유되어 있거나 다의적인 특성들이 풍부한 문서들의 분류문제는 정형화된 데이터들에서 보다 심화된 분석과정이 요구된다. 특히 단순히 최상위 항목으로 지정하는 기존의 결정방법이 분류의 정확도를 저하시키는 직접적인 요인이 되므로 학습방법의 개선과 함께 분류모델을 적용한 이후의 결과 값인 순위정보 리스트의 관계를 분석하는 작업이 필요하다. 본 연구에서는 경계범주의 자동탐색기법으로 확장된 학습체계를 제안한 이전 연구의 후속작업으로써, 최종 범주를 결정하기까지의 후처리분석 방법과 이전의 학습단계로 피드백하여 신뢰성을 높일 수 있는 알고리즘을 제안하고 있다. 실험결과에서는 제안된 범주결정방식을 적용한 후 1회의 피드백을 수행하였을 때의 결과들을 단계적이고 종합적으로 분석함으로써 본 연구의 타당성과 정확성을 보인다.

위성 상태 데이터의 고속 후처리 기술 동향 (Trends of High Speed Satellite Offline Telemetry Processing)

  • 강지훈;구인회;안상일
    • 항공우주산업기술동향
    • /
    • 제8권2호
    • /
    • pp.15-23
    • /
    • 2010
  • 본 논문에서는 최근에 개발된 위성 데이터 후처리 시스템의 동향에 대해 기술 하고자 한다. 위성 데이터 후처리 시스템은 위성의 텔레메트리를 분석하고 위성의 상태를 파악하는데 사용되는 시스템으로 빠른 처리속도, 데이터 도시화, 사용의 용이성, 그리고 범용성의 요구사항을 갖는다. 본 논문에서는 이러한 요구사항을 만족시키기 위해 여러 위성 데이터 후처리 시스템이 어떻게 설계되고 구현되었는지를 살펴본다.

  • PDF

불용어 시소러스를 이용한 비정형 텍스트 데이터 후처리 방법론에 관한 연구 (A Study on Unstructured text data Post-processing Methodology using Stopword Thesaurus)

  • 이원조
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.935-940
    • /
    • 2023
  • 인공지능과 빅데이터 분석을 위해 웹 스크래핑으로 수집된 대부분의 텍스트 데이터들은 일반적으로 대용량이고 비정형이기 때문에 빅데이터 분석을 위해서는 정제과정이 요구된다. 그 과정은 휴리스틱 전처리 정제단계와 후처리 머시인 정제단계를 통해서 분석이 가능한 정형 데이터가 된다. 따라서 본 연구에서는 후처리 머시인 정제과정에서 한국어 딕셔너리와 불용어 딕셔너리를 이용하여 워드크라우드 분석을 위한 빈도분석을 위해 어휘들을 추출하게 되는데 이 과정에서 제거되지 않은 불용어를 효율적으로 제거하기 위한 "사용자 정의 불용어 시소러스" 적용에 대한 방법론을 제안하고 R의 워드클라우드 기법으로 기존의 "불용어 딕셔너리" 방법의 문제점을 보완하기 위해 제안된 "사용자 정의 불용어 시소러스" 기법을 이용한 사례분석을 통해서 제안된 정제방법의 장단점을 비교 검증하여 제시하고 제안된 방법론의 실무적용에 대한 효용성을 제안한다.

한국어 Lexicon에 의존한 문자 인식의 후처리 (A Postprocessing of Character Recognition Based on Korean Lexicon)

  • 임한규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.371-377
    • /
    • 1993
  • 본 논문에서는 문자 인식이 끝난 한국어 원문에 대해 한국어 Lexicon에 기반을 둔 후처리의 구현을 보여주는 것을 목적으로 한다. 빈번하게 오인식되는 음절에 대해 이의 옳은 음절을 대응시킨 테이블을 만들어 놓고, 오인식이라고 정의된 음절이 출현했을 때는 이를 원래의 옳은 음절로 대체시킨 어절과 오인식된 음절이 포함된 어절에 대해 한국어 형태소 분석을 행함으로써, 올바른 형태소가 분석될 경우, 이를 옳은 음절로 간주한다. 실험결과 약 90%에서 95%에 달하는 인식율이 이 후처리 방법에 의해서 95%에서 99%로 높아졌다.

  • PDF

충주댐 유역의 미래 댐 계절유입량 전망의 불확실성 평가 (Uncertainty Analysis of Projection for Future Seasonal Dam inflow in Chungju Dam Basin)

  • 이문환;배덕효
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.37-37
    • /
    • 2016
  • 기후변화는 댐유입량의 시공간적 변화를 야기할 것으로 전망된다. 따라서 기후변화에 따른 댐 유입량의 영향을 정량적으로 평가하고 그에 적응할 수 있는 댐 운영 방안이 필요하지만 영향평가 시 많은 불확실성이 발생하기 때문에 불확실성을 정량적으로 평가할 수 있는 기술 개발이 요구된다. 본 연구에서는 기후변화에 따른 댐 유입량 전망 시 발생하는 불확실성을 평가 단계별로 분해할 수 있는 기법을 이용하여 계절별 댐 유입량 전망 결과의 불확실성을 평가하였다. 이를 위해 현재 국내에서 가용한 CORDEX East Asia에서 제공하고 있는 5개 RCM 결과를 이용하였으며, 5가지 통계적 후처리기법, 2가지 수문모형을 이용하였다. 대상지역은 충주댐 유역으로 선정하였으며, 계절 댐 유입량에 대한 과거기간 대비 미래기간의 전망 결과에 대해 분석하였다. 평가결과, 겨울철을 제외한 모든 계절에서 RCM이 29.3~68.9%로 가장 큰 비중을 차지하는 것으로 나타났으며, 겨울철은 수문모형이 46.5%를 차지하는 것으로 나타났다. 이는 홍수기의 댐 유입량은 강수량에 직접적인 영향을 받으나 이수기에는 강수량 이외에 그 당시의 토양상태, 기후환경 등의 영향에 따른 수문순환 전반적인 영향이 물가용성에 영향을 미친다. 따라서 이수기는 수문모형에 더욱 영향이 큰 것으로 나타났으며, 홍수기는 기후 모델링 부분의 영향이 큰 것으로 사료된다. 이러한 분석을 통해 특정 RCM이나 통계적 후처리기법, 수문모형 등의 선정에 따라 전체 불확실성에 미치는 영향을 분석할 수 있으며, 이를 통해 불확실성을 저감할 수 있는 방안을 마련할 수 있을 것으로 기대된다.

  • PDF

유전체 데이터의 유래(Provenance) 관리를 위한 메타데이터의 설계 (Design of Metadata for Provenance Management of Genome Data)

  • 송명선;장재우;엄정호;최동훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1195-1198
    • /
    • 2011
  • 최근 의료 분야에 대한 관심이 높아짐에 따라 유전체 데이터를 수집하고 관리하여 분석하는 기술에 대한 많은 연구가 수행되고 있다. 유전체 데이터는 크게 유전체 데이터를 분석하는 전처리단계와 유전체 데이터로부터 변이된 유전체 데이터를 생성하는 후처리단계를 통해 분석된다. 이러한 분석 과정은 많은 시간이 소요되며, 후처리단계에서 결과 데이터는 분석 알고리즘 및 처리 기법에 따라 상이한 결과 데이터를 생성한다. 또한, 유전체 데이터의 각 파이프라인 별 분석된 데이터의 관리가 필요하다. 본 논문에서는 유전체 데이터의 특성을 고려하여, 유전체 데이터 유래 관리를 위한 메타데이터를 설계한다. 아울러 데이터 유래 메타데이터는 자신의 이전데이터들의 결과데이터에 신속한 접근이 가능해야하며, 자신과 유사한 데이터 유래를 지닌 파이프라인의 상세 정보를 신속하게 검색하는 색인구조가 필요하다. 따라서 이를 고려한 유래 메타데이터 검색 알고리즘을 설계한다.

전해동박 후처리 공정변화가 미치는 표면조도 변화에 관한 연구 (A study on the surface roughness of ED copper foil by changing the treatment process)

  • 조차제;김상겸;김정익
    • 한국재료학회:학술대회논문집
    • /
    • 한국재료학회 2003년도 춘계학술발표강연 및 논문개요집
    • /
    • pp.23-23
    • /
    • 2003
  • PCB 회로기판용 전해동박은 드럼형태의 음극 표면에 연속적으로 전기 도금한 후 벗겨내어 권취하는 원박 제조공정과 접착성, 내열성, 내화학성, 방청성을 부여하기 위한 후처리 공정으로 나눈다. 이 후처리 공정 중 동박과 수지와의 접착성을 부여하기 위해 일반적으로 전기도금을 통해 조화(Nodule)처리를 실시하는데, 최근 LCD, PDP 등의 평판 디스플레이 장치의 구동칩이 실장되는 TCP용 동박의 경우 2$\mu\textrm{m}$이하의 낮은 조도(Rz)와 함께 높은 접착강도(Peel Strength)가 요구되고 있다. 그러나, Reel to Reel 형태의 연속도금공정으로 진행되는 조화처리에 있어 일반 비이커 실험결과는 실제 양산공정과의 재현성에 있어서 상당한 제한성이 노출된 바 있다. 이에 본 연구에서는 Reel to Reel 형태의 연속도금공정을 모사 할 수 있는 실험장치를 설계, 제작하여 동박표면의 노듈형성에 있어 주요인자를 정량적으로 분석하였다.

  • PDF

후처리 DGPS측량의 기준점 분석에 따른 해양지리정보시스템 적용 (Application of Marine Geographic Information System Using Analysis of Control Points in Postprocessing DGPS Surveying)

  • 김진영;장용구;강인준
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2004년도 GIS/RS 공동 춘계학술대회 논문집
    • /
    • pp.499-505
    • /
    • 2004
  • 현재 국내에서 활발히 이루어지고 있는 GPS 정밀측지측량은 획득된 GPS 관측값의 결과값이 GPS 기준점의 기하학적 강도와 분산계수의 상관관계의 연관성과의 분석없이 사용되고 있는 문제점을 파악하고 육지와 해상의 통합지리정보시스템구축을 위한 수치지도와 전자해도의 통합투영의 필요성에 의해서 이루어졌다. 본 연구의 목적은 크게 GPS 관측값의 정밀도를 향상시키는 방법과 수치지도와 전자해도의 통합투영으로 GPS 기준점들을 이용한 수치지도와 전자해도상의 경계선 오차량을 비교검토를 통해 수치지도와 전자해도의 통합관리의 방향을 제시하는데 있다. GPS 관측값의 정밀도 향상을 위한 방법제시를 위하여 GPS 망조정에 사용되는 3점의 기준점에 대한 기하학적인 강도에 따른 정밀도 분석방법과 분산계수의 변화에 따른 GPS 관측값들의 정밀도 분석방법으로 나누어 검토하였다.

  • PDF

담화 정보를 이용한 음성 인식 후처리 (Post Correction of Speech Recognition using Discourse Information)

  • 김주희;강상우;선충녕;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.147-151
    • /
    • 2010
  • 본 연구는 대화 시스템에서 처리되는 사용자 발화의 의도 분석 기법과 담화 정보를 사용하여 음성 인식 결과로서의 인식 후보 문장들을 재순위하는 방법을 제안한다. 담화 정보는 사용자 발화의 의도 분석에 매우 중요한 자질로 사용되고 있기 때문에 음성 인식 결과들의 후보를 선택하는 문제에서도 담화 정보는 매우 중요한 자질로 사용될 수 있다. 음성 인식 결과의 후보 문장들을 모두 의도 분석 과정을 거치고 각각의 후보 의도들과 이전 담화 정보의 연관성을 이용하여 음성 인식 결과를 재순위화 한다. 실험을 통하여 재순위 과정을 수행한 결과 1순위 음성 인식 결과는 재순위 과정을 거치지 않는 결과에 비해 7.08%의 오류 감소율을 보였다.

  • PDF

어휘별 분류기를 이용한 한국어 품사 부착의 성능 향상 (Improving Korean Part-of-Speech Tagging Using The Lexical Specific Classifier)

  • 최원종;이도길;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.133-139
    • /
    • 2006
  • 한국어 형태소 분석 및 품사 부착을 위해 지금까지 다양한 모델들이 제안이 되었으며 어절단위 평가로 95%를 넘는 성능을 보여주는 자동 태거가 보고 되었다. 하지만 형태소 분석 및 품사 부착은 모든 자연어처리 시스템의 성능에 큰 영향을 미치므로 작은 오류도 중요하다. 본 연구에서는 대상 어절의 주변 형태소의 어휘와 품사 자질, 그리고 어절 자질을 이용하여 분류기를 학습한 후 자동 태거의 품사 부착 결과를 입력으로 받아 후처리 하는 어휘별 분류기를 제안한다. 실험 결과 어휘별 분류기를 이용한 후처리만으로 어절단위 평가 6.86%$(95.251%{\rightarrow}95.577%)$의 오류가 감소하는 성능향상을 얻었으며, 기존에 제안된 품사별 자질을 이용한 후처리 방법과 순차 결합할 경우 16.91%$(95.251%{\rightarrow}96.054%)$의 오류가 감소하는 성능 향상을 얻을 수 있었다. 특히 본 논문에서 제안하는 방법은 형태소 어휘까지 정정할 수 있기 때문에 품사별 자질을 이용한 후처리 방법의 성능을 더욱 향상시킬 수 있다.

  • PDF