• 제목/요약/키워드: 문장형태 정보

검색결과 270건 처리시간 0.028초

이중대격에 대한 자율모듈적 분석 (An Autonomous Modular Account of Double Accusatives)

  • 김경환
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.74-82
    • /
    • 2022
  • 본 논문은 문장의 통사구조, 의미구조, 형태구조 등을 동시에 그리고 독립적으로 생성되는 모듈로 보는 자율어휘문법을 기반으로 한국어의 이중대격에 대한 다모듈적 분석을 제시하는 것을 목적으로 한다. 통사중심주의적 이론들과 달리 본 논문은 이중대격 구문의 기능-논항구조와 더불어 역할구조와 정보구조를 통해 이중대격에 대한 의미론적 특성을 분석한다. 기능-논항구조에서 이중대격의 첫 번째 대격은 관계명사의 논항인 소유격과는 달리 술어의 논항이 되며, 역할구조에서는 수동자의 역할을 취하게 되어 그 결과 수동문의 주어가 될 수 있다. 반면에 이중대격 구문에서 두 번째 대격인 소유대상은 정보구조에서 초점영역이 된다. 즉, 이중대격의 사용 목적은 두 가지로 정리된다. 소유자를 수동자의 역할을 하는 독립된 논항으로 표현하는 동시에 소유대상을 초점으로 표현하고자 하는 화자의 의도를 나타내는 것이다. 이와 같은 이중대격의 의미론적 특성을 자율어휘문법의 기능-논항구조, 역할구조, 정보구조 등 세 개의 다차원적인 구조로 나타내므로 해서 이중대격에 대한 통합적 설명이 가능해진다.

해안지형분류표준화 동향에 관한 연구 - 환경정보표준 ISO/IEC211 18025 자료와 국내분류체계 비교

  • 장은미;박경;서종철
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2001년도 학술회의 논문집
    • /
    • pp.275-286
    • /
    • 2001
  • 습지 분류의 목표는 '목록작성(inventory)과 평가와 관리를 위해 자연적인 생태계에 범위를 설정하는 것'이다. 또한 등질적인 속성을 갖는 생태단위를 기술하고, 자원관리 의사결정에 도움을 줄 수 있는 체계로 단위를 만들어내고, 목록작성과 지도화에 필요한 단위를 제공하면, 습지에 관한 개념과 용어의 통일성을 제공하는 것 등이다. 해안지형 가운데 해안 습지의 분류에는 우선, 1) 형태, 2) 생성요인, 3) 자갈, 모래, 펄 같은 기질 물질과 4)현재의 환경이라는 요소가 모두 고려되어야만 하는데 아직 국내에는 이에 대한 연구가 절대적으로 부족하여 이에 대한 규정이 부족한 현실이다. 따라서 현 단계에서 ISO/IEC 규정대로 각 코드는 엄밀히 상호배타적인 개념일 것, 정수로 표시할 것과 순차적으로 증가하는 숫자로 표시할 것 등의 전제조건을 만족시키는 전제 하에서 해안습지를 분류하는 것은 매우 힘든 작업이라 생각한다. 하지만 국토공간의 효율적 관리와 보존을 위해서는 위치와 장소에 따라 차이를 보이는 지질, 지형, 토양, 식생, 수리 현상 등 제반 지표 환경요소에 대한 체계화된 정보의 축척이 있어야 가능하다. 우리나라의 경우 지질 정보는 지질자원연구원에서 발행하는 지질도와, 농촌진흥청에서 발행하는 토양도, 임업연구원에서 발행하는 임상도 등의 주제도가 있으나, 지표환경을 나타내주는 지형에 대한 정보체계는 아직 이루러진 바가 없고, 대학의 석사학위논문이나, 실험적인 수준의 연구에 머물고 있는 실정이다. 이번 연구에서는 지형분류도 작성과 관련한 외국의 사례를 집중적으로 분석하고, 지형정보의 체계적 관리를 위해 가장 필요한 해안습지 지형분류도를 작성하기 위해 가장 기초적인 단계인 해안습지 지형분류체계에 대한 국내외의 연구성과를 비교하여 시안을 작성 표준화를 위한 첫 단계 시도를 소개하였다.분석 결과는 문장, 그림 및 도표, 장 끝의 질문, 학생의 학습 활동 수 등이 $0.4{\sim}1.5$ 사이의 값으로 학생 참여를 적절히 유도하는 발견 지향적 인 것으로 조사되었다. 그러나 장의 요약은 본문 내용을 반복하는 내용으로 구성되었다. 이와 같이 공통과학 과목은 새로운 현대 사회에 부응하는 교과 목표와 체계를 지향하고 있지만 아직도 통합과학으로서의 내용과 체계를 완전히 갖추고 있지 못할 뿐만 아니라 현재 사용되고 있는 7종의 교과서가 교육 목표를 충분히 반영하지 못하고 있다. 따라서 교사의 역할이 더욱더 중요하게 되었다.괴리가 작아진다. 이 결과에 따르면 위탁증거금의 징수는 그 제도의 취지에 부합되고 있다. 다만 제도운용상의 이유이거나 혹은 우리나라 주식시장의 투자자들이 비합리적인 투자형태를 보임에 따라 그 정책적 효과는 때로 역기능적인 결과로 초래하였다. 그럼에도 불구하고 이 연구결과를 통하여 최소한 주식시장(株式市場)에서 위탁증거금제도는 그 제도적 의의가 여전히 있다는 사실이 확인되었다. 또한 우리나라 주식시장에서 통상 과열투기 행위가 빈번히 일어나 주식시장을 교란시킴으로써 건전한 투자풍토조성에 저해된다는 저간의 우려가 매우 커왔으나 표본 기간동안에 대하여 실증분석을 한 결과 주식시장 전체적으로 볼 때 주가변동율(株價變動率), 특히 초과주가변동율(超過株價變動率)에 미치는 영향이 그다지 심각한 정도는 아니었으며 오히려 우리나라의 주식시장은 미국시장에 비해 주가가 비교적 안정적인 수준을 유지해 왔다고 볼 수 있다.36.4%)와 외식을 선호(29.1%)${\lrcorner}$ 하기 때문에 패스트푸드를 이용하게 된 것으로 응답 하였으며, 남 여 대학생간에는 유의한 차이(p<0.05)가 인정되었다. 응답자의 체형은 ${\ulcorner}$

  • PDF

교육용 과학언어 연구를 위한 범용 자료로서 과학교과서 말뭉치 K-STeC(Korean Science Textbook Corpus) 구축 (Building Korean Science Textbook Corpus (K-STeC) for research of Scientific Language in Education)

  • 윤은정;김진호;남길임;송현주;옥철영;최준;박윤배
    • 한국과학교육학회지
    • /
    • 제38권4호
    • /
    • pp.575-585
    • /
    • 2018
  • 본 연구에서는 과학교육에서 그 동안 주목받지 못했던 과학언어 및 과학용어에 대한 연구를 체계적으로 수행하기 위한 목적으로 지난 20년간의 과학교과서 텍스트를 한 자리에 모아 과학교과서 말뭉치를 구축함으로써 다각도로 분석 가능한 형태의 언어 자원을 생성하였다. 말뭉치 구축 대상 자료는 6차 교육과정, 7차 교육과정, 2009 개정교육과정의 초등학교에서부터 고등학교까지 모든 과학교과서를 수집하고 이 가운데 두 개의 출판사에 해당하는 132권에 대한 말뭉치를 구축하였다. 원시말뭉치, 형태주석 말뭉치, 용어주석 말뭉치의 총 3단계로 구축하였다. 최종적으로 구축된 과학교과서 말뭉치를 K-STeC(Korea - Science Textbook Corpus)이라 명명하였다. K-STeC은 과학용어에 대한 의미 구분과 분야가 표지된 의미 주석 말뭉치로서 교육과정, 과목, 학년, 출판사의 서지 정보와 대단원, 중단원, 소단원의 단원 정보, 페이지, 문장번호의 위치 정보와 함께 본문, 탐구활동, 참고자료, 제목 등의 텍스트 구조 정보를 메타정보로 마크업 하였다. 총 3년여에 걸친 연구 기간 동안 언어정보학, 컴퓨터공학, 과학교육학의 세 분야 전문가들의 노하우를 융합하여 새로운 연구 방법을 창출하였고, 다수의 전문 인력들이 투입되어 노동집약적 결과물을 내었다. 본 원고에서는 전체적인 연구 절차와 방법을 조망함으로써 새로운 연구 방법론 및 결과물을 소개하고 향후 과학언어 연구의 발전 가능성 및 결과물의 활용방안에 대해 논의하였다.

A Comparative Study on Requirements Analysis Techniques using Natural Language Processing and Machine Learning

  • Cho, Byung-Sun;Lee, Seok-Won
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권7호
    • /
    • pp.27-37
    • /
    • 2020
  • 본 연구의 목적은 다양한 도메인에 대한 소프트웨어 요구사항 명세서로부터 수집된 요구사항을 데이터로 활용하여 데이터 중심적 접근법(Data-driven Approach)의 연구를 통해 요구사항을 분류한다. 이 과정에서 기존 요구사항의 특징과 정보를 바탕으로 다양한 자연어처리를 이용한 데이터 전처리와 기계학습 모델을 통해 요구사항을 기능적 요구사항과 비기능적 요구사항으로 분류하고 각 조합의 결과를 제시한다. 그 결과로, 요구사항을 분류하는 과정에서, 자연어처리를 이용한 데이터 전처리에서는 어간 추출과 불용어제거와 같은 토큰의 개수와 종류를 감소하여 데이터의 희소성을 좀 더 밀집형태로 변형하는 데이터 전처리보다는 단어 빈도수와 역문서 빈도수를 기반으로 단어의 가중치를 계산하는 데이터 전처리가 다른 전처리보다 좋은 결과를 도출할 수 있었다. 이를 통해, 모든 단어를 고려하여 가중치 값은 기계학습에서 긍정적인 요인을 볼 수 있고 오히려 문장에서 의미 없는 단어를 제거하는 불용어 제거는 부정적인 요소로 확인할 수 있었다.

문자출력 무선호출기를 위한 음성인식 시스템 (Speech Recognition in the Pager System displaying Defined Sentences)

  • 박규붕;박전규;서상원;황두성;김현빈;한문성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.158-162
    • /
    • 1996
  • 본 논문에서는 문자출력이 가능한 무선호출기에 음성인식 기술을 접목한, 특성화된 한 음성인식 시스템에 대하여 설명하고자 한다. 시스템 동작 과정은, 일단 호출자가 음성인식 서버와 접속하게 되면 서버는 호출자의 자연스런 입력음성을 인식, 그 결과를 문장 형태로 피호출자의 호출기 단말기에 출력시키는 방식으로 되어 있다. 본 시스템에서는 통계적 음성인식 기법을 도입하여, 각 단어를 연속 HMM으로 모델링하였다. 가우시안 혼합 확률밀도함수를 사용하는 각 모델은 전통적인 HMM 학습법들 중의 하나인 Baum-Welch 알고리듬에 의해 학습되고 인식시에는 이들에 비터비 빔 탐색을 적용하여 최선의 결과를 얻도록 한다. MFCC와 파워를 혼용한 26 차원 특징벡터를 각 프레임으로부터 추출하여, 최종적으로, 83 개의 도메인 어휘들 및 무음과 같은 특수어휘들에 대한 모델링을 완성하게 된다. 여기에 구문론적 기능과 의미론적 기능을 함께 수행하는 FSN을 결합시켜 자연발화음성에 대한 연속음성인식 시스템을 구성한다. 본문에서는 이상의 사항들 외에도 음성 데이터베이스, 레이블링 등과 갈이 시스템 성능과 직결되는 시스템의 외적 요소들에 대해 고찰하고, 시스템에 구현되어 있는 다양한 특성들에 대해 밝히며, 실험 결과 및 앞으로의 개선 방향 등에 대해 논의하기로 한다.

  • PDF

트리 구조를 이용한 수식 인식 연구 (A Study on Equation Recognition Using Tree Structure)

  • 박병준;김현식;김완태
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.340-345
    • /
    • 2018
  • 수식은 일반 문장에 비해 복잡한 구조와 다양한 문자와 기호가 사용되어 단순한 키보드 입력만으로는 모든 문자 집합을 입력할 수 없어 한글이나 워드 같은 문서편집기 내에서도 자체적으로 구현된 수식 편집기를 사용하고 있다. 수식을 올바르게 표현하기 위해 구문을 해석할 수 있는 의미가 될 수 있는 사전 학습 정보가 필요하다. 문자가 입력되더라도 크기와 위치 서로간의 관계에 따라 다른 수식으로 표현될 수 있기 때문이다. 즉 표현될 위치와 크기 등 문자와 기호들 간의 상호관계를 고려하여 수식의 형태를 트리 모델로 표현한다. 문자인식 응용의 한 분야로 문자나 기호(부호)를 인식하는 기술을 이미 널리 알려졌지만, 수식을 입력과 해석하는 방법은 일반적인 텍스트에 비해 복잡한 분석 과정이 필요하다. 본 논문에서는 수식의 문자를 인식하고 표현되는 위치와 크기의 결정을 빠르게 해석하는 수식 인식기를 구현하였다.

신조어의 의미 학습을 위한 딥러닝 기반 표적 마스킹 기법 (Deep Learning-based Target Masking Scheme for Understanding Meaning of Newly Coined Words)

  • 남건민;서수민;곽기영;김남규
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.391-394
    • /
    • 2021
  • 최근 딥러닝(Deep Learning)을 활용하여 텍스트로 표현된 단어나 문장의 의미를 파악하기 위한 다양한 연구가 활발하게 수행되고 있다. 하지만, 딥러닝을 통해 특정 도메인에서 사용되는 언어를 이해하기 위해서는 해당 도메인의 충분한 데이터에 대해 오랜 시간 학습이 수행되어야 한다는 어려움이 있다. 이러한 어려움을 극복하고자, 최근에는 방대한 양의 데이터에 대한 학습 결과인 사전 학습 언어 모델(Pre-trained Language Model)을 다른 도메인의 학습에 적용하는 방법이 딥러닝 연구에서 많이 사용되고 있다. 이들 접근법은 사전 학습을 통해 단어의 일반적인 의미를 학습하고, 이후에 단어가 특정 도메인에서 갖는 의미를 파악하기 위해 추가적인 학습을 진행한다. 추가 학습에는 일반적으로 대표적인 사전 학습 언어 모델인 BERT의 MLM(Masked Language Model)이 다시 사용되며, 마스크(Mask) 되지 않은 단어들의 의미로부터 마스크 된 단어의 의미를 추론하는 형태로 학습이 이루어진다. 따라서 사전 학습을 통해 의미가 파악되어 있는 단어들이 마스크 되지 않고, 신조어와 같이 의미가 알려져 있지 않은 단어들이 마스크 되는 비율이 높을수록 단어 의미의 학습이 정확하게 이루어지게 된다. 하지만 기존의 MLM은 무작위로 마스크 대상 단어를 선정하므로, 사전 학습을 통해 의미가 파악된 단어와 사전 학습에 포함되지 않아 의미 파악이 이루어지지 않은 신조어가 별도의 구분 없이 마스크에 포함된다. 따라서 본 연구에서는 사전 학습에 포함되지 않았던 신조어에 대해서만 집중적으로 마스킹(Masking)을 수행하는 방안을 제시한다. 이를 통해 신조어의 의미 학습이 더욱 정확하게 이루어질 수 있고, 궁극적으로 이러한 학습 결과를 활용한 후속 분석의 품질도 향상시킬 수 있을 것으로 기대한다. 영화 정보 제공 사이트인 N사로부터 영화 댓글 12만 건을 수집하여 실험을 수행한 결과, 제안하는 신조어 표적 마스킹(NTM: Newly Coined Words Target Masking)이 기존의 무작위 마스킹에 비해 감성 분석의 정확도 측면에서 우수한 성능을 보임을 확인하였다.

  • PDF

수학적 모폴로지의 경계치 변화에 의한 도시환경 지형지물 추출 및 분리응용

  • 오세경;이기원
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2004년도 국내 LBS 기술개발 및 표준화 동향세미나
    • /
    • pp.139-143
    • /
    • 2004
  • 최근 고 해상도 위성영상정보의 민간 활용에 대한 수요가 증가하면서 기존의 공간 정보를 다루는 여러 응용분야에서 이에 관련된 많은 연구를 하고 있다. 도시교통 환경 분석을 위하여 위성영상정보를 처리하는 과정에 있어서 도로, 건물, 기타 선 구조와 같은 지형지물을 분석하는 과정은 사용자에 따라 주관적일 수 있다. 이러한 배경에서 수학적 그레이 레벨 모폴로지는 하나의 효과적인 접근으로 간주된다. 본 연구에서 지형지물 추출을 위해 윈도우 운영체제에서 실행되는 실질적인 응용 프로그램을 구현하였다. 이 프로그램에서 주요한 지형지물은 그레이 레벨 영상을 이용하여 개방(opening), 폐쇄(closing), 침식(erosion), 팽창(dilation)의 순차적 처리를 통하여 자동적으로 추출된다. 결과적으로, GDPA, 허프 변환 또는 다른 알고리듬들과 비교시 하나의 이점이 된다. 모폴로지 처리와 같이 본 프로그램은 그레이 레벨 값의 범위에 기반하여 지형지물을 추출을 위한 density slicing 기능 또는 주어진 경계치 보다 작은 화소 군집을 제거하는 처리인 'sieve filtering'을 제공한다. 이러한 기능들은 형태학적으로 처리된 결과를 증대하고 지형지물 종류들을 분리하는데 유용하다. 또한 배경의 제거, 잡음 탐지, 도시 환경 원격 탐사에서의 지형지물 특성화에 기여한다. 본 프로그램을 이용하는데 있어서 IKONOS 위성영상을 이용하여 시험 구현하였다. 결과, 다중 경계치 또는 steve filtering을 이용한 그레이 레벨 모폴로지 처리는 복잡한 지형지물과 많은 데이터로 구성된 고해상도 영상 내의 주어진 대상에서 자동적인 처리와 사용자 정의 sieve filtering으로 인한 효과적인 지형지물 추출 방법으로 간주 된다. 시안을 작성 표준화를 위한 첫 단계 시도를 소개하였다.분석 결과는 문장, 그림 및 도표, 장 끝의 질문, 학생의 학습 활동 수 등이 $0.4{\sim}1.5$ 사이의 값으로 학생 참여를 적절히 유도하는 발견 지향적 인 것으로 조사되었다. 그러나 장의 요약은 본문 내용을 반복하는 내용으로 구성되었다. 이와 같이 공통과학 과목은 새로운 현대 사회에 부응하는 교과 목표와 체계를 지향하고 있지만 아직도 통합과학으로서의 내용과 체계를 완전히 갖추고 있지 못할 뿐만 아니라 현재 사용되고 있는 7종의 교과서가 교육 목표를 충분히 반영하지 못하고 있다. 따라서 교사의 역할이 더욱더 중요하게 되었다.괴리가 작아진다. 이 결과에 따르면 위탁증거금의 징수는 그 제도의 취지에 부합되고 있다. 다만 제도운용상의 이유이거나 혹은 우리나라 주식시장의 투자자들이 비합리적인 투자형태를 보임에 따라 그 정책적 효과는 때로 역기능적인 결과로 초래하였다. 그럼에도 불구하고 이 연구결과를 통하여 최소한 주식시장(株式市場)에서 위탁증거금제도는 그 제도적 의의가 여전히 있다는 사실이 확인되었다. 또한 우리나라 주식시장에서 통상 과열투기 행위가 빈번히 일어나 주식시장을 교란시킴으로써 건전한 투자풍토조성에 저해된다는 저간의 우려가 매우 커왔으나 표본 기간동안에 대하여 실증분석을 한 결과 주식시장 전체적으로 볼 때 주가변동율(株價變動率), 특히 초과주가변동율(超過株價變動率)에 미치는 영향이 그다지 심각한 정도는 아니었으며 오히려 우리나라의 주식시장은 미국시장에 비해 주가가 비교적 안정적인 수준을 유지해 왔다고 볼 수 있다.36.4%)와 외식을 선호(29.1%)${\lrcorner}$ 하기 때문에 패스트푸드를 이용하게 된 것으로 응답 하였으며,

  • PDF

웹기반 청각장애인용 수화 웹페이지 제작 시스템 (Web-based Text-To-Sign Language Translating System)

  • 박성욱;왕보현
    • 한국지능시스템학회논문지
    • /
    • 제24권3호
    • /
    • pp.265-270
    • /
    • 2014
  • 소리가 잘 들리지 않는 청각장애인은 소리를 표시하는 글자를 익히고 복잡한 개념을 전달하는 글을 이해하는 데 어려움이 많다. 그래서 자연스럽게 표정, 몸짓, 손짓으로 의사를 전달하는 수화가 청각장애인들의 주요 의사소통수단으로 자리잡아왔지만 사회에서는 글과 말이 주요 정보전달 수단으로 이용되고 있어 청각장애인이 정보에 접근하고 지식을 넓혀 직업을 갖는데 큰 어려움이 있다. 특히 근래에 인터넷이 보편화됨에 따라 정상인의 정보 습득량은 크게 늘었지만, 글로 표현된 인터넷을 이해하기 어려운 청각장인들은 인터넷 정보에 접근하는데 어려움이 많다. 본 연구에서는 청각장애인을 위한 수화 웹페이지를 제작할 수 있는 수화 웹페이지 제작시스템을 개발하였다. 수화 웹페이지 제작 시스템은 청각장애인용 수화 웹페이지 제작자가 통상적인 인터넷 사용에 필요한 하드웨어 및 소프트웨어 환경만 갖추면 운영할 수 있도록 웹기반으로 개발하였다. 수화용 웹 페이지 제작자는 게시판 형태의 인터페이스를 이용하여 변역하고자하는 문장을 서버에 전송할 수 있다. 서버는 수신된 문장을 수화로 번역하여 3D 아바타 기반의 수화 그래픽 애니메이션을 랜더링한다. 수화 그래픽 애니메이션은 MP4 형식의 동영상으로 변환되며, 스트리밍 서버의 저장소에 보관된다. 저장된 수화 동영상의 이름과 주소는 수화 웹페이지 제작자가 처음 문장을 입력하였던 게시판에 표시되도록 하여 향후 청각장애인용 웹 페이지를 제작할 때 활용할 수 있도록 하였다. 또한 본 연구에서는 웹페이지 제작자가 공공기관의 웹페이지를 제작할 수 있도록, 이들 기관에서 현재 사용된 글들을 수화로 번역할 때 필요한 수화 단어를 수화 웹페이지 제작 시스템의 수화 사전에 추가하였다. 수화 단어를 추가함으로써 웹기반 수화 웹페이지 제작 시스템이 공공부문에 보다 더 많이 활용될 수 있을 것이다.

온라인 커뮤니티에서 사용되는 댓글의 형태를 고려한 악플 탐지를 위한 전처리 기법 (Preprocessing Technique for Malicious Comments Detection Considering the Form of Comments Used in the Online Community)

  • 김해수;김미희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권3호
    • /
    • pp.103-110
    • /
    • 2023
  • 인터넷이 보급되면서 사람들 간의 소통을 위한 커뮤니티가 활성화됨과 함께 익명 커뮤니티가 나타났고 익명성을 이용한 공격적인 게시글, 댓글을 남기는 등 타인에게 피해를 주는 행위를 하는 이용자가 많아지고 있다. 과거에는 관리자가 직접 글과 댓글을 확인하며 삭제 및 차단했지만, 커뮤니티 이용자가 늘어나면서 관리자가 계속 감시할 수 없는 수준에 이르렀다. 초기에는 특정 단어가 포함되면 해당 글을 게시하거나 댓글을 달 수 없는 형태로 악의적인 글이 게시되는 것을 막는 단어 필터링 기법을 사용하였으나 유사한 단어를 사용하는 등 우회하는 형식으로 필터링을 피해 갔다. 이를 해결하는 방법으로 딥러닝을 이용하여 실시간으로 이용자들이 게시하는 글들을 감시하였으나 최근 커뮤니티에서는 해당 커뮤니티에서만 이해할 수 있는 단어를 사용하거나 일반적인 한글이 아닌 인간의 시야에서만 이해할 수 있는 문자를 사용하고 있다. 이들이 사용하는 문자의 종류나 형태가 다양하여 인공지능 모델에 모든 것을 학습시키기에 어려움이 있다. 이에 본 논문에서는 한글의 자음과 모음 띄어쓰기 이미지를 학습시킨 CNN 모델을 이용해서 문장의 각 문자를 이미지화해 인간의 시야에서만 이해할 수 있는 문자를 모델이 예측한 문자로 변환하는 전처리 기법을 제안한다. 실험 결과, 제안한 전처리 기법을 통해 LSTM, BiLSTM, CNN-BiLSTM 모델에서의 성능이 각각 3.2%, 3.3%, 4.88% 증가함을 확인했다.