• 제목/요약/키워드: 모음 열

검색결과 25건 처리시간 0.026초

집합 기반 POI 검색 알고리즘을 활용한 스팸 메시지 판별 모바일 앱 구현 (Implementation of A Mobile Application for Spam SMS Filtering Using Set-Based POI Search Algorithm)

  • 안혜영;조완지;이종우
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권5호
    • /
    • pp.815-822
    • /
    • 2015
  • 최근 스미싱 피해가 늘어남에 따라 스팸 메시지 처리를 위한 애플리케이션이 잇달아 출시되고 있다. 그러나 자음과 모음을 분리하는 등 교묘하게 내용이 조작된 스팸 메시지는 필터링하지 못 하는 경우가 대부분이다. 이를 해결하기 위해 본 논문에서는 문자 메시지 내 스팸 문자열을 검사하는 애플리케이션인 안티스팸을 구현하였다. 안티스팸은 집합 기반 POI 검색 알고리즘을 활용하여, 전송된 문자 메시지내에 스팸 문자열이 있는지 검색한 후, 검색 결과에 따라 스팸 여부를 추정한다. 또한 스팸 필터링을 피하기 위해 교묘히 위장된 스팸 메시지도 걸러준다. 사용자는 메시지를 받으면 스팸 판단 결과와 메시지 내용을 확인하고 메시지 처리방식을 선택할 수 있다.

제한된 한글 입력환경을 위한 음소기반 근사 문자열 검색 시스템 (A Phoneme-based Approximate String Searching System for Restricted Korean Character Input Environments)

  • 윤태진;조환규;정우근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권10호
    • /
    • pp.788-801
    • /
    • 2010
  • 모바일 기기가 발전함에 따라 입력 수단에 대한 연구는 중요한 이슈이다 키패드, 쿼티키패드, 터치, 음성인식 등 다양한 입력장치가 사용되고 있으나 아직 데스크톱 입력장치에 비해 편의성이 떨어져서 입력 시의 오타나 탈자 등의 오류가 포함되는 경우가 많다. 이러한 입력 오류는 문자 메시지 등 사람과의 의사소통에는 문제를 일으키지 않으나 사전, 주소록 등의 데이터베이스 검색에는 치명적인 오류로서 원하는 검색 결과를 얻지 못하게 된다. 특히 한글의 경우 자음과 모음의 조합을 통해 글자를 생성하는 특성상 1만자가 넘는 글자의 조합이 가능하여 영문에 비하여 오류의 빈도가 높다. 기존의 검색 시스템은 Suffix Tree등을 이용하여 입력 오류를 처리하지만 다양한 오류에 대응하기에는 한계가 있다. 본 논문에서는 오자, 탈자 등의 입력 오류를 허용하면서 빠른 검색이 가능한 근사 한글 단어 검색 시스템을 제안하고자 한다. 이 시스템은 기존의 알파벳에 적용된 근사 문자열 검색(Approximate String Searching)을 한글에 효과적으로 적용할 수 있는 여러 가지 알고리즘과 기법이 포함되어 있다. 그리고 제안된 시스템을 이용한 변형 욕설 필터링 시스템의 개발에 대해 이야기하고자 한다. 이 시스템은 유저의 각종 변형 욕설 입력에 대해 90% 이상의 필터링 성능을 보였다.

서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선 (Video character recognition improvement by support vector machines and regularized discriminant analysis)

  • 임수열;백장선;김민수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.689-697
    • /
    • 2010
  • 본 연구에서는 비디오이미지로부터 추출된 텍스트영역으로부터 문자인식을 수행하였다. 비디오영상으로부터 추출된 문자열은 한글, 영어, 숫자, 특수문자 등으로 혼합되어 있거나, 또는 다양한 폰트와 크기, 그래픽 형태의 글자 존재, 영상의 기울어짐, 끊김, 잡영, 접촉, 저해상도의 글자 등으로 인하여 일반적인 문자인식에 비해 많은 어려움이 존재한다. 이와 같은 어려움을 극복하기위해 본 연구에서는 모든 글자에 대해서 인식하지 않고 가장 빈번하게 등장하는 글자만을 인식하고 나머지는 버리는 방법을 사용하였으며 지지도벡터기계와 정칙화판별분석의 2단계 문자인식 방법을 이용하여 인식률을 개선하였다. 또한 인식률이 좋지 못한 4형식과 5형식 글자에 대해 모음별로 중분류를 실시하였다. 실험결과 지지도벡터기계와 정칙화판별분석을 동시에 사용하는 방법이 다른 문자인식의 방법들보다 인식률이 우수하였으며, 부분적인 중분류의 방법을 이용한 경우 향상된 인식 성능을 나타냈다.

ESP 기법을 적용한 금호강유역의 단기 유량예측 (Short-term streamflow Prediction Using ESP Method in Gumho River Basin)

  • 최현구;이을래;강신욱;이상호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.411-411
    • /
    • 2015
  • 유량예측의 가장 주된 목적은 가뭄과 홍수와 같은 수해방지를 위해 통합수자원관리를 수행하는데 있다. 이런 유량예측을 위해 다양한 기법들로 예측이 수행되고 있으며, 예측기간과 필요 정확도에 따라 초단기, 단기, 중 장기 예측 등으로 구분할 수 있다. 유량예측에 사용되는 기법들은 기후변화 시나리오와 같이 예측된 강우자료를 이용하여 유출량을 예측하는 방법이 있으며, 통계적인 방법으로 과거자료들을 활용하여 미래의 유량을 예측하는 방법이 있다. 본 연구에서는 ESP 기법을 이용하여 금호강 유역의 월 단위(30일) 유량을 예측하고자 한다. 앙상블 유량예측기법(ESP; Ensemble Streamflow Prediction)이란 현재의 유역상태를 초기조건으로 사용하고 과거의 온도나 강수 등의 시계열 앙상블을 강우-유출모형에 입력하여 유출량을 앙상블로 예측하는 기법이다. ESP는 결국 현재의 유역상태와 유역에서의 과거 강우 관측기록, 미래 강우예측에 대한 정보를 조합하여 그에 따른 유출 앙상블을 생산해내게 된다. 월 유량을 예측하기 위해서 금호강 유역의 1988년에서 2014년까지 27년간 대구, 영천, 포항 관측소의 기상자료를 수집하였으며, 금호강 표준유역에 해당하는 19개 유역으로 분할하여 모의에 이용하였다. 금호강 유역에 티센망을 적용하여 각 표준유역별로 강우량을 조합하여 2013년까지 모의에 적용하였으며, 이는 과거자료로 사용하였다. 유량예측에 사용되는 강우자료를 생성하기 위해서 26년간 일강우를 이용하였다. 예를 들어 2014년 12월을 예측한다면 11월까지 관측된 유역초기 조건을 가지는 수문모형의 12월 기상입력자료로써 현재 유역에서 발생 가능성이 있는 동일 유역의 과거 1988년부터 2013년까지의 12월 기상자료들을 사용하는 방법이다. 1988년부터 2013년까지 26개 12월 기상자료를 사용하므로 유량예측결과 또한 26개가 주워진다. 계산된 26개의 유량앙상블이 적용된 유역에서 12월에 발생 가능한 유출량의 모음이 된다. 시나리오결과를 수자원관리에 활용하기 위해서 초과확률로 분석하였으며, 이런 분석의 결과는 향후 가뭄과 홍수 같은 수해방지를 위해 수공구조물의 운영에도 활용할 수 있을 것으로 판단된다.

  • PDF

음성특징의 거리에 기반한 한국어 발음의 시각화 (Visualization of Korean Speech Based on the Distance of Acoustic Features)

  • 복거철
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권3호
    • /
    • pp.197-205
    • /
    • 2020
  • 한국어는 자음과 모음과 같은 음소 단위의 발음은 고정되어 있고 표기에 대응하는 발음은 변하지 않기 때문에 외국인 학습자가 쉽게 접근할 수 있다. 그러나 단어와 어구, 문장을 말할 때는 음절과 음절의 경계에서 소리의 변동이 다양하고 복잡하며 표기와 발음이 일치하지 않기 때문에 외국어로서의 한국어 표준 발음 학습은 어려운 면이 있다. 그러나 영어 같은 다른 언어와 달리 한국어의 표기와 발음의 관계는 논리적인 원리에 따라 예외 없이 규칙화 할 수 있는 장점이 있으므로 발음오류에 대해 체계적인 분석이 가능한 것으로 여겨진다. 본 연구에서는 오류 발음과 표준 발음의 차이를 컴퓨터 화면상의 상대적 거리로 표현하여 시각화하는 모델을 제시한다. 기존 연구에서는 발음의 특징을 단지 컬러 또는 3차원 그래픽으로 표현하거나 입과 구강의 변화하는 형태를 애니메이션으로 보여 주는 방식에 머물러 있으며 추출하는 음성의 특징도 구간의 평균과 같은 점 데이터를 이용하는데 그치고 있다. 본 연구에서는 시계열로 표현되는 음성데이터의 특성 및 구조를 요약하거나 변형하지 않고 직접 이용하는 방법을 제시한다. 이를 위해서 딥러닝 기법을 토대로 자기조직화 알고리즘과 variational autoencoder(VAE) 모델 및 마코브 확률모델을 결합한 확률적 SOM-VAE 기법을 사용하여 클러스터링 성능을 향상시켰다.