• 제목/요약/키워드: 이름 인식

검색결과 157건 처리시간 0.022초

미등록 이름 명사 인식 밑 성별 구분 (Unregistered Human Names Recognition and Sex Distinction)

  • 강유환;고병일;서영훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.919-921
    • /
    • 2004
  • 본 논문은 사람 이름의 특성을 이용한 이름 인식과 이름의 성별 구분 방법에 대해 제안한다 사랑 이름을 묻는 질의문은 질의-응답 시스템에서 자주 나타난다. 모든 사람 이름을 사전에 등록하는 것은 어렵다. 경우에 따라서는 남녀 이름을 구분할 필요가 있다. 한국 사람 이름의 특성은 주로 3음절로 이루어져 있고. 성씨로 사용되는 음절의 수가 제한적이라는 것이다. 또한 이름에는 한자 독음이 많이 쓰이고, 남자 이름으로 자주 쓰이는 음절과 절자 이름으로 자주 쓰이는 음절이 있다. 이러한 특성을 이용하여 사람 이름 인식과 성별 구분을 수행한다. 일반 웹 문서에서의 실험 결과, 이름 인식의 정확률은 94%를 보였고, 남녀 이름 구분의 정확률은 98%를 보였다.

  • PDF

미등록어 처리가 강화된 복합명사 분해 (Compound Noun Analysis Strengthened Unknown Noun Processing)

  • 김응균;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-46
    • /
    • 2003
  • 본 논문에서는 분해 패턴을 이용한 재사용 분해 알고리즘과 외래어 인식, 이름 명사 인식, 지명 인식에 의한 미등록어 추정을 이용한 복합명사 분해 방법을 제안한다. 재사용 분해 알고리즘은 현재 분해되는 음절보다 짧은 길이의 음절에서 사용된 분해 방법을 재사용하여 분해가 이루어짐을 의미한다. 외래어 인식에서는 한국어 음절에서 비교적 사용 빈도가 낮은 음절들로 외래어가 구성이 됨을 이용한다. 이름 명사는 한국인의 이름 특성에서 한자 독음을 차용하여 작명이 이루어지기 때문에 일정한 수의 음절이 반복적으로 사용되는 점을 이용하여 인식한다. 지명 인식 방법은 지명이 출현하는 패턴을 분석하여 지명 사전의 검색으로 인식한다. 이와 같이 지명 사전에 의한 지명 인식과 알고리즘에 의한 외래어 및 이름 명사 인식 방법을 사용함으로써 미등록어 추정에 정확성을 높이고 분해 정확율 향상에 기여한다. 실험 결과 미등록어가 포함된 약 1,500어절에 대해 약 98%의 정확율이 나타났고, 미등록어가 사전에 모두 등재된 후의 실험에서는 약 99%의 정확율을 보였다.

  • PDF

HTTP Host를 이용한 웹 어플리케이션 인식에 관한 연구 (Web Application Awareness using HTTP Host)

  • 최지혁;김명섭
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권8호
    • /
    • pp.327-334
    • /
    • 2013
  • 네트워크의 고속화와 다양한 응용 서비스의 등장으로 오늘날의 네트워크 트래픽은 복잡해지고 다양해졌다. 지금 이 순간에도 수 많은 응용들이 나타나고 사라지기를 반복하고 있는데, 이러한 다양한 트래픽의 변화에 현재의 트래픽 분류 시스템은 빠르게 대처 하지 못하고 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 새롭게 출현하는 응용에 빠르게 대처할 수 있는 응용 인식 시스템을 제안한다. 응용 인식 시스템은 빠르게 변화하는 네트워크 환경에서 응용프로그램들의 이름을 인식하여 새로운 응용의 출현과 기존 응용의 변화 추이 등의 정보를 제공한다. 본 논문에서 빠르고 정확한 응용 인식을 위해 HTTP 프로토콜의 Host 필드를 이용한다. Host 필드의 domain정보를 추출하여 응용의 이름을 임시로 정하고 추후 관리자의 개입을 통해 응용의 이름을 확정 짓는 구조이다. 단순히 응용의 이름만을 알아내는데 그치지 않고 응용마다 고유의 Client IP를 카운팅하여 분석 대상 망에서 많이 사용된 응용들을 알아 낼 수 있다. 또한 응용 인식을 통해 나온 응용들을 트래픽 분류 시스템에 등록하여 기존에 분석 되지 않았던 새로운 응용들에 대한 분석도 가능하게 된다. 제안한 방법은 학내 망에서의 실험을 통해 결과를 도출하고 시나리오 별로 결과를 나눠서 분석함으로써 타당성을 증명하였다.

이미지 추상화 기법을 이용한 반려견 이름 추천 시스템 개발 (Development of Dog Name Recommendation System for the Image Abstraction)

  • 이재헌;정예린;문미경;박승민
    • 한국전자통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.313-320
    • /
    • 2023
  • 반려견의 등록 누계 현황은 2016년도 107만건에서 2020년 232만건을 기록하고 있다. 매년 동물 등록이 10% 이상씩 증가하고 있고, 이에 따라 반려견을 등록 할 때 이름을 정해야 한다. 반려견 외모의 특징에 맞는 이름을 지어주고 싶지만, 이름을 정하는 것은 많은 어려움이 있다. 본 논문에서는 반려견의 이미지를 인식하고 닮은 사물이나 음식을 기반으로 반려견의 이름을 추천해주는 시스템의 개발 내용을 기술한다. 이 시스템은 다양한 사물과 음식의 이미지를 학습한 모델을 통해 반려견의 이미지와의 유사도를 추출하고, 유사도를 기반으로 강아지의 이름을 추천해준다. 또한 결과값으로 나온 이미지 데이터를 기반으로 연관된 연상단어를 추가로 추천해줌으로써 사용자들에게 다양한 선택지를 제공하고 편의를 높이고 흥미와 재미를 높일 수 있다. 본 시스템을 통해 반려견의 이름을 짓는 고민거리를 해결하고 편하게 반려견에게 어울리는 이름을 확인할 수 있으며, 다양한 추천 이름을 통해 폭넓은 선택지를 줌으로써 사용자들의 만족도를 높일 수 있을 것으로 기대한다.

성인의 이름매력도가 자기효능감과 정서에 미치는 영향 (The Effect of Adult's Name Attractiveness on Self-efficiency and Emotionality)

  • 김기승;함혜수;나혁진
    • 산업진흥연구
    • /
    • 제5권1호
    • /
    • pp.99-106
    • /
    • 2020
  • 본 연구는 성인 남녀의 이름매력도가 자기효능감과 정서인식에 미치는 영향을 분석하기 위하여 실시하였다. 연구의 대상자는 수도권에 거주하는 10대부터 30대까지 남녀 300명을 모집단으로 하였다. 수집과정에서 누락된 설문지와 회수된 설문지 중 불성실한 설문지를 제외한 250부를 분석에 활용하였다. 변인에 따른 이름매력도의 차이를 분석한 결과 연령대와 학력이 낮을수록 자기 이름에 대해서 불만족이 높은 것으로 나타났다. 또한, 이름매력도가 자기효능감에 미치는 영향을 검증하기 위하여 실시한 회귀분석의 결과, 모형의 적합도는 R2=.382로 모형의 설명력은 다소 떨어지지만, β=.322, t값이 9.276, p<.001로 나타나 통계적 유의성이 있는 것으로 나타났다. 즉, 이름의 매력도는 자기효능감에 직접적인 영향을 미친다는 것을 알 수 있다. 그리고 이름매력도가 정서인식에 미치는 영향을 검증하기 위하여 실시한 회귀분석의 결과 R2=.412로 나타나 모형의 설명력은 41.2%를 보였다. 성별, 연령, 학력 등 인구 통계적 변인을 통제하고 실시한 회귀분석의 결과 β=.326, t값이 6.408, p<.001로 나타나 통계적 유의성이 있는 것으로 나타났다. 즉, 이름의 매력도는 정서인식에 영향을 미친다고 볼 수 있다. 이름의 매력도가 행복이나 삶의 질을 높일 수 있다는 실증연구는 아직 없다. 그러나 개명을 통해서 과거보다 좋아졌다는 이야기는 운동선수들 사이에서는 자주 볼 수 있다.

음성정보 내용분석을 통한 골프 동영상에서의 선수별 이벤트 구간 검색 (Retrieval of Player Event in Golf Videos Using Spoken Content Analysis)

  • 김형국
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.674-679
    • /
    • 2009
  • 본 논문은 골프 동영상에 포함된 오디오 정보로부터 검출된 이벤트 사운드 구간과 골프 선수이름이 포함된 음성구간을 결합하여 선수별 이벤트 구간을 검색하는 방식을 제안한다. 전체적인 시스템은 동영상으로부터 분할된 오디오 스트림으로부터 잡음제거, 오디오 구간분할, 음성 인식 등의 과정을 통한 자동색인 모듈과 사용자가 텍스트로 입력한 선수 이름을 발음열로 변환하고, 색인된 데이터베이스에서 질의된 선수 이름과 상응하는 음성구간과 연결되는 이벤트 구간을 찾아주는 검색 모듈로 구성된다. 선수이름 검색을 위해서 본 논문에서는 음소 기반, 단어 기반, 단어와 음소를 결합한 하이브리드 방식을 적용한 선수별 이벤트 구간 검색결과를 비교하였다.

바다 이름의 국제적 표준화 사례와 동해 표기 정당화에의 시사점 (The Cases of International Standardization of Sea Names and Their Implications for Justifying the Name East Sea)

  • 주성재
    • 대한지리학회지
    • /
    • 제42권5호
    • /
    • pp.745-760
    • /
    • 2007
  • 이 연구는 국제적으로 표준화된 바다 이름을 그 기원에 따라 분류하고 분석하는 것을 목적으로 한다. 특히 국가명을 사용하는 바다 이름과 두 개의 이름을 병기하는 경우에 주목하여 동해-일본해 이름을 둘러싼 논리를 평가하고자 한다. '해양과 바다의 경계' 책자에 수록된 98개 바다의 110개 이름을 분석한 결과, 인근 지리적 실체의 이름을 사용하는 경우가 가장 많으며, 다음으로 개인 이름, 방위, 바다의 특성 등이 사용된 것을 알 수 있다. 이러한 다양한 기원의 바다 이름은 해양을 나누는 열도나 반도의 이름을 사용하는 것이 일반적인 원칙이라고 하는 일본의 주장과 배치된다. 여러 국가에 접하고 있는 바다가 한 국가 이름을 사용하면서도 심각한 분쟁이 없는 경우가 많은 것은 단일 국가의 이름을 사용하는 것이 부당하다는 네거티브 방식의 주장보다는 동해 명칭의 강력한 상징성을 강조하는 것이 더 바람직하다는 시사점을 준다. 병기의 필요성을 정당화하기 위해서는 최근 병기가 결정된 세 개의 사례로부터 해당 지역과 명칭의 역사적 배경, 인식, 관련 국가의 세력 구조, 병기의 과정 등의 측면에서 시사점을 찾는 것이 중요하다. 동해에 유라시아의 동쪽이라는 의미를 부여하기 위해서는 극동지역에 대한 서양인들의 인식에 대한 연구가 선행되어야 함이 지적된다.

조선시대의 갑주(甲胄) - 명칭과 종류를 중심으로 -

  • 박가영;남윤자;조우현
    • 한국복식학회:학술대회논문집
    • /
    • 한국복식학회 2003년도 춘계학술대회
    • /
    • pp.20-20
    • /
    • 2003
  • 특정한 사물에 대한 인식의 폭을 넓히기 위해서는 먼저 명칭을 살펴볼 필요가 있다. 언어란 사회 구성원 사이의 약속이기에 하나의 사물에 여러 가지 이름이 동시에 존재할 수 있고 그중 어떤 이름으로 불러도 동시대 사람들은 동일한 사물을 떠올리게 된다. 이와 같이 문헌에 기재된 많은 명칭들 중에는 동일한 형식의 갑옷과 투구임에도 불구하고 시대에 따라, 또는 세부적인 특징의 차이에 따라 다른 이름으로 불리웠던 갑주가 있을 가능성이 있다.

  • PDF

실용영어에서 고유명사 일치를 위한 자료구조 (Efficient Data Structures of Coreference Resolution for Proper Names)

  • 김종선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.207-209
    • /
    • 1998
  • 고유명사가 문장속에서 다시 언급될때는 여러 가지 변형된 형태로 나타난다. 즉 같은 의미의 이름으로 사용되면서 서로 다른 이름 형태를 갖게 된다. 이러한 경향은 coreference 처리를 어렵게 만든다. 본 논문에서는 고유명사의 coreference와 의미상으로 인식되지 않은 고유명사의 식별에 이용될 수 있는 효율적인 자료구조를 제시한다.

  • PDF

기계학습 알고리즘에 근거한 단백질 이름의 자동 추출 (A Machine Learning Approach for Automatic Protein Name Extraction from Journal Articles)

  • 김정호;백은옥;이공주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.259-261
    • /
    • 2004
  • 생물학 분야의 문헌으로부터 유전자 및 단백질 이름을 추출하는 기술은 바이오 텍스트 마이닝 분야의 기반 기술로 그 중요성이 점차 증대되고 있다. 이 연구에서는 생물학 분야 문헌의 초록으로부터 하나의 토큰으로 구성된 single gene name은 물론 여러 개의 토큰으로 이루어진 multi gene name까지 유전자나 단백질의 이름을 자동으로 추출하는 시스템 TagGeN(Tagger for Gene Name)을 제안한다. TagGeN은 기존의 태거와 달리, 문자나 숫자 이외의 기호를 포함한 유전자나 단백질 이름의 품사 처리에 있어 개선 방안을 제시하고, 여러 토큰으로 이루어진 이름의 인식에 있어 나란한 두 토큰이 갖는 태그 정보를 이용한 조건부 확률에 근거하여 Markov 모델을 도입한다. 위와 같은 개선방안을 구현한 TagGeN은 성능면에서 기존의 유사시스템에 비해 recall 20.8%, precision 4.7%의 성능향상을 보임으로써 본 연구에서 제안한 방법론의 효과를 입증한다.

  • PDF