• 제목/요약/키워드: 통신어

검색결과 478건 처리시간 0.031초

사용자 선호도 분석을 통한 검색어 조합 추출 (Finding Correlated Keyword b Analyzing User's Implicit Feedback)

  • 심철우;이은주;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.229-232
    • /
    • 2008
  • 웹 정보량이 급속히 늘어나면서 원하는 정보를 효율적으로 찾는 검색 기술의 중요성이 커지고 있다. 검색의 정확성을 높이기 위해서는 검색 질의어와 함께 사용자의 환경, 검색 만족도와 같은 다양한 정보가 필요하다. 사용자의 명시적 피드백을 요구하는 것은 거부감을 줄 수 있으므로 사용자의 잠재적 피드백과 연관 검색어 분석을 통해 검색 질의어를 확장하는 연구가 이뤄지고 있다. 그러나 이러한 검색어 확장과 검색 정확성 사이의 상관관계에 대한 분석이 없어 연관 검색어를 정량적으로 평가할 수 없었다. 본 논문에서는 사용자가 검색 질의어를 변경하면서 검색을 반복하는 과정을 사용자의 잠재적 피드백의 하나로 보고 사용자 만족도를 반영하는 페이지 방문 시간과 함께 분석하여 연속적으로 입력된 검색어가 검색 결과 순위와 사용자 만족도에 미치는 영향을 분석하는 방법을 제안하였다. 마우스 클릭 정보 분석을 통하여 사용자의 검색 만족도를 정량화하였고 특정 주제어에서 관련 검색어가 확장되어 가는 과정은 트리 구조로 표현하였다. 이를 통해 하나의 주제어와 관련해 연속적으로 입력된 검색어 집합으로부터 연관검색어를 추출하고 검색 결과의 정확성을 높일 수 있으며 제안된 트리 구조를 다양한 방향으로 분석하여 검색어, 검색 결과, 사용자 만족도, 배경 지식 등 단순 검색어 분석에서는 나타나지 않는 다양한 정보를 얻을 수 있다.

컴퓨터 통신어의 어휘 유형 체계 (Lexical analysis for computer chatting language)

  • 김윤식;나동열;한경호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.396-400
    • /
    • 2004
  • 가상공간에서의 정보교류가 늘어나면서 컴퓨터 통신언어도 자연어처리의 새로운 연구 분야로 등장하였다. 가장 일상화된 컴퓨터 통신어이며 인터넷상의 실시간 대화어인 채팅언어는 신속한 정보 전달 매체의 기능과 문자언어로서 정보교류와 대화 상황을 함께 내포해야 하는 문어와 구어의 양면성을 동시에 가는 언어이다. 이러한 특수성으로 컴퓨터 통신언어의 경우 발화자의 개성에 따라한 의미의 단어도 표기법이 다양하여 어휘수가 매우 많다. 본 연구에서는 컴퓨터 통신에서 사용되는 다양한 어휘를 컴퓨터로 처리하기 위한 어휘의 유형을 체계화하는 방안을 제시한다.

  • PDF

ETRI신기술-한.일 자동번역 기술

  • 한국전자통신연구원
    • 전자통신동향분석
    • /
    • 제14권4호통권58호
    • /
    • pp.131-132
    • /
    • 1999
  • 일본어로 구성된 일본어 웹 정보를 한국어로 자동 번역하여 주는 한.일 자동 번역 시스템으로서 다중 사용자를 지원하는 서버 형태로 구현되었으며, 일본어 어휘 분석, 일-한 변환, 한국어 생성을 수행하는 번역 엔진부와 일-한 자동 번역에 필요한 한.일 자동 번역용 사전(20만 단어), 번역 규칙 등으로 구성되어 있다.

  • PDF

어라운드뷰 시스템을 위한 자동 호모그래피 변환 방법 (Automatic Homography Transformation Method for Around View System)

  • 천승환;장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.294-297
    • /
    • 2013
  • 기존 연구에서의 어라운드뷰 모니터링 시스템은 차량에 설치하는 과정에서 호모그래피 행렬 획득 시 평균점을 이용한 호모그래피 변환 방법을 사용했으나, 영상의 흐릿함과 어긋난 매핑을 개선하기 위해 전체점을 이용한 호모그래피 변환 방법이 제안되어 사용되었다. 하지만 전체점을 이용한 호모그래피 변환 방법은 수동적으로 호모그래피 행렬을 획득해야 한다. 그러나 호모그래피 행렬 획득 과정을 자동화한다면 전체점을 이용한 호모그래피 변환 방법이 가진 장점을 모두 살리면서 어라운드뷰 모니터링 시스템을 차량에 설치하는 과정이 단순해진다. 본 논문에서는 차량의 전 후방 및 좌 우측에 장착된 4대의 카메라를 입력받아 카메라 보정 및 호모그래피 변환 측정 과정을 거쳐 차량 주변 상황을 한눈에 보여주는 어라운드뷰 모니터링 시스템 중 호모그래피 변환 측정 과정을 자동화하여 전체 어라운드뷰 모니터링 시스템을 단순화하는 자동 호모그래피 변환 방법을 설명한다. 또한 제안하는 자동 호모그래피 변환 방법을 이용하여 자동화된 어라운드뷰 모니터링 시스템의 구현 가능성을 검증한다.

  • PDF

딥러닝을 이용한 한국어 어의 중의성 해소 (A Word Sense Disambiguation for Korean Language Using Deep Learning)

  • 김홍진;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.380-382
    • /
    • 2019
  • 어의 중의성 문제는 자연어 분석 과정에서 공통적으로 발생하는 문제로 한 가지의 단어 표현이 여러 의미로 해석될 수 있기 때문에 발생한다. 이를 해결하기 위한 어의 중의성 해소는 입력 문장 중 여러 개의 의미로 해석될 수 있는 단어가 현재 문맥에서 어떤 의미로 사용되었는지 분류하는 기술이다. 어의 중의성 해소는 입력 문장의 의미를 명확하게 해주어 정보검색의 성능을 향상시키는데 중요한 역할을 한다. 본 논문에서는 딥러닝을 이용하여 어의 중의성 해소를 수행하며 기존 모델의 단점을 극복하여 입력 문장에서 중의적 단어를 판별하는 작업과 그 단어의 의미를 분류하는 작업을 동시에 수행하는 모델을 제안한다.

  • PDF

통신어를 위한 채팅로봇 설계 (Design of Chatterbot for Internet Slangs)

  • 전길호;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.155-157
    • /
    • 2010
  • 채팅로봇이란 인간과 기계가 서로 대화를 하는 컴퓨터 프로그램이다. 그 목표는 나와 대화를 하고 있는 상대방이 실제 인간인 것처럼 생각하도록 하는 것이다. 오늘날도 이 목표를 달성하기 위해 많은 연구자들이 노력하고 있으며, ELIZA, Julia, ALICE, 심심이 등 많은 채팅로봇이 개발되어 일반 사용자들에게 서비스를 제공하고 있다. 하지만 현재까지 개발된 많은 종류의 채팅로봇은 대부분 단순 패턴매칭 방식을 사용하고 있으며 이는 기존에 정의된 적절한 응답을 출력하는 것에 불과하다. 본 논문에서는 인터넷을 통해서 채팅할 때 사용하는 여러 형태의 통신어를 처리할 수 있는 방법을 제시하고 입력된 문장에 대해 형태소 분석과 품사부착을 통해 문장의 구조를 파악하고 분석된 구조를 토대로 모호한 문장의 패턴을 인식하여 인식률을 높이는 형태이다. 채팅로봇은 인터넷 업계에서 단순한 대화상대뿐만 아니라 특정 주제를 가진 홈페이지 또는 각종 쇼핑몰에서 다방면으로 그 활용도가 높기 때문에 성능이 높은 채팅로봇을 제작하여 사용한다면 사용자의 편의를 향상시키는 데에 큰 도움이 될 것으로 기대된다.

  • PDF

비디오 재설정 및 3D 압축처리를 위한 어텐션 메커니즘 (Attentional mechanisms for video retargeting and 3D compressive processing)

  • 황재정
    • 한국정보통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.943-950
    • /
    • 2011
  • 이 논문에서는 2D 및 3D 영상의 어텐션량을 측정하여 정지 및 동영상의 재설정 및 압축처리 기법을 제시하였다. 2D 어텐션은 세 개의 주요 구성, 즉, 영상의 세기, 컬러 및 방향성을 고려하였으며, 3D 영상에서 깊이 정보를 고려하였다. 시각적 어텐션은 관심있고 흥미있는 영역이나 객체를 검출하기 위해 희소성을 정량화하는 기법에 의해 구하였다. 왜곡된 스테레오 영상에서 변화된 깊이 정보를 어텐션 확률에 정합시켜서 최종적으로 저위 HVS 반응을 실제 어텐션 확률과 종합하여 스테레오 왜곡 예측기를 설계하였다. 결과로 기존 모델에 비해 효과적인 어텐션 기법을 개발하였으며 이를 비디오 재설정에 적용하여 성능을 입증하였다.

멀티헤드 어텐션과 포인터 네트워크 기반의 음절 단위 의존 구문 분석 (Multi-head Attention and Pointer Network Based Syllables Dependency Parser)

  • 김홍진;오신혁;김담린;김보은;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.546-548
    • /
    • 2019
  • 구문 분석은 문장을 구성하는 어절들 사이의 관계를 파악하여 문장의 구조를 이해하는 기술이다. 구문 분석은 구구조 분석과 의존 구문 분석으로 나누어진다. 한국어처럼 어순이 자유로운 언어에는 의존 구문 분석이 더 적합하다. 의존 구문 분석은 문장을 구성하고 있는 어절 간의 의존 관계를 분석하는 작업으로, 각 어절의 지배소를 찾아내어 의존 관계를 분석한다. 본 논문에서는 멀티헤드 어텐션과 포인터 네트워크를 이용한 음절 단위 의존 구문 분석기를 제안하며 UAS 92.16%, LAS 89.71%의 성능을 보였다.

  • PDF

음성 단어를 이용한 구간검출에 의한 패턴인식 (Pattern Recognition by Section Detection Using Speech Word)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.681-682
    • /
    • 2016
  • 본 논문에서는 화자 식별에서 음성신호의 애매한 점을 보완할 수 있는 신경회로망의 오차역전파학습 알고리즘과 모음구간 검출에 기초하여 입력되는 음성의 화자 패턴을 구분하는 일본어 단어 패턴인식 알고리즘을 제안한다. 제안하는 알고리즘에서는 일본어 데이터베이스로부터의 단어를 사용하여 음성의 특징벡터를 추출하여 분석하고 이러한 음성의 특징벡터의 차이를 이용하여 일본어 화자에 대한 패턴인식 실험을 수행하였다.

  • PDF

PC 클러스터 기반 병렬 한국어 정보검색 시스템 (PC Cluster-based Parallel Korean Information Retrieval System)

  • 김진혁;장한국;최참아;류광렬;정상화;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.160-162
    • /
    • 1999
  • 대용량의 정보를 다루는 정보검색 시스템은 정보 처리 과정에서 디스크 접근 시간이 큰 오버헤드로 작용한다. 본 논문에서는 단일 기계에서 작동하는 정보검색 시스템이 가지는 이러한 문제점을 해결하기 위해 PC 클러스터 기반 정보검색 시스템을 구현하였다. 색인어 간의 동시 등장 빈도 정보를 이용한 Greedy De-clustering 알고리즘으로 클러스터에 색인어 역파일을 병렬 분산하여 저장하고, SCI 기반의 효율적인 통신 시스템을 구축하여 클러스터 노드간의 통신이 원활하게 하였다. 따라서 사용자 질의어를 처리할 때 질의어별로 가져오는 색인어 역파일의 디스크 접근 시간이 감소하는 효과를 얻을 수 있었으며, 기존의 단일 기계에서 수행되는 정보 검색 시스템보다 수행속도가 2.3배 빠른 시스템을 구현하였음을 실험을 통해 확인하였다.

  • PDF