• 제목/요약/키워드: 카테나

검색결과 487건 처리시간 0.028초

유전자 온톨로지를 활용한 반지도 클러스터링 기법 (Gene ontology based semi-supervised clustering method)

  • 고송;김대원
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.183-187
    • /
    • 2008
  • 본 논문은 유전자의 기능이 비슷한 정도에 따른 사전정보의 값을 부여하며, 클러스터링시 사전정보를 활용할 수 있는 방법을 제시한다. 실세계 문제인 유전자는 각기 다양한 기능을 하는 특징적인 것으로 사전정보의 형태를 1과 0등으로 구분하던 과거의 방식으로는 정의하기가 어렵다. 유전자간의 비슷한 정도에 따라 사전정보의 값이 정해져야 하는 것은 필요하며, 이는 생물학자가 구축해놓은 유전자 온톨로지의 분석을 통하여 산출한다. 유전자 온톨로지는 기능별 카테고리로 분류하며, 세부 기능은 하위의 카테고리로 형성된 거대한 트리 구조의 형태를 띤다. 온톨로지 분석을 통해 형성된 사전정보의 값은 0과 1사이의 연속적인 값으로 형성이 되며, 이 값은 클러스터링 과정 중 거리 계산에 활용함으로써, 그 결과의 성능이 우수함을 보인다.

  • PDF

음악 콘텐츠의 감성추천 서비스 음악과 가사와의 상관관계에 관한 연구 (A Study on Correlation of the sensitivity of the content recommendation service music and lyrics)

  • 이승원;이승연
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.31-32
    • /
    • 2016
  • 최근 음악 서비스 분야에는 감성추천 서비스가 시행되고 있다. 추천 시스템에 따라 내용 기반 추천 방식과 협업 기반 추천 방식으로 크게 구분할 수 있으며 대부분의 음악 서비스 분야에서는 많은 사용자들로부터 얻은 기호정보에 따라 사용자들의 관심사들을 자동적으로 예측하는 방법인 협업 기반 추천 방식으로 서비스를 운영하고 있다. 이에 따라 협업 기반 추천 방식을 사용하는 대표 음원 사이트 멜론과 벅스에서 음악 추천 서비스의 추천된 음악이 실제 감성과 맞는지 기쁨과 슬픔으로 분류하여 Russell의 감성 모형을 기준으로 가사의 5차 분류를 통해 곡의 감성을 분석하여 카테고리의 추천음악과 가사의 상관관계를 비교 연구하였다. 그 결과, 각 카테고리의 감성추천 음악과 실제 음악의 감성이 일치하는 부분도 있지만, 그 외 다양한 감정들이 도출되었다.

  • PDF

문자 인식에서의 Fuzzy Membership Function

  • 양순성;남기동;김영종;이균하
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.191-198
    • /
    • 1990
  • 본 논문에서는 문서 자동 인식 시스템에서 다중 카테고리로 모호하게 인식되어 질 수 있는 조합 심볼을 하나의 메타 심볼로 간주하고, 이 심볼을 fuzzy set theory에 기초를 두어 분석을 하였다. 분석 과정에서는 메타 심볼이 갖는 프리미티브들의 기울기와 길이, 프리미티브들간의 연결 및 프리미티브의 위치등의 어트리뷰트들을 이용하였다. 모호성을 내재하고 있는 메타 심볼들을 ACS(Ambiguous Category Set)의 원소로 간주하였으며, ACS의 원소들은 모호성의 원인을 제공하는 부분패턴들을 공동으로 포함하고 있다. 부분패턴을 구성하고 있는 프리미티브를 분리하여 어트리뷰트 값을 측정하고, 정의한 MF(Membership 함수)의 파라메터로 사용하였다. MF에서 얻어진 MFV(Membership Function Value)는 모호한 메타 심볼이 어떤 카테고리로 분류될 수 있는지를 나타내도록 하였다.

  • PDF

바이오 마커와 질병 용어의 단어 표현 분석 (Word Representation Analysis of Bio-marker and Disease Word)

  • 윤영신;남경민;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.165-168
    • /
    • 2015
  • 기계학습 기반의 자연어처리 모듈에서 중요한 단계 중 하나는 모듈의 입력으로 단어를 표현하는 것이다. 벡터의 사이즈가 크고, 단어 간의 유사성의 개념이 존재하지 않는 One-hot 형태와 대조적으로 유사성을 표현하기 위해서 단어를 벡터로 표현하는 단어 표현 (word representation/embedding) 생성 작업은 자연어 처리 작업의 기계학습 모델의 성능을 개선하고, 몇몇 자연어 처리 분야의 모델에서 성능 향상을 보여 주어 많은 관심을 받고 있다. 본 논문에서는 Word2Vec, CCA, 그리고 GloVe를 사용하여 106,552개의 PubMed의 바이오메디컬 논문의 요약으로 구축된 말뭉치 카테고리의 각 단어 표현 모델의 카테고리 분류 능력을 확인한다. 세부적으로 나눈 카테고리에는 질병의 이름, 질병 증상, 그리고 난소암 마커가 있다. 분류 능력을 확인하기 위해 t-SNE를 이용하여 2차원으로 단어 표현 결과를 맵핑하여 가시화 한다.

  • PDF

실리콘 웨이퍼 형상 분류에 관한 연구 (A Study on Classifying the Shapes of Silicon Wafers)

  • 김수희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2000년도 추계학술대회
    • /
    • pp.140-144
    • /
    • 2000
  • 실리콘 웨이퍼 생산의 여러 단계의 공정 중 평탄도를 측정하고 제어하는 polishing 공정은 평탄한 정도에 의하여 제품의 합격 여부가 결정되는 측면에서 매우 중요한 과정이다. 이 연구에서는 polishing 공정의 자동화를 모색해 보기 위해 웨이퍼의 형상을 추정한 데이타를 이용하여 그 형상을 분류하는 알고리즘을 개발하였다 추정된 웨이퍼의 모양에 따라 9개의 카테고리로 분류하고, 각 카테고리를 세 종류의 통계값을 이용하여 세부 분류한다. 개발한 알고리즘을 구현하여 웨이퍼의 형상을 분류하는 모듈을 개발하였다. 개발한 알고리즘을 검증하기 위해 여러 웨이퍼를 대상으로 실험을 수행하였다. 대부분의 웨이퍼를 정확하게 잘 분류하고 있으나 인부의 미세한 변화를 감지하지 못함으로 인하여 정확하게 분류하기가 어려운 경우를 관찰할 수 있었다. 웨이퍼의 형상을 다양하게 분류함으로써 polishing 공정의 자동화를 좀 더 구체적이고 효율적으로 접근할 수 있는 계기가 됨 깃으로 기대한다.

커뮤니티 점유시간을 이용한 상품추천 시스템의 설계 및 구현 (A Design and Implementation of Products Recommendation System Using the Residence time in Community)

  • 천소영;윤성대
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.23-26
    • /
    • 2004
  • 전자상거래 시장에서 고객이 관심있는 카테고리가 포괄적이고, 우선순위를 알 수 없기 때문에 이 정보를 이용하여 상품을 추천한다는 것은 고객의 개인적인 취향을 충분히 반영하지 못한다고 할 수 있다. 이에 본 논문에서는 포털사이트에 가입된 기존의 고객이 활동하고 있는 커뮤니티들 중에서 빈번히 접속하고 장시간 머물러 있는 커뮤니티를 분석해 낸다. 또한 분석된 커뮤니티 카테고리와 연관된 상품을 고객에게 추천하도록 하여 구매율을 높일 수 있는 시스템을 설계하고자 한다.

  • PDF

질의 응답 시스템에서 질의 카테고리별 개념리스트 구축에 기반한 의미적 질의 확장 (Semantic Query Expansion based on a Question Category Concept List in QA system)

  • 김혜정;강보영;박성배;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.178-180
    • /
    • 2004
  • 질의 응답(Question Answering) 시스템은 질의에서 요구하는 정답 유형(Answer tyype) 및 질의에 사용된 용어를 적용하여 보다 정확한 답을 추출하고자 한다. 그러나 질의에 사용된 용어들이 문서의 정답문장에 그대로 사용되지 않고 같은 의미의 다른 어휘로 출현하기도 하며, 혹은 다른 문법적 정보를 가진 카테고리로 등장하여 정답 추출에 어려움이 따른다. 따라서, 본 논문은 질의별 카테고리 개념 리스트를 구축하여 효과적인 의미적 질의 확장 방법론을 제안한다. 제안된 방법은 먼저 질문 문장의 패턴 린 질의 정보 유형을 파악하여 질의 카테고리 및 카테고리별 개념 리스트를 구축한다. 그런 후 구축된 질의 개념 카테고리 및 리스트를 활용하여 질의 유형을 학습하고, 새로운 질의가 입력되면 해당 개념 카테고리로 분류한 후, 개념 리스트를 기반으로 개념별 질의 확장을 수행한다. 제안된 시스템의 성능 명가를 위하여, TREC-9의 질의와 TREC 문서 중 1991년도 WSJ(Wall Street Journal) 42,654건을 대상으로 실험한 결과 질의 확장을 수행하지 않는 시스템의 경우 MRR(Mean reciprocal ratio) 측정에서 0.223의 결과를 보인 반면 제안된 시스템의 경우 0.50의 향상된 결과를 보였다.

  • PDF

머신러닝 기반 공지문 분류 및 추천 애플리케이션 개발 (Development of a Notice Classification and Recommendation Application Using Machine Learning Techniques)

  • 김혜민;오지은;정혜린;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.420-423
    • /
    • 2018
  • 본 논문에서는 웹 및 문자 공지문을 자동으로 분류하고 추천함으로써 사용자가 원하는 공지문만을 볼 수 있도록 하는 애플리케이션을 개발한다. 본 애플리케이션은 공지문을 여러 카테고리로 자동 분류하여 사용자가 원하는 카테고리에 속한 공지문만을 볼 수 있도록 하며, 사용자가 선호할 만한 공지문을 추천하는 기능을 제공한다. 공지문 분류를 위해 다층 신경망 모델과 Naive Bayes 분류기를 사용하였으며, 공지문 추천을 위해 키워드 기반 자체 알고리즘을 사용하였다. 그 밖에 Word2Vec 을 활용한 검색어 추천 등 부가 기능을 제공하여 사용자가 쉽게 공지문을 찾을 수 있도록 하였다. 본 애플리케이션을 통해 사용자는 수많은 공지문 중 관심 있는 공지문만을 효율적으로 확인할 수 있다.

K-means 클러스터링과 토픽 모델링을 기반으로 한 국민청원 사이트의 카테고리 재구성 (Reconstruction of Categories on the National Petition Site Using K-Means clustering and Topic Modeling)

  • 우윤희;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.302-305
    • /
    • 2019
  • 국민 청원 사이트가 뛰어난 접근성과 신속성으로 인하여 국민들로부터 많은 관심을 받고 있다. 현재 국민청원 사이트의 카테고리 분류는 '미래', '성장동력' 등을 포함한 16개의 카테고리 및 기타로 구성되어 있으나 그 기준이 모호하여 많은 청원글들이 기타 카테고리로 분류되고 있는 상황이다. 이는 청원글의 내용을 명확히 반영하지 않고 미리 정의된 카테고리 구조를 사용하고 있는데서 기인한다고 할 수 있다. 본 논문에서는 보다 구체적으로 정의된 카테고리를 정의하고자 추천 순으로 1,500개의 청원글을 수집하였고, 수집된 청원글의 내용을 바탕으로 카테고리 구조를 추출하였다. 먼저, k-평균 알고리즘을 적용하여 청원글을 군집하여 대분류를 정의하였고, 보다 구체적인 세부 분류를 정의하기 위하여 토픽모델링을 실시하였다. 본 논문에서 제시하는 계층적 카테고리 구조는 청원글의 내용을 바탕으로 대분류와 세부분류로 구성된 것이므로 새로운 청원글을 등록하거나 분류하는 데 적절한 것으로 보인다.

Idle 상태 단말을 위한 이종 무선 통신망 환경에서의 네트워크 선택 알고리즘 (Network Selection Algorithm for Idle Status Mobile Sets under the Heterogeneous Wireless Network Environment)

  • 강준석;한승재
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.879-882
    • /
    • 2010
  • 본 연구는 idle 상태의 단말을 위한 이종 무선 통신망 환경에서 네트워크 선택 알고리즘을 제안한다. 제안 하는 알고리즘은 셀과 사용자 각각의 상대적 상태 정보를 이용하는 프로필기반 네트워크 선택 프레임워크(Profile-based Network Selection Framework, PNSF)에 기반한다. PNSF 는 traffic status, mobility, 그리고 QoS (Quality of Service) 카테고리의 정보들을 바탕으로 셀과 사용자의 프로필을 생성한다. 생성된 프로필들을 3 차원의 프로필 공간에서 위치 시키고 각 셀과 사용자 프로필 사이의 거리를 각 카테고리를 구성하는 요소의 정적 특성을 반영하여 계산한다. 사용자는 최종적으로 가장 거리가 긴 셀을 선택하여 location update 를 수행한다. 본 연구에서 제안하는 알고리즘은 이종의 무선통신망 환경의 특성과 idle 모드의 특성을 반영하여 location update 의 발생 빈도를 합리적으로 줄이면서도 급증하는 데이터 통신 사용을 고려하여 사용자가 네트워크에 전체에 적절히 분산되도록 선택한다.