• 제목/요약/키워드: 가중치 모델

검색결과 939건 처리시간 0.057초

상대적 가중치 자질을 반영한 CRF 기반의 개체명 인식 (Named Entity Recognition based on CRF reflecting relative weight)

  • 정진욱
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.338-339
    • /
    • 2017
  • 본 논문은 개체명 인식을 위해 CRF 모델을 이용해 분류를 수행했다. 개체명 후보를 개체명으로 식별에서 중의성 문제가 필요하다. 본 논문에서는 이러한 중의성 문제 해결을 위해 학습 셋으로부터 패턴과 형태적 특성을 고려해 개체명 후보를 최대로 선택하고 선택된 개체명 후보의 중의성과 정확도를 높이기 위해 주변의 문맥 자질과 분별 확률 모델인 CRF를 이용해 중의성 문제를 해결한다.

  • PDF

가중치 부여 휴리스틱을 이용한 개념 기반 문서분류기 TAXON의 개선 (Improvement of A Concept-Based Text Categorization System(TAXON) Using Weight Determination Heuristic)

  • 강원석;강현규;김영섬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.153-155
    • /
    • 1998
  • 본 논문에서는 개념을 기반으로 문서의 분류를 하는 확률벡터 모델의 분류기TAXON(Concept-based Text Categorization System)의 개선을 도모한다. TAXON은 한국어 문장을 분석하여 명사를 추출하고 명사의 개념을 시소러스 도구를 통해 획득한 후 이를 벡터화하여 주제와 입력 문서와의 관계성을 검사하는 문서 분류기이다. 본 논문은 문서 분류기 TAXON의 성능을 향상시키기 위하여 확률벡터 계산에 가중치 부여 휴리스틱을 도입한다. 그리고 시소러스 도구를 확장하여 문서 분류의 질을 높인다.

  • PDF

범주 대표어의 가중치 계산 방식에 의한 자동 문서 분류 시스템 (Automatic Document Classification by Term-Weighting Method)

  • 이경찬;강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.475-477
    • /
    • 2002
  • 자동 문서 분류는 범주 특성 벡터와 입력 문서 벡터의 유사도 비교에 의해 가장 유사한 범주를 선택하는 방법이다. 문서 분류 시스템을 구현하기 위하여 각 범주의 특성 벡터를 정보 검색 시스템의 역파일 형태로 구축하였으며, 용어 가중치를 계산하는 방법을 달리하여 문서 분류 시스템의 정확도를 실험하였다. 실험 문서는 일간지의 신문기사들을 무작위로 추출한 문서 집합을 대상으로 하였으며, 정보 검색 모델에서 보편적으로 사용되는 TF-lDF 방식이 변형된 방식에 비해 더 나은 성능을 보였다.

  • PDF

FPGA에 의한 블록기반 신경망의 설계 (Hardware Design of Block-based Neural Networks Using FPGA)

  • 장정두;공성곤
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 하계학술대회 논문집 D
    • /
    • pp.2998-3000
    • /
    • 2000
  • 본 논문에서는 BNN, 블록기반 신경망 모델을 재구성가능 하드웨어(FPGA)로 설계한다. 블록기 반 신경망은 재구성가능 하드웨어에 의하여 구현이 용이하고 구조 및 가중치의 최적화에 진화 알고리즘을 적용시킬 수 있다. 블록기반 신경망의 구조와 가중치를 표현하는 바이너리 스트링을 오프라인으로 진화시킨 후, 재구성가능 하드웨어로 구현한다. FPGA로 구현된 블록기반 신경망의 성능을 확인하기 위하여 간단한 성능시험에 사용되는 대표적인 패턴들을 사용하여 블록기반 신경망의 패턴분류 성능을 알아본다.

  • PDF

협력적 여과 시스템의 예측 정확도 향상을 위한 전처리 방법 (A Preprocessing Method for Improving Prediction Accuracy in Collaborative Filtering)

  • 김교창;전종훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.698-700
    • /
    • 2003
  • 본 논문에서는 협력적 여과방식에서 고객의 특정 상품에 대한 선호도 예측의 정확도를 향상하기 위해 상품의 선호도 값에 가중치를 반영하는 전처리 방법을 제안한다. 이를 위해 고객별 상품의 선호도 값에 정보검색 분야에서 사용되고 있는 벡터 공간 모델을 이용하여 가중치를 부여하며, 이를 통하여 특정 상품을 선호하는 고객과 전체 상품을 고루 선호하는 고객간의 차별화 값을 반영하여 보다 정확한 선호도를 예측할 수 있게 된다. 전처리 과정을 수행하지 않은 기존의 협력적 여과 방식과의 실험을 통한 비교 분석을 통하여 본 논문이 제안하는 전처리 과정의 타당성과 비교우위를 검증한다.

  • PDF

TYPE-2 퍼지 추론 구동형 RBF 신경 회로망 설계 및 최적화 (Design of Radial Basis Function Neural Network Driven to TYPE-2 Fuzzy Inference and Its Optimization)

  • 백진열;김웅기;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.247-248
    • /
    • 2008
  • 본 논문에서는 TYPE-2 퍼지 추론 기반의 RBF 뉴럴 네트워크(TYPE-2 Radial Basis Function Neural Network, T2RBFNN)를 설계하고 PSO(Particle Swarm Optimization) 알고리즘을 이용하여 모델의 파라미터를 동정한다. 제안된 모델의 은닉층은 TYPE-2 가우시안 활성 함수로 구성되며, 출력층은 Interval set 형태의 연결가중치를 갖는다. 여기에서 규칙 전반부 활성함수의 중심 선택은 C-means 클러스터링 알고리즘을 이용하고, 규칙 후반부 Interval set 형태의 연결가중치 결정에는 경사 하강법(Gradient descent method)을 이용한 오류 역전파 알고리즘을 사용하여 학습한다. 또한, 최적의 모델을 설계하기 위한 학습율 및 활성함수의 활성화 영역 결정에는 입자 군집 최적화(PSO; Particle Swarm Optimization) 알고리즘으로 동조한다. 마지막으로, 제안된 모델의 평가를 위하여 모의 데이터 집합(Synthetic dadaset)을 적용하고 근사화 및 일반화 능력에 대하여 토의한다.

  • PDF

머신러닝 기반 악성 안드로이드 모바일 앱의 최적특징점 선정 및 모델링 방안 제안 (Modeling and Selecting Optimal Features for Machine Learning Based Detections of Android Malwares)

  • 이계웅;오승택;윤영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.164-167
    • /
    • 2019
  • 모바일 운영체제 중 안드로이드의 점유율이 높아지면서 모바일 악성코드 위협은 대부분 안드로이드에서 발생하고 있다. 그러나 정상앱이나 악성앱이 진화하면서 권한 등의 단일 특징점으로 악성여부를 연구하는 방법은 유효성 문제가 발생하여 본 논문에서는 다양한 특징점 추출 및 기계학습을 활용하여 극복하고자 한다. 본 논문에서는 APK 파일에서 구동에 필요한 다섯 종류의 특징점들을 안드로가드라는 정적분석 툴을 통해 학습데이터의 특성을 추출한다. 또한 추출된 중요 특징점을 기반으로 모델링을 하는 세 가지 방법을 제시한다. 첫 번째 방법은 보안 전문가에 의해 엄선된 132가지의 특징점 조합을 바탕으로 모델링하는 것이다. 두 번째는 학습 데이터 7,000개의 앱에서 발생 빈도수가 높은 상위 99%인 8,004가지의 특징점들 중 랜덤포레스트 분류기를 이용하여 특성중요도가 가장 높은 300가지를 선정 후 모델링 하는 방법이다. 마지막 방법은 300가지의 특징점을 학습한 다수의 모델을 통합하여 하나의 가중치 투표 모델을 구성하는 방법이다. 최종적으로 가중치 투표 모델인 앙상블 알고리즘 모델을 사용하여 97퍼센트로 정확도가 개선되었고 오탐률도 1.6%로 성능이 개선되었다.

건국봇: 검색모델과 생성모델을 결합한 챗봇 (KU-Bot: Chatbot combining Retrieval-based model and Generative Model)

  • 이현우;민덕기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.449-452
    • /
    • 2018
  • 최근 AI 스피커를 비롯한 지능형 비서 서비스들이 빠르게 등장하고 있으며, AI 시장에서도 특히 챗봇 구축이 가장 활발하게 진행되고 있다. 건국봇은 건국대학교 학생들에게 필요한 정보를 제공하는 대화형 서비스이다. 본 논문에서는 대표적인 챗봇 구현 방법인 검색모델과 생성모델의 장단점을 분석하고, 건국봇에 적용한 사례를 소개한다. 궁극적으로, 질의문의 의도를 단어의 가중치를 고려해 추론함으로써 Unknown 추론을 강화하고 의도되지 않은 문장의 처리 관점에서 성능을 향상시키는 방법을 제안한다.

목표모델의 확률적 평가에 관한 연구 (Research on Probabilistic Evaluation of Goal Model)

  • 김태영;고동범;김정준;정성택;박정민
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.263-269
    • /
    • 2017
  • '목표모델'은 대규모 시스템의 관리에 인간의 개입을 최소화하기 위한 대안으로 제시된 '자율제어 시스템'의 지식 베이스이다. '자율제어 시스템'은'목표모델'을 기반으로 '자율제어'의 네 단계인 '모니터링-분석-계획-실행'을 수행하기 때문에 대상 시스템의 '목표모델' 달성 비율을 정량화할 필요가 있다. 따라서 본 논문에서는 '목표모델'의 달성비율을 정량화하기 위한 '목표모델의 확률적 평가'를 나타낸다. 평가는 '목표 모델링 및 가중치 부여', '목표모델 모니터링', '목표모델 평가 및 분석' 총 3단계로 구성되어 있다. 연구를 통해 '자율제어 엔진'에 지식 베이스를 제공하고, 가중치를 적용한 '목표모델'을 평가함으로써 시스템의 신뢰성 향상이 가능하다. 사례연구로써 'Smart IoT Kit'에 '목표모델'을 만들어 적용하여 제안 연구에 유효성을 입증한다.

거대언어모델 기반 특징 추출을 이용한 단기 전력 수요량 예측 기법 (Large Language Models-based Feature Extraction for Short-Term Load Forecasting)

  • 이재승;유제혁
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.51-65
    • /
    • 2024
  • 스마트 그리드에서 전력 시스템을 효과적으로 운영하기 위해서는 전력 수요량을 정확히 예측하는 것이 중요하다. 최근 기계학습 기술의 발달로, 인공지능 기반의 전력 수요량 예측 모델이 활발히 연구되고 있다. 하지만, 기존 모델들은 모든 입력변수를 수치화하여 입력하기 때문에, 이러한 수치들 사이의 의미론적 관계를 반영하지 못해 예측 모델의 정확도가 하락할 수 있다. 본 논문은 입력 데이터에 대하여 거대언어모델을 통해 추출한 특징을 이용하여 단기 전력 수요량을 예측하는 기법을 제안한다. 먼저, 입력변수를 문장 형식의 프롬프트로 변환한다. 이후, 가중치가 동결된 거대언어모델을 이용하여 프롬프트에 대한 특징을 나타내는 임베딩 벡터를 도출하고, 이를 입력으로 받은 모델을 학습하여 예측을 수행한다. 실험 결과, 제안 기법은 수치형 데이터에 기반한 예측 모델에 비해 높은 성능을 보였고, 프롬프트에 대한 거대언어모델의 주의집중 가중치를 시각화함으로써 예측에 있어 주요한 영향을 미친 정보를 확인하였다.