• 제목/요약/키워드: 컴퓨터 모델

검색결과 5,813건 처리시간 0.032초

워드 임베딩의 유사도 클러스터링을 통한 다중 문장 요약 생성 기법 (Multi Sentence Summarization Method using Similarity Clustering of Word Embedding)

  • 이필원;송진수;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.290-292
    • /
    • 2021
  • 최근 인코더-디코더 구조의 자연어 처리모델이 활발하게 연구가 이루어지고 있다. 인코더-디코더기반의 언어모델은 특히 본문의 내용을 새로운 문장으로 요약하는 추상(Abstractive) 요약 분야에서 널리 사용된다. 그러나 기존의 언어모델은 단일 문서 및 문장을 전제로 설계되었기 때문에 기존의 언어모델에 다중 문장을 요약을 적용하기 어렵고 주제가 다양한 여러 문장을 요약하면 요약의 성능이 떨어지는 문제가 있다. 따라서 본 논문에서는 다중 문장으로 대표적이고 상품 리뷰를 워드 임베딩의 유사도를 기준으로 클러스터를 구성하여 관련성이 높은 문장 별로 인공 신경망 기반 언어모델을 통해 요약을 수행한다. 제안하는 모델의 성능을 평가하기 위해 전체 문장과 요약 문장의 유사도를 측정하여 요약문이 원문의 정보를 얼마나 포함하는지 실험한다. 실험 결과 기존의 RNN 기반의 요약 모델보다 뛰어난 성능의 요약을 수행했다.

설명 문장 생성을 통한 해석 가능한 시각적 질의응답 모델 분석 (Interpretable Visual Question Answering via Explain Sentence Generation)

  • 김단일;한보형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.359-362
    • /
    • 2020
  • 본 연구에서는 설명 문장 생성을 통한 해석 가능한 시각적 질의응답 모델을 설계하고 학습 방법을 제시한다. 설명 문장은 시각적 질의응답 모델이 응답을 예측하는 데에 필요한 이미지 및 질문 정보와 적절한 논리적인 정보의 조합 및 정답 추론 과정이 함의되어 있을 것으로 기대한다. 설명 문장 생성 과정이 포함된 시각적 질의응답의 기본적인 모델을 기반으로 여러 가지 학습방법을 통해 설명 문장 생성 과정과 응답 예측 과정간의 상호관계를 분석한다. 이러한 상호작용을 적극적으로 활용할 수 있는 보다 개선 시각적 질의응답 모델을 제안한다. 또한 학습한 결과를 바탕으로 설명 문장의 특성을 활용하여 시각적 질의응답 추론 과정을 개선함으로써 시각적 질의응답 모델의 발전 방향을 논의한다. 본 실험을 통해서 응답 예측에 적절한 설명 문장을 제시하는 해석 가능한 시각적 질의응답 모델을 제공한다.

  • PDF

개체명 문맥의미표현 학습을 통한 기계 요약의 사실 불일치 교정 (Learning Contextual Meaning Representations of Named Entities for Correcting Factual Inconsistent Summary)

  • 박준모;노윤석;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.54-59
    • /
    • 2020
  • 사실 불일치 교정은 기계 요약 시스템이 요약한 결과를 실제 사실과 일치하도록 만드는 작업이다. 실제 요약 생성연구에서 가장 공통적인 문제점은 요약을 생성할 때 잘못된 사실을 생성하는 것이다. 이는 요약 모델이 실제 서비스로 상용화 하는데 큰 걸림돌이 되는 부분 중 하나이다. 본 논문에서는 원문으로부터 개체명을 가져와 사실과 일치하는 문장으로 고치는 방법을 제안한다. 이를 위해서 언어 모델이 개체명에 대한 문맥적 표현을 잘 생성할 수 있도록 학습시킨다. 그리고 학습된 모델을 이용하여 원문과 요약문에 등장한 개체명들의 문맥적 표현 비교를 통해 적절한 단어로 교체함으로써 요약문의 사실 불일치를 해소한다. 제안 모델을 평가하기 위해 추상 요약 데이터를 이용해 학습데이터를 만들어 학습하고, 실제 시나리오에서 적용가능성을 검증하기 위해 모델이 요약한 요약문을 이용해 실험을 수행했다. 실험 결과, 자동 평가와 사람 평가에서 제안 모델이 비교 모델보다 높은 성능을 보여주었다.

  • PDF

Word2Vec의 IN-OUT Vector를 이용한 기계독해용 단락 검색 모델 (Paragraph Retrieval Model for Machine Reading Comprehension using IN-OUT Vector of Word2Vec)

  • 김시형;박성식;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.326-329
    • /
    • 2019
  • 기계독해를 실용화하기 위해 단락을 검색하는 검색 모델은 최근 기계독해 모델이 우수한 성능을 보임에 따라 그 필요성이 더 부각되고 있다. 그러나 기존 검색 모델은 질의와 단락의 어휘 일치도나 유사도만을 계산하므로, 기계독해에 필요한 질의 어휘의 문맥에 해당하는 단락 검색을 하지 못하는 문제가 있다. 본 논문에서는 이러한 문제를 해결하기 위해 Word2vec의 입력 단어열의 벡터에 해당하는 IN Weight Matrix와 출력 단어열의 벡터에 해당하는 OUT Weight Matrix를 사용한 단락 검색 모델을 제안한다. 제안 방법은 기존 검색 모델에 비해 정확도를 측정하는 Precision@k에서 좋은 성능을 보였다.

  • PDF

클래스분류 학습이 Self-Supervised Transformer의 saliency map에 미치는 영향 분석 (Analysis of the effect of class classification learning on the saliency map of Self-Supervised Transformer)

  • 김재욱;김현철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.67-70
    • /
    • 2022
  • NLP 분야에서 적극 활용되기 시작한 Transformer 모델을 Vision 분야에서 적용하기 시작하면서 object detection과 segmentation 등 각종 분야에서 기존 CNN 기반 모델의 정체된 성능을 극복하며 향상되고 있다. 또한, label 데이터 없이 이미지들로만 자기지도학습을 한 ViT(Vision Transformer) 모델을 통해 이미지에 포함된 여러 중요한 객체의 영역을 검출하는 saliency map을 추출할 수 있게 되었으며, 이로 인해 ViT의 자기지도학습을 통한 object detection과 semantic segmentation 연구가 활발히 진행되고 있다. 본 논문에서는 ViT 모델 뒤에 classifier를 붙인 모델에 일반 학습한 모델과 자기지도학습의 pretrained weight을 사용해서 전이학습한 모델의 시각화를 통해 각 saliency map들을 비교 분석하였다. 이를 통해, 클래스 분류 학습 기반 전이학습이 transformer의 saliency map에 미치는 영향을 확인할 수 있었다.

  • PDF

머신러닝 기반 클라우드 웹 애플리케이션 HTTP DoS 공격 탐지 (Machine Learning-based Detection of HTTP DoS Attacks for Cloud Web Applications)

  • 조재한;박재민;김태협;이승욱;김지연
    • 스마트미디어저널
    • /
    • 제12권2호
    • /
    • pp.66-75
    • /
    • 2023
  • 최근 기업 및 공공기관 정보시스템의 클라우드 전환이 가속화되면서 클라우드 환경에서 운영되는 웹 애플리케이션이 증가하고 있다. 클라우드 웹 애플리케이션에 대한 전통적인 네트워크 공격은 대량의 패킷으로 네트워크 자원을 고갈시키는 DoS(Denial of Service) 공격이 대표적이지만, 최근에는 애플리케이션 자원을 고갈시키는 HTTP DoS 공격도 증가하고 있어 이에 대응하기 위한 보안기술 마련이 필요하다. 특히, HTTP DoS 공격 중, 저대역폭으로 수행되는 공격은 네트워크 자원을 고갈시키지 않기 때문에 네트워크 메트릭을 모니터링 하는 전통적인 보안 솔루션으로 탐지하는 것이 어렵다. 본 논문에서는 클라우드 웹 애플리케이션에 HTTP DoS 공격을 주입하면서 웹 서버의 애플리케이션 메트릭을 수집하고, 이를 머신러닝 기반으로 학습하여 공격을 탐지하는 새로운 탐지 모델을 제안한다. 애플리케이션 메트릭으로는 아파치 웹 서버의 18종을 수집하였고, 5종의 머신러닝 모델과 2종의 딥러닝 모델을 사용하여 수집한 데이터를 학습하였다. 또한, 6종의 네트워크 메트릭을 추가로 수집 및 학습하고, 제안된 애플리케이션 메트릭 기반 모델과 성능을 비교함으로써 애플리케이션 메트릭 기반 머신러닝 모델의 우수성을 검증한다. HTTP DoS 공격 중, 저대역폭으로 수행되는 RUDY 공격과 고대역폭으로 수행되는 HULK 공격을 제안된 모델로 탐지한 결과, 두 공격 탐지에 있어서 애플리케이션 메트릭 기반 머신러닝 모델의 F1-Score가 네트워크 메트릭 기반의 모델보다 각각 약 0.3, 0.1 높은 것을 확인하였다.

Multi-Channel PCNN 모델을 활용한 약물-약물 상호작용 관계 추출 (Relation Extraction of Drug-Drug Interaction using Multi-Channel PCNN Model)

  • 박찬희;조민수;박장원;박상현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.33-36
    • /
    • 2019
  • DDI 추출은 생물 의학 문헌으로부터 약물-약물 상호작용(Drug-Drug Interaction) 관계를 추출하는 작업으로, 기존에 알려지지 않은 인체 내 약물 간의 효과 또는 부작용 정보를 제공하는데 중요한 역할을 한다. 본 연구에서는 PCNN 모델을 활용하여 특징 추출 과정을 자동화하고 약물 개체 간의 구조 정보를 포착해 개체 간 관계를 효율적으로 추출하였으며, 생물 의학 문헌에서 쓰이는 생소한 용어를 보다 풍부하게 표현하기 위해 5가지 버전의 단어 임베딩을 PCNN의 채널로 사용하였다. 본 연구에서 제안하는 MC-PCNN 모델의 성능 평가를 위해 DDI'13 Corpus 데이터를 사용하여 비교 실험을 진행하였으며, 그 결과 기존 연구보다 $F_1$ 점수 기준 최대 2.05%p 향상된 성능을 보이며 DDI 관계 추출에서 효과적인 방법론임을 확인하였다.

  • PDF

인간/기계 형상의 컴퓨터 표현기법 (Computational representative techniques of human/machine configurations)

  • Y.H. Yoon
    • 대한인간공학회:학술대회논문집
    • /
    • 대한인간공학회 1992년도 추계학술대회논문집
    • /
    • pp.3-8
    • /
    • 1992
  • 컴퓨터 스크린상에 어떤 물체의 형상을 나타낼 때 각 형태에 따라 그 표현 기법은 크게 두 분야로 나뉘게 되는데 대부분의 기계부품들처럼 원통이나 평면 등과 같이 기하학적 기본형태들로 이루어진 것과 사람이나 동물처럼 형상자체가 단순한 수학적공식으로 표현이 불가능한 형태(Free Form Geometry)로 분류된다. 어떤 대상물체가 선정되면 그것의 기하학적 형상을 먼저 컴퓨터 스크린상에 정확한 형상데이터로 표현된 다음 가시화를 위한 것이든 시뮬레이션 목적이든 그 형상 데이터가 이용된다. 이처럼 컴퓨터에 의한 모의 실험에서 대상물체를 모델링하는 단계는 반드시 필요하다. 최근 컴퓨터에 의한 각종 모델의 시뮬레이션을 시도할 때 Modeling 단계에서 수학적 공식으로 표현이 가능한 모델(Mathemeatical model)보다 임의 형태를 가진 모델(Physical model)표현에 많은 애로를 겪고 있는 실정이다. 따라서, 본 연구에서는 인간이나 항공기처럼 복잡한 형태를 가진 물체형상을 컴퓨터 스크린상에 표현할 때 비교적 실물에 가까운 형상데이터를 얻는 기법들에 대해 기술하고 그 결과를 소개한다. 특히 인간의 정적 또는 동적인 자세변화에 따른 각 신체 부위의 정확한 계량분석을 시도할 때 본 기법들의 응용이 가능하다.

  • PDF

QR코드를 이용한 Mobile HMI 화면 구성 모델 (Mobile HMI Screen Configuration Model Using QR Code)

  • 김종주;김재웅;이윤열;채의근;박구락
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.117-118
    • /
    • 2022
  • 소비자들이 필요로 하는 다양한 제품을 생산하기 위하여, 제조 현장에서 사용하는 자동화 장비의 종류가 다양해져가고 있다. 자동화 장비는 일반적으로 운영자가 효율적으로 감시하고, 조작할 수 있도록 사용자용 인터페이스 장치(HMI)를 설치하여 제작되고 있다. HMI 장치는 자동화 장비마다 개별적으로 고정되어 있기 때문에, 운영자가 다양한 장비를 즉각적으로 조작하기에 어려움이 존재한다. 본 논문에서는 모바일 장치를 사용해 QR코드로 장비의 화면을 표시하고, 원격으로 해당 장비를 조작할 수 있는 모델을 제안한다. 제안 모델은 하나의 모바일 장치를 활용하여 다양한 자동화 장비를 원격으로 신속하게 감시하고 제어할 수 있어, 제품 생산에 대한 효율이 증대될 것으로 기대된다.

  • PDF

데이터 분포 통계를 이용한 CSV 형식의 공공데이터 도메인 판별 모델에 관한 연구 (A Study on Domain Discrimination Model for CSV Format Public Data Using Data Distribution Statistics)

  • 정하나;김재웅;이윤열;채의근;정영석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.79-80
    • /
    • 2023
  • 정부는 공공데이터의 품질 관리를 위하여 공공데이터 품질관리 수준평가를 진행하여 공공데이터 품질을 관리하고 있다. 파일 형식의 공공데이터를 진단 시 품질진단 담당자가 대량의 파일데이터를 필드명과 필드 내 데이터에 의존하여 수작업으로 도메인을 판단하여 진단한다. 때문에 품질진단의 정확성을 신뢰하기 어렵고 진단에 많은 시간이 소요된다. 본 논문은 파일형식의 공공데이터 품질진단의 정확성을 확보하고 진단 소요시간을 단축하기 위해 데이터 분포 통계를 이용한 CSV 형식의 공공데이터 도메인 판별 모델을 제안하였다. 제안된 모델을 적용하면 공공데이터 품질의 정확성을 향상하고 진단 소비 시간을 단축시킬 것으로 기대된다.

  • PDF