• 제목/요약/키워드: 성능모델

검색결과 11,866건 처리시간 0.043초

KorBERT와 Popularity 정보에 기반한 한국어 개체연결 (Korean Entity Linking based on KorBERT and Popularity )

  • 허정;배경만;임수종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.502-506
    • /
    • 2022
  • 본 논문에서는 KorBERT와 개체 인기정보(popularity)를 이용한 개체연결 기술을 소개한다. 멘션인식(mention detection)은 KorBERT를 이용한 토큰분류 문제로 학습하여 모델을 구성하였고, 개체 모호성해소(entity disambiguation)는 멘션 컨텍스트와 개체후보 컨텍스트 간의 의미적 연관성에 대한 KorBERT기반 이진분류 문제로 학습하여 모델을 구성하였다. 개체 인기정보는 위키피디아의 hyperlink, inlink, length 정보를 활용하였다. 멘션인식은 ETRI 개체명 인식기를 이용한 모델과 비교하였을 경우, ETRI 평가데이터에서는 F1 0.0312, 국립국어원 평가데이터에서는 F1 0.1106의 성능 개선이 있었다. 개체 모호성해소는 KorBERT 모델과 Popularity 모델을 혼용한 모델(hybrid)에서 가장 우수한 성능을 보였다. ETRI 평가데이터에서는 Hybrid 모델에서의 개체 모호성 해소의 성능이 Acc. 0.8911 이고, 국립국어원 평가데이터에서는 Acc. 0.793 이였다. 최종적으로 멘션인식 모델과 개체 모호성해소 모델을 통합한 개체연결 성능은 ETRI 평가데이터에서는 F1 0.7617 이고, 국립국어원 평가데이터에서는 F1 0.6784 였다.

  • PDF

한국어 문법 오류 교정 모델을 위한 문장 단위 디노이징 학습법 (Sentence Unit De-noising Training Method for Korean Grammar Error Correction Model)

  • 김훈래;김윤수;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.507-511
    • /
    • 2022
  • 문법 교정 모델은 입력된 텍스트에 존재하는 문법 오류를 탐지하여 이를 문법적으로 옳게 고치는 작업을 수행하며, 학습자에게 더 나은 학습 경험을 제공하기 위해 높은 정확도와 재현율을 필요로 한다. 이를 위해 최근 연구에서는 문단 단위 사전 학습을 완료한 모델을 맞춤법 교정 데이터셋으로 미세 조정하여 사용한다. 하지만 본 연구에서는 기존 사전 학습 방법이 문법 교정에 적합하지 않다고 판단하여 문단 단위 데이터셋을 문장 단위로 나눈 뒤 각 문장에 G2P 노이즈와 편집거리 기반 노이즈를 추가한 데이터셋을 제작하였다. 그리고 문단 단위 사전 학습한 모델에 해당 데이터셋으로 문장 단위 디노이징 사전 학습을 추가했고, 그 결과 성능이 향상되었다. 노이즈 없이 문장 단위로 분할된 데이터셋을 사용하여 디노이징 사전 학습한 모델을 통해 문장 단위 분할의 효과를 검증하고자 했고, 디노이징 사전 학습하지 않은 기존 모델보다 성능이 향상되는 것을 확인하였다. 또한 둘 중 하나의 노이즈만을 사용하여 디노이징 사전 학습한 두 모델의 성능이 큰 차이를 보이지 않는 것을 통해 인공적인 무작위 편집거리 노이즈만을 사용한 모델이 언어학적 지식이 필요한 G2P 노이즈만을 사용한 모델에 필적하는 성능을 보일 수 있다는 것을 확인할 수 있었다.

  • PDF

신경망 이미지 부호화 모델과 초해상화 모델의 합동훈련 (Joint Training of Neural Image Compression and Super Resolution Model)

  • 조현동;김영웅;차준영;김동현;임성창;김휘용
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1191-1194
    • /
    • 2022
  • 인터넷의 발전으로 수많은 이미지와 비디오를 손쉽게 이용할 수 있게 되었다. 이미지와 비디오 데이터의 양이 기하급수적으로 증가함에 따라, JPEG, HEVC, VVC 등 이미지와 비디오를 효율적으로 저장하기 위한 부호화 기술들이 등장했다. 최근에는 인공신경망을 활용한 학습 기반 모델이 발전함에 따라, 이를 활용한 이미지 및 비디오 압축 기술에 관한 연구가 빠르게 진행되고 있다. NNIC (Neural Network based Image Coding)는 이러한 학습 가능한 인공신경망 기반 이미지 부호화 기술을 의미한다. 본 논문에서는 NNIC 모델과 인공신경망 기반의 초해상화(Super Resolution) 모델을 합동훈련하여 기존 NNIC 모델보다 더 높은 성능을 보일 수 있는 방법을 제시한다. 먼저 NNIC 인코더(Encoder)에 이미지를 입력하기 전 다운 스케일링(Down Scaling)으로 쌍삼차보간법을 사용하여 이미지의 화소를 줄인 후 부호화(Encoding)한다. NNIC 디코더(Decoder)를 통해 부호화된 이미지를 복호화(Decoding)하고 업 스케일링으로 초해상화를 통해 복호화된 이미지를 원본 이미지로 복원한다. 이때 NNIC 모델과 초해상화 모델을 합동훈련한다. 결과적으로 낮은 비트량에서 더 높은 성능을 볼 수 있는 가능성을 보았다. 또한 합동훈련을 함으로써 전체 성능의 향상을 보아 학습 시간을 늘리고, 압축 잡음을 위한 초해상화 모델을 사용한다면 기존의 NNIC 보다 나은 성능을 보일 수 있는 가능성을 시사한다.

  • PDF

소프트웨어 분산 공유메모리 시스템 상에서 효율적인 일관성 모델 (An Efficient Consistency Model for Software Distributed Shared Memory Systems)

  • 김태규;홍영식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.133-135
    • /
    • 1998
  • 분산 공유메모리 시스템(DSM)의 성능 향상을 위해 일관성 모델의 측면에서 많은여구가 진행되었다. 분산 공유메모리 시스템의 성능을 저하시키는 가장 큰 요인은 거짓 공유 문제와 별도의 통신비용 문제를 들 수 있는데 , 동기화 연산에 의한 일관성 유지 방법, 흠-기반 접근방법 등의 보다 완화된 메모리 모델로서, 이러한 문제점을 해결하려는 연구가 진행되어 왔고, 어느 정도 타당한 결과를 보았다. 본 논문에서는 동기화 연산에 의한 일관성 모델을 기초로 동적 흠-기반 접근 방법을 제안하며, 이것은 흠에서의 이점 및 부하를 여러 프로세서에게 분산시켜 시스템 전반의 성능 향상을 가져온다.

  • PDF

전송 채널의 불규칙적인 PDP의 특성에 따른 OFDM 시스템의 성능 분석 (Performance analysis of OFDM systems considering irregular PDP characteristics of propagation channels)

  • 이형권;류은숙;이종길
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.59-62
    • /
    • 2000
  • 본 논문에서는 실측 데이터를 기준으로 9가지의 다양한 모델을 제안한 JTC(Joint Technical Committee) 모델을 전송 채널 모델로 채택하여 채널의 PDP(Power Delay Profile)의 불규칙성 따른 OFDM (Orthogonal Frequency Division Multiplexing) 통신 시스템의 성능을 분석하였다 전송 채널의 불규칙성은 Main profile의 길이, Peak 위치, Echo profile의 지연 시간, 그리고 Echo profile의 강도로 분류하여 각각에 따른 PDP를 설정하여 각 모델에 따른 OFDM 시스템의 성능 분석을 하였다.

  • PDF

성능분석 모델을 이용한 ATM 교환기 TMN EMS의 용량 측정 기법 (A Capability Measurement Scheme Using a Performance Analysis Model for the TMN EMS of ATM Switching Systems)

  • 강병도
    • 한국정보처리학회논문지
    • /
    • 제7권8S호
    • /
    • pp.2663-2671
    • /
    • 2000
  • 본 논문에서는 ATM 교환기 TMN EMS의 성능 분석을 위한 큐잉 모델을 제시한다. ATM 교환기 관리를 위한 TMN 시스템은 관리자, 대행자, ATM 교환기 등이 계층적인 구조로 이루어져 있다. 관리자는 여러개의 대행자와 통신하며, 대행자는 ATM 교환기의 관리 기능을 대행한다. 우리는 EMS를 구성하는 관리자의 용량과 성능을 예측하기 위하여 큐잉 모델을 정의하였다. 이 모델을 통하여 EMS의 평균 서비스 시간과 용량을 예측할 수 있다.

  • PDF

DMT ADSL 성능 모델 및 서비스 망

  • 양충렬;김진태;강석열
    • 정보와 통신
    • /
    • 제14권6호
    • /
    • pp.109-122
    • /
    • 1997
  • 본 고에서는 통과 대역 DMT ADSL 시스템의 등화기 구조를 설계하고 이를 포함하는 DMT ADSL 시스템 성능 모델을 제시하였다. CSA 지역에서 다중 반송파 변조 방식(multicarrier modulation)을 전송방식으로 하는 6Mb/s급의 ADSL 서비스를 위하여 가입자 루프 및 전송신호 특성을 고려한 노이즈 모델을 고찰하고 DMT ADSL 시스템에서 성능예측을 위한 시뮬레이션 모델을 제시하였다. 그리고 기존에 설치되어 있는 일반 전화선(unshilided twisted pair copper wire)를 이용하여 ATM 환경에서 가입자에게 주문형 비디오(video on demand) 서비스, 화상전화회의 서비스, 고속 인터넷 접속 서비스를 제공하기 위한 서비스 망 구조를 제시하였다.

  • PDF

고성능 Grid 환경에서의 LDAP 시스템의 분산모델과 복제모델의 특성 (Characteristic of Data Distribution and Data Replication based Model of LDAP System in High Performance Grid Environments)

  • 권성호;김희철
    • 한국산업정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.77-84
    • /
    • 2004
  • 최근, 국내외적으로 국가차원에서 Grid에 대한 다양한 연구가 이루어지고 Grid 컴퓨팅 기술에 대한 상용화의 추세가 보이면서 Grid 시스템에 참여하는 엔티티의 수가 날로 증가하고 있다. 따라서 Globus에 기반 한 Grid환경에서의 기존의 LDAP시스템은 늘어나는 부하를 처리하기에는 충분하지 못하게 되었고 제공할 수 있는 성능의 한계를 초과하고 있다. 이를 위하여 고성능 Grid환경에 부합되는 새로운 LDAP시스템의 설계가 필수적이고 이를 위해서는 기존 LDAP시스템에 대한 성능분석이 우선시 되어야 한다. 하지만 기존의 대부분의 연구는 읽기 동작이 대부분을 차지하는 기존의 응용들을 위한 성능향상에 목적을 두고 있어서 쓰기 동작이 대부분을 차지하는 Grid환경에 적용하기에는 부적합하다. 본 논문에서는 노드수(n), 도착율(λ), 읽기 확률(Pr)변화에 따른 분산 기반 모델과 복제 기반 모델에서 성능분석의 결과를 제시한다. 이를 위하여 M/M/l 큐잉모델을 기초로 기존 LDAP시스템에 대한 분산과 복제에 기반 한 분석모델을 도출하고, 분석모델을 통한 성능분석의 결과를 제시한다. 본 논문의 목표는 이러한 성능분석의 결과를 바탕으로 고성능 Grid환경에 부합되는 새로운 LDAP시스템의 설계방향을 제시하고자 한다. 또한 이러한 결과들은 고성능 Grid환경에서 LDAP기반의 GIS시스템의 설계에 기초자료 활용할 수 있을 것으로 사료된다.

  • PDF

레티넥스 모델과 조명-반사율 모델의 조명 보상 성능 비교 연구 (Comparative Study on Illumination Compensation Performance of Retinex model and Illumination-Reflectance model)

  • 정지년;양현승
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권11호
    • /
    • pp.936-941
    • /
    • 2006
  • 대상인식 기술을 실제 환경에 적용하기 위해서는 조명 보상 기술 개발이 필수적이다. 본 논문은 조명의 방향 변화로 인한 영상의 변화를 보상하는 방법으로써 레티넥스 모델과 조명-반사율 모델에 주목하고, 이를 다양한 방법으로 구현하고 그 성능을 비교함으로써 효과적인 조명 보상방법을 제시하였다. 본 논문에서는 레티넥스 모델을 단일 스케일 레티넥스, 다중 스케일 레티넥스와 이를 신경망으로 재구성한 레티넥스 신경망, 다중 스케일 레티넥스 신경망으로 구현하였다. 조명 반사율 모델은 조명 영상을 이산코사인변환, 웨이블릿변환을 통한 저주파 필터링과 가우시안 블러로 구한 후, 이를 이용하여 반사율 영상을 계산하여 조명 보상을 수행하도록 하였다. 구현된 조명 보상을 9가지 조명 방향 변화가 존재하는 얼굴 영상에 대해 조명 보상을 수행하여, 그 성능을 측정하고 비교하였으며, 더불어 주성분분석 계수를 이용하여 그 성능을 측정하였다. 실험 결과 조명-반사율 모델이 보다 좋은 성능을 보였으며, 주성분분석 계수를 추출한 경우 전반적인 성능향상을 얻을 수 있었다.

전이학습을 이용한 UNet 기반 건물 추출 딥러닝 모델의 학습률에 따른 성능 향상 분석 (Performance Improvement Analysis of Building Extraction Deep Learning Model Based on UNet Using Transfer Learning at Different Learning Rates)

  • 예철수;안영만;백태웅;김경태
    • 대한원격탐사학회지
    • /
    • 제39권5_4호
    • /
    • pp.1111-1123
    • /
    • 2023
  • 원격탐사 영상을 이용한 지표 속성의 변화를 모니터링 하기 위해서 딥러닝(deep learning) 모델을 이용한 의미론적 영상 분할 방법이 최근에 널리 사용되고 있다. 대표적인 의미론적 영상 분할 딥러닝 모델인 UNet 모델을 비롯하여 다양한 종류의 UNet 기반의 딥러닝 모델들의 성능 향상을 위해서는 학습 데이터셋의 크기가 충분해야 한다. 학습 데이터셋의 크기가 커지면 이를 처리하는 하드웨어 요구 사항도 커지고 학습에 소요되는 시간도 크게 증가되는 문제점이 발생한다. 이런 문제를 해결할 수 있는 방법인 전이학습은 대규모의 학습 데이터 셋이 없어도 모델 성능을 향상시킬 수 있는 효과적인 방법이다. 본 논문에서는 UNet 기반의 딥러닝 모델들을 대표적인 사전 학습 모델(pretrained model)인 VGG19 모델 및 ResNet50 모델과 결합한 세 종류의 전이학습 모델인 UNet-ResNet50 모델, UNet-VGG19 모델, CBAM-DRUNet-VGG19 모델을 제시하고 이를 건물 추출에 적용하여 전이학습 적용에 따른 정확도 향상을 분석하였다. 딥러닝 모델의 성능이 학습률의 영향을 많이 받는 점을 고려하여 학습률 설정에 따른 각 모델별 성능 변화도 함께 분석하였다. 건물 추출 결과의 성능 평가를 위해서 Kompsat-3A 데이터셋, WHU 데이터셋, INRIA 데이터셋을 사용하였으며 세 종류의 데이터셋에 대한 정확도 향상의 평균은 UNet 모델 대비 UNet-ResNet50 모델이 5.1%, UNet-VGG19 모델과 CBAM-DRUNet-VGG19 모델은 동일하게 7.2%의 결과를 얻었다.