• Title/Summary/Keyword: R 언어

Search Result 407, Processing Time 0.024 seconds

R2FID: Joint Reranker in Fusion-In-Decoder for Open Domain Question Answering over Tables (R2FID: Joint Reranker기반 Fusion-In-Decoder를 이용한 오픈 도메인 테이블 질의 응답)

  • Sung-Min Lee;Eunhwan Park;Seung-Hoon Na;Daeryong Seo;Donghyeon Jeon;Inho Kang
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.100-104
    • /
    • 2022
  • 오픈 도메인 질의 응답(Open Domain Question Answering)은 주어진 질문에 대한 단서가 주어지지 않은 환경에서 정답을 도출해 내는 어려운 문제이다. 최근 테이블 데이터와 같은 구조화된 데이터에서의 질의응답 시스템에 대한 중요도가 점차 높아지면서, 본 논문에서는 위키피디아에 등장하는 테이블들을 대상으로 한국어 테이블 오픈 도메인 질의 응답 시스템을 구성하기로 한다. 또한, 테이블 검색의 한계를 보완하기 위해 Joint Reranker 기반 Fusion-In-Decoder를 제안하고 적용하여 질의응답 Task에서 베이스라인에 대비하여 EM 3.36, F1-Score 3.25 향상을 이루어냈다.

  • PDF

Analysis of muddy water generation status using R (R을 이용한 흙탕물 발생현황 분석)

  • Park, Woon Ji;Oh, Seung Min;Lim, Kyoung Jae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.350-350
    • /
    • 2022
  • R은 통계 및 빅데이터 분석에 널리 사용되는 오픈 소스 프로그래밍 언어로, 통계와 그래픽스에 관련된 기능을 확정할 수 있어 다양한 분야에 활용되고 있다. 특히, 수자원 분야의 연구에서 그 활용이 늘어나고 있으며, 최근 들어 다양한 수자원 관련 R 패키지가 발표되고 있다. 이중, 미국 지질조사국(U.S. Geological Survey, USGS)이 개발한 EGRET은 수질 및 유출량 자료의 장기 추세 변화 분석을 위한 패키지로 R 프로그래밍 언어를 기반으로 구동되며, 분석·처리한 데이터에 대하여 광범위한 그래픽 프리젠테이션을 제공하여 탐색적 자료 분석에 매우 효과적인 도구이다. 특히, EGRET 패키지는 농도와 유출 사이의 관계 특성, 수집된 자료의 계절성 존재 및 특성, 점진적 또는 급격한 경향의 존재를 검토할 수 있는 그래픽 결과를 제시하며, 가중 회귀(Weighted Regressions on Time, Discharge, and Season, 이하 WRTDS) 모델을 적용하여 농도와 부하의 상태와 경향을 특성화한다. 시간, 유량 및 계절에 대한 WRTDS 모델은 농도 및 부하의 상태와 경향을 특성화하는 데 사용할 수 있는 수질 데이터 세트의 분석 방법으로, 근본적으로 탐색적 데이터 분석 방법으로 다양한 유형의 트렌드 시나리오에 민감하도록 설계되었으며 선형 또는 2차 함수형에 맞지 않을 수 있는 시간적 추세를 탐지하여 설명할 수 있고, 불규칙한 간격의 자료를 사용하기에 적합한 장점이 있다. 본 연구에서는 북한강 상류의 지속적인 흙탕물 발생으로 문제가 되고 있는 자운지구의 자운천을 대상으로 흙탕물 발생 현황을 분석하기 R을 이용하여 탐색적 자료 분석을 실시하였다. 자료 분석은 EGRET 패키지를 사용하여 수집된 자료(2016년 4월 - 2021년 7월까지 수집된 191개의 SS 자료와 인근 유량측정망의 유량자료)의 유량과 SS 농도 간의 관계, 시간에 따른 SS 농도 분포, SS 농도의 월별 특성 분석 및 유황별 SS 농도 변화 등을 검토하였으며, WRTDS 모델로 SS와 부하량을 예측하고 검토하여 자운천 유역의 흙탕물 부하 특성을 검토하였다.

  • PDF

Performance Analysis for Accuracy of Personality Recognition Models based on Setting of Margin Values at Face Region Extraction (얼굴 영역 추출 시 여유값의 설정에 따른 개성 인식 모델 정확도 성능 분석)

  • Qiu Xu;Gyuwon Han;Bongjae Kim
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.24 no.1
    • /
    • pp.141-147
    • /
    • 2024
  • Recently, there has been growing interest in personalized services tailored to an individual's preferences. This has led to ongoing research aimed at recognizing and leveraging an individual's personality traits. Among various methods for personality assessment, the OCEAN model stands out as a prominent approach. In utilizing OCEAN for personality recognition, a multi modal artificial intelligence model that incorporates linguistic, paralinguistic, and non-linguistic information is often employed. This paper examines the impact of the margin value set for extracting facial areas from video data on the accuracy of a personality recognition model that uses facial expressions to determine OCEAN traits. The study employed personality recognition models based on 2D Patch Partition, R2plus1D, 3D Patch Partition, and Video Swin Transformer technologies. It was observed that setting the facial area extraction margin to 60 resulted in the highest 1-MAE performance, scoring at 0.9118. These findings indicate the importance of selecting an optimal margin value to maximize the efficiency of personality recognition models.

Development of Flood Runoff Characteristics Nomograph for Small Catchment Using R-Programming (R-프로그래밍을 이용한 소유역 홍수유출특성 노모그래프 개발)

  • Jang, Cheol Hee;Kim, Hyeon Jun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.590-590
    • /
    • 2015
  • 본 연구는 집중호우에 의한 홍수예측 및 소유역의 유출거동에 대한 수문학적 민감성(susceptibility) 규명을 목적으로 강우강도, 지속기간 및 토양포화도 변화에 따른 홍수유출특성을 분석하여 유역의 유출거동 민감성을 표출할 수 있는 노모그래프를 개발하였다. 개별 홍수사상에 대한 유출거동 특성 분석을 위하여 한국건설기술연구원의 대표 시험유역인 설마천 유역의 과거 17년간(1996 ~ 2012)의 10분 간격의 강우량 및 유출량 자료를 수집하여 홍수유출해석을 수행하였다. 설마천 시험유역의 일누가강우량 100mm 이상, 50개 홍수사상에 대한 홍수유출해석은 유역 물순환 해석모형인 CAT(Catchment hydrological cycle Assessment Tool)을 이용하였으며 모의결과를 바탕으로 홍수사상별 지체시간, 강우강도, 지속기간 및 토양포화도 변화에 따른 홍수유출특성을 상세히 분석하였다. 이 중에서도 지체시간은 유역반응을 나타내는 시간변수로서 수문모델링 및 홍수량예측에 매우 중요한 요소이다. 특히, 강우량에 대한 홍수량의 반응이 빠른 소유역의 경우에 홍수량예측에 큰 영향을 미친다. 따라서 강우강도, 지속기간, 토양포화도의 변화량에 대한 지체시간의 거동을 R 프로그래밍 언어 및 3D Surfer를 이용하여 분석한 후 최종적으로 소유역의 홍수유출 특성을 나타내는 3차원 홍수 유출특성 노모그래프를 개발하였다. 분석에 사용된 R 프로그래밍 언어는 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경으로 데이터의 조작 및 수치연산, 시각화를 수행할 수 있는 기능을 여러 패키지를 통해 구현할 수 있다. 따라서 본 연구에서는 R을 이용하여 10분 단위의 강우 및 유출량 자료를 1시간 및 1일 자료로 구축하고 17년간의 과거 홍수사상을 분리하여 추출하는 R 홍수유출해석 시스템을 개발하였으며 추출된 홍수사상을 관측 유출량 및 관측 토양수분을 포함하여 시각화함으로써 강우 및 토양수분 변화에 따른 소유역의 유출거동 민감성을 확인할 수 있었다. 분석 결과, 지체시간은 강우지속기간 및 토양포화도에 민감한 거동특성을 나타냈으며 토양포화도는 첨두홍수량의 변화에 민감한 영향을 주는 것으로 확인되었다. 개발된 3차원 홍수유출특성 노모그래프는 유역의 규모 및 지형물리학적 특성에 따라 다양하게 나타날 것으로 판단되며 여러 계측유역에 적용함으로써 유역별 홍수유출 반응특성을 정량화할 필요가 있다. 즉, 강우강도, 지속기간, 지체시간, 포화도 등의 변화에 따른 유역의 홍수유출 반응특성을 규명함으로써 미계측 유역의 홍수량예측 실무에 활용할 수 있을 것으로 판단된다.

  • PDF

Reliability of Computerized Measurement of Laryngeal Erythema (후두 발적에 대한 컴퓨터 평가 시스템의 신뢰도 연구)

  • Moon, Byoung-Jae;Nam, Soon-Yuhl;Kim, Sang-Yoon;Choi, Seung-Ho
    • Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
    • /
    • v.16 no.1
    • /
    • pp.19-22
    • /
    • 2005
  • Background and Objectives : While considerable progress has been made in enhancing the quality of laryngoscopy and image processing, the evaluation of laryngeal erythema is still based on the clinician's judgement. The purpose of this study is to quantitatively measure the degree of erythema and to examine the relationship with clinical grading. Materials and Methods : Color images of larynx from 100 subjects were captured from video-documented examinations of laryngoscopy. The amount of erythema within the digitized larynx image was quantified using software developed and was compared with a grading system (0 to 3 scale) based on visual inspection by 4 experienced clinicians. The results were compared by deriving Kappa, Kendall and Spearman statistic. Results : There was high intra-observer(R=0.402-0.755) and inter-observer correlation (R=0.789). Among parameters, the red composite value had most remarkable agreement with clinical grading(R=0.827). Conclusion : The result suggest that the computer based analysis of laryngeal erythema can provide quantiative data on degree of erythema and the basis for further development of an expert system.

  • PDF

H.264/AVC Fast Intra Mode Decision using GPGPU Parallel Programming (GPGPU 병렬 프로그래밍을 이용한 H.264/AVC 고속 화면내 예측 모드 결정)

  • Choi, Sung-Jun;Han, Ki-Hun;Yoo, Yeong-Soo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.11a
    • /
    • pp.110-112
    • /
    • 2011
  • GPU의 병렬성과 연산능력을 일반적인 공학적 문제 해결에 적용하는 GPGPU 컴퓨팅에 대한 연구가 최근 활발히 진행되고 있다. 비디오 압축과정에는 많은 양의 화소 데이터에 동일하게 반복되는 연산을 수행하는 알고리즘이 많이 적용되므로 GPGPU를 통한 고속 병렬 계산의 응용 분야로 매우 적합하다. H.264/AVC는 비디오를 압축하는 가장 최신의 국제표준으로 여러 제품군과 서비스에 대한 적용되어 시장에서 널리 사용되고 있다. 본 논문에서는 GPGPU의 응용 분야로 주목 받고 있는 비디오 압축 분야에 대한 적용으로 H.264/AVC의 화면내 예측 모드 결정과정에 GPGPU 병렬 프로그래밍을 적용하여 예측 모드 결정 속도를 향상하는 방법을 제안한다. GPU상에서의 데이터 병렬처리를 위해 CUDA C언어를 사용하였으며, CPU상에서의 연산은 C언어를 사용하여 구현되었다. GPU상에서 프레임 전체에 대한 화면내 예측 모드를 병렬적으로 결정함으로써 이에 소요되는 시간을 줄여 줄 수 있었다. 실험결과 GPU상에서 병렬적으로 예측 모드를 결정할 때 Full-HD급 영상에서 약 2.8배 정도의 속도 향상을 확인할 수 있었다. 향후 GPGPU 병렬 프로그래밍을 화면 내 예측뿐만 아니라 반복되는 연산을 수행하는 다른 알고리즘에도 적용하여 부호화기의 계산 부담을 덜어준다면 고속 실시간 비디오 압축 부호기 개발이 더욱 용이해 질것으로 기대된다.

  • PDF

The effects of verbal violence on stress among dental hygienists and mediating effects of positive psychological capital (언어폭력이 치과위생사의 스트레스에 미치는 영향과 긍정심리자본의 매개)

  • Park, Jung-Hyun;Jang, Kyeung-Ae
    • Journal of Korean society of Dental Hygiene
    • /
    • v.19 no.2
    • /
    • pp.241-249
    • /
    • 2019
  • Objectives: This study aimed to investigate the effects of verbal violence experience on stress and positive psychological capital as well as the mediating effects of positive psychological capital. Methods: A survey was conducted with dental hygienists working at university hospitals, general hospitals, and dental hospitals and clinics in Busan, Gyeongnam, and Ulsan areas.Of the 230 questionnaires distributed, 206 were used in the analysis after excluding 24 completed questionnaires that had errors or missing answers. Results: As a result of identifying the relationships between verbal violence damage, positive psychological capital, and stress, verbal violence damage was negatively correlated with positive psychological capital (r=-0.28, p<0.001) and positively correlated with stress (r=0.40, p<0.001). Positive psychological capital had a negative correlation with stress (r=-0.25, p<0.001). As a result of verifying the mediating effects of positive psychological capital on the relationship between verbal violence damage and stress among dental hygienists, it was found that verbal violence had a significant effect on stress and positive psychological capital in the first and second stages. In the third stage, the effect of positive psychological capital on stress was significant, showing that there was a mediating effect. Conclusions: Therefore, sound work environments should aim to reduce verbal violence while increasing support systems to reduce negative emotional and psychological states.

SimKoR: A Sentence Similarity Dataset based on Korean Review Data and Its Application to Contrastive Learning for NLP (SimKoR: 한국어 리뷰 데이터를 활용한 문장 유사도 데이터셋 제안 및 대조학습에서의 활용 방안 )

  • Jaemin Kim;Yohan Na;Kangmin Kim;Sang Rak Lee;Dong-Kyu Chae
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.245-248
    • /
    • 2022
  • 최근 자연어 처리 분야에서 문맥적 의미를 반영하기 위한 대조학습 (contrastive learning) 에 대한 연구가 활발히 이뤄지고 있다. 이 때 대조학습을 위한 양질의 학습 (training) 데이터와 검증 (validation) 데이터를 이용하는 것이 중요하다. 그러나 한국어의 경우 대다수의 데이터셋이 영어로 된 데이터를 한국어로 기계 번역하여 검토 후 제공되는 데이터셋 밖에 존재하지 않는다. 이는 기계번역의 성능에 의존하는 단점을 갖고 있다. 본 논문에서는 한국어 리뷰 데이터로 임베딩의 의미 반영 정도를 측정할 수 있는 간단한 검증 데이터셋 구축 방법을 제안하고, 이를 활용한 데이터셋인 SimKoR (Similarity Korean Review dataset) 을 제안한다. 제안하는 검증 데이터셋을 이용해서 대조학습을 수행하고 효과성을 보인다.

  • PDF

Seismic Data Analysis using the R (R을 이용한 지진자료 처리)

  • Chung, Tae-Woong;Lees, Jonathan M.;Yoon, Suk-Yung
    • Geophysics and Geophysical Exploration
    • /
    • v.11 no.4
    • /
    • pp.379-384
    • /
    • 2008
  • R is a free software for statical computing and graphics. It compiles and runs not only on UNIX platforms but MS Windows. The R commands are easy and offer interactive help. R is used in extensive field by implementing packages. RSEIS, the package of R, enable us to do easy graphic process of seismic data. Here we illustrate an example of the seismic data process using RSEIS.

The Conceptual Unit Extraction and Knowledge Base Construction from Korean Sentence (한국어 문장으로부터 개념단위의 추출과 지식베이스의 구축)

  • Han, K.R.;Lee, J.K.
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.247-251
    • /
    • 1989
  • 본 논문은 한국어를 대상으로 하는 자연언어 처리 시스템을 개발하는데 있어서 기초가 되는 지식베이스의 구축에 대하여 논한다. 한국어의 일반문에서 단문을 분리해 내기 위하여 형태소 해석의 결과로부터 도출한 구 단위를 한-일 기계번역 시스템의 구문, 의미 해석기(VCPN) 을 적용하여 절단위로 결합한다. 그리고 이들 단위절에 대하여 대명사의 조응관계, 생략에의 재생을 위한 추론, 부정어, 시제일치 등을 처리하여 논리적 지식베이스를 구성하는 방법을 제안한다. 본 논문은 입력문장에 제한을 두지 않고 단문으로부터 장문에 이르기까지 광범위한 일반문을 대상으로 하여 Horn Clause 이론을 확장한다.

  • PDF