• Title/Summary/Keyword: R 언어

Search Result 407, Processing Time 0.033 seconds

Dense Retrieval using Pretrained RoBERTa with Augmented Query (증강된 질문을 이용한 RoBERTa 기반 Dense Passage Retrieval)

  • Jun-Bum Park;Beomseok Hong;Wonseok Choi;Youngsub Han;Byoung-Ki Jeon;Seung-Hoon Na
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.141-145
    • /
    • 2022
  • 다중 문서 기반 대화 시스템에서 응답 시스템은 올바른 답변을 생성하기 위해서 여러 개의 문서 중 질문과 가장 관련 있는 문서를 검색하는 것부터 시작해야 한다. DialDoc 2022 Shared Task[1]를 비롯한 최근의 연구들은 대화 시스템의 문서 검색 과정을 위해 Dense Passage Retrieval(DPR)[2] 모델을 사용하고 있으며 검색기의 성능 개선을 위해 Re-ranking과 Hard negative sampling 같은 방법들이 연구되고 있다. 본 논문에서는 문서에 기반하는 대화 데이터의 양이 적거나 제한될 경우, 주어진 데이터를 효율적으로 활용해 보고자 검색기를 생성 모델을 이용하여 문서의 엔티티를 기반으로 질문을 생성하고 기존 데이터에 증강하는 방법을 제시했으며 실험의 결과로 MRR metric의 경우 0.96 ~ 1.56의 성능 향상을, R@1 metric의 경우 1.2 ~ 1.57의 성능 향상을 확인하였다.

  • PDF

Preparation of Tomographic Maps Based on the R Package (R 패키지를 이용한 토모그라피 지도 제작)

  • Chung, Tae-Woong;Lees, Jonathan M.
    • Geophysics and Geophysical Exploration
    • /
    • v.11 no.4
    • /
    • pp.373-378
    • /
    • 2008
  • Being widely used for preparation of geographic maps in the field of earth sciences, Generic Mapping Tools (GMT) is difficult to understand the contents for user, and not working well with Microsoft (MS) Window PC. By utilizing R package, 'GEOmap', we can do mapping work at MS window PC with commands easier than those of GMT. In addition, the R commands offer interactive help. Here we introduce brief feature of 'GEOmap', and illustrate the procedure for preparing tomographic maps with an example.

Realization of an outlier detection algorithm using R (R을 이용한 이상점 탐지 알고리즘의 구현)

  • Song, Gyu-Moon;Moon, Ji-Eun;Park, Cheol-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.3
    • /
    • pp.449-458
    • /
    • 2011
  • Illegal waste dumping is one of the major problems that the government agency monitoring water quality has to face. Recently government agency installed COD (chemical oxygen demand) auto-monitering machines in river. In this article we provide an outlier detection algorithm using R based on the time series intervention model that detects some outlier values among those COD time series values generated from an auto-monitering machine. Through this algorithm using R, we can achieve an automatic algorithm that does not need manual intervention in each step, and that can further be used in simulation study.

Analysis of Job Data on Media (미디어에 나타난 직업 관련 데이터의 분석)

  • Ban, ChaeHoon;Jung, YoonSeung;Jeong, DongMin
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2018.05a
    • /
    • pp.152-155
    • /
    • 2018
  • 과거와는 비교 할 수 없을 만큼 방대한 양의 데이터가 생산되는 정보화 시대에서 과거와 현재의 데이터를 비교 분석하는 것이 매우 중요하다. 이러한 데이터를 분석하는 도구인 R은 통계 기반의 정보 분석을 가능하게 하는 언어와 환경이다. 본 논문에서는 R을 이용하여 미디어에 나타난 직업 관련 빅데이터를 분석한다. 다양한 미디어에서 직업 관련 데이터를 수집하고 어떠한 텍스트가 분포되어 있는지 빈도 조사를 수행한다.

  • PDF

Analysis of University Department Name (전국 대학의 학과 명칭 분석)

  • Ban, ChaeHoon;Kim, Dong Hyun;Ha, JongSoo
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2018.05a
    • /
    • pp.145-148
    • /
    • 2018
  • IT 기술의 발전에 따라 미래를 예측할 수 있는 빅데이터 의 중요성이 강조되고 있으며, 다양한 산업에서 이를 활용하고 있다. 이러한 빅 데이터를 분석할 수 있는 도구인 R은 통계 기반의 정보 분석을 가능하게 하는 언어와 환경이다. 대학은 최고의 학문기관으로서 시대의 발전과 요구에 따라 그에 대응하는 학과를 개설하고 유지해 왔다. 따라서 대학의 학과명을 분석하면 현 시대의 요구와 기술의 발전에 대하여 알 수 있다. 본 논문에서는 빅데이터 분석도구인 R을 이용하여 전국에 2 4년제 대학, 대학원의 학과를 분석한다. 학과 명칭을 수집하고 각 데이터를 분석하여 학과 명칭의 빈도를 조사하며 대학에 어떤 학과 명칭이 자주 사용되는지를 파악한다.

  • PDF

Analysis of Transportation Big Data in Busan on Media (미디어에 나타난 부산 교통 관련 빅데이터의 분석)

  • Ban, ChaeHoon;Kim, YongSu;Lee, YeChan;Jung, YoonSeung;Jeong, DongMin;Cho, HaeChan
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.05a
    • /
    • pp.378-381
    • /
    • 2016
  • 정보기술과 디지털 경제의 확산으로 대규모의 데이터가 생산되는 정보화시대에서 빅데이터의 중요성이 강조되고 있으며 다양한 분야에서 이를 응용하고 있다. 빅 데이터 분석 도구인 R은 통계 기반의 정보 분석을 가능하게 하는 언어와 환경이다. 본 논문에서는 R을 이용하여 미디어에 나타난 부산 교통 관련 빅데이터를 분석한다. 다양한 미디어에서 부산 교통 관련 데이터를 수집하고 어떠한 텍스트가 분포되어 있는지 빈도 조사를 수행한다.

  • PDF

Analysis and Visualization of Sleep Data by Using R (R을 이용한 수면 데이터 분석 및 시각화)

  • Jang, Yuhee;Yoo, Chi-Hun;Lim, Hyo-Sang
    • Annual Conference of KIPS
    • /
    • 2015.10a
    • /
    • pp.1226-1229
    • /
    • 2015
  • 최근 인구 고령화 시대에 맞춰 개인건강에 대한 관심이 높아지고 있다. 이에 따라 헬스케어에 대한 관심이 집중되고 있으며, 스마트 기기나 웨어러블(wearable) 기기를 이용한 다양한 헬스케어 서비스들이 등장하였다. 특히 건강한 삶을 유지하는데 필수적으로 요구되는 수면에 관련 서비스들이 존재하지만, 사용자에게 실질적인 효용성을 제공하는 것에는 한계를 드러낸다. 본 논문에서는 사용자 자신의 수면 상태를 점검하여 올바른 수면 습관을 유도할 수 있도록 사용자의 수면주기를 시각화시키는 연구를 수행한다. 이를 위해 데이터 통계와 시각화에 적합한 언어인 R을 사용하여 사용자의 수면 데이터를 분석하여 시각화한다.

Analysis on Big data, IoT, Artificial intelligence using Keyword Network (빅데이터, IoT, 인공지능 키워드 네트워크 분석)

  • Koo, Young-Duk
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.15 no.6
    • /
    • pp.1137-1144
    • /
    • 2020
  • This paper aims to provide strategic suggestions by analyzing technology trends related to big data, IoT, and artificial intelligence. To this end, analysis was performed using the 2018 national R&D information, and major basic analysis and language network analysis were performed. As a result of the analysis, research and development related to big data, IoT, and artificial intelligence are being conducted by focusing on the basic and development stages, and it was found that universities and SMEs have a high proportion. In addition, as a result of the language network analysis, it is judged that the related fields are mainly research for use in the smart farm and healthcare fields. Based on these research results, first, big data is essential to use artificial intelligence, and personal identification research should be conducted more actively. Second, they argued that full-cycle support is needed for technology commercialization, not simple R&D activities, and the need to expand application fields.

Understanding of foreign-born Korean Children's Early School Adjustment in the U.S - Language Development and Maternal Influences - (미국 내 거주하는 한국 국적을 가진 아동의 초기 학교 적응에 관한 연구 - 언어발달과 어머니의 영향 중심으로 -)

  • Seo SO-Jung
    • Journal of the Korean Home Economics Association
    • /
    • v.43 no.5 s.207
    • /
    • pp.131-147
    • /
    • 2005
  • The purpose of this study was to provide a better understanding of foreign-born Korean children's early school adjustment in the U.S. The interaction between the foreign-born Korean children in the U.S. and several of the children's microsystems, including family, school, and peer was assessed to meet this purpose. The study subjects were 43 foreign-bom Korean children who were sampled from Korean Sunday Language schools and who attended local schools in the Boston area, MA, USA. Quantitative analysis was conducted to identify which variables of interest predicted the early adjustment of this group of children. Furthermore, in-depth interviews were conducted with mothers of the children from the top and bottom groups 1) the most successful (in the top quartile) and 2) the least successful adjustment groups (in the bottom quartile) sorted by scores on the Peabody Picture Vocabulary Test-Revised (PPVT-R). The interview results were analyzed to elicit maternal perceptions/beliefs on education, in general, and those of home-school relationships, in specific. Several conclusions can be drawn from both the quantitative and qualitative analyses. The results of multiple regression and path analysis showed that the children's language development predicted their adjustment, but the effects of the other two variables, peer relationships and school experiences, on the adjustment of children, were mediated through the children's language. Moreover, common themes and patterns in the responses to a series of open-ended questions emerged from the interviews with the two groups of mothers. The two mothers of the least successful group were concerned about their children's future and school success, but thev did not show anv responsive attitudes toward achieving this goal. By contrast, the mothers from the most successful group were self-determined with regard to their children's education and had strong beliefs and values on how to raise their children in the new culture. The implications were discussed.

An RDB to RDF Mapping System Considering Semantic Relations of RDB Components (관계형 데이터베이스 구성 요소의 의미 관계를 고려한 RDB to RDF 매핑 시스템)

  • Sung, Hajung;Gim, Jangwon;Lee, Sukhoon;Baik, Doo-Kwon
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.3 no.1
    • /
    • pp.19-30
    • /
    • 2014
  • For the expansion of the Semantic Web, studies in converting the data stored in the relational database into the ontology are actively in process. Such studies mainly use an RDB to RDF mapping model, the model to map relational database components to RDF components. However, pre-proposed mapping models have got different expression modes and these damage the accessibility and reusability of the users. As a consequence, the necessity of the standardized mapping language was raised and the W3C suggested the R2RML as the standard mapping language for the RDB to RDF model. The R2RML has a characteristic that converts only the relational database schema data to RDF. For the same reasons above, the ontology about the relation data between table name and column name of the relational database cannot be added. In this paper, we propose an RDB to RDF mapping system considering semantic relations of RDB components in order to solve the above issue. The proposed system generates the mapping data by adding the RDFS attribute data into the schema data defined by the R2RML in the relational database. This mapping data converts the data stored in the relational database into RDF which includes the RDFS attribute data. In this paper, we implement the proposed system as a Java-based prototype, perform the experiment which converts the data stored in the relational database into RDF for the comparison evaluation purpose and compare the results against D2RQ, RDBToOnto and Morph. The proposed system expresses semantic relations which has richer converted ontology than any other studies and shows the best performance in data conversion time.