• Title/Summary/Keyword: 과학기술 데이터

Search Result 2,591, Processing Time 0.033 seconds

Korean Co-reference Resolution using BERT with Surfaceform (표층형을 이용한 BERT 기반 한국어 상호참조해결)

  • Heo, Cheolhun;Kim, Kuntae;Choi, Key-sun
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.67-70
    • /
    • 2019
  • 상호참조해결은 자연언어 문서 내에서 같은 개체를 나타내는 언급들을 연결하는 문제다. 대명사, 지시 관형사, 축약어, 동음이의어와 같은 언급들의 상호참조를 해결함으로써, 다양한 자연언어 처리 문제의 성능 향상에 기여할 수 있다. 본 논문에서는 현재 영어권 상호참조해결에서 좋은 성능을 내고 있는 BERT 기반 상호참조해결 모델에 한국어 데이터 셋를 적용시키고 표층형을 이용한 규칙을 추가했다. 본 논문의 모델과 기존의 모델들을 실험하여 성능을 비교하였다. 기존의 연구들과는 다르게 적은 특질로 정밀도 73.59%, 재현율 71.1%, CoNLL F1-score 72.31%의 성능을 보였다. 모델들의 결과를 분석하여 BERT 기반의 모델이 다양한 특질을 사용한 기존 딥러닝 모델에 비해 문맥적 요소를 잘 파악하는 것을 확인했다.

  • PDF

Fast Volume Rendering of VKH dataset using GPU Cluster (GPU 클러스터를 이용한 VKH 데이터의 빠른 볼륨 렌더링)

  • Lee Joong-Youn
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.763-765
    • /
    • 2005
  • 볼륨 렌더링은 3차원이나 그 이상의 차원의 볼륨 데이터에서 의미있는 정보를 추출해 내어 직관적으로 표출하는 가시화 기법을 말하며 의료영상 기상학, 유체역학 등 다양한 분야에서 널리 사용되고 있다. 한편, 최근 PC 하드웨어의 급격한 발전으로 과거에는 슈퍼컴퓨터에서나 가능했던 대용량 볼륨 데이터의 가시화가 일반 PC 환경에서도 가능하게 되었다. PC 그래픽스 하드웨어의 꼭지점 및 픽셀 세이더의 수치 계산에 최적화된 벡터 연산으로 빠른 볼륨 가시화를 가능하게 한 것이다. 그러나 그래픽스 하드웨어의 메모리 용량의 한계로 대용량의 볼륨 데이터를 빠르게 가시화하는 것은 지금까지 어려운 문제로 남아있다. 본 논문에서는 한국과학기술정보연구원에서 제작한 대용량의 인체영상 데이터인 Visible Korean Human 데이터를 여러 개의 그래픽스 하드웨어 메모리에 분산시키고 이를 꼭지점 및 픽셀 쉐이더를 이용하여 빠르게 가시화하여 고해상도의 이미지를 얻고자 하였다.

  • PDF

Apache Spark and Map Reduce with Performance Analysis using K-Means (K-means를 이용한 아파치 스파크 및 맵 리듀스 성능 분석)

  • Jung, Young-Gyo;Jung, Dong-Young;Song, Jun-Seok;You, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.01a
    • /
    • pp.77-78
    • /
    • 2016
  • 빅 데이터의 데이터 수집 및 분석 기술에 대한 연구는 컴퓨터 과학 분야에서 각광 받고 있다. 또한 소셜 미디어로 인한 대량의 비정형 데이터 분석을 요구하는 다양한 분야에 접목되어 효용성을 인정받고 있다. 그러나 빅 데이터 개념을 기반으로 하는 하둡과 스파크는 유즈케이스에 따라 성능이 크게 달라진다는 문제점이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 하둡의 맵리듀스를 줄이고 아파치 스파크를 이용한 빅 데이터 분석을 위하여 머신러닝 알고리즘인 K-Means 알고리즘을 이용하여 프로세싱 모델의 성능을 비교한다.

  • PDF

Fairness Analysis on Real-World Graph Data (실세계 그래프 데이터에 대한 공정성 분석)

  • Hojung Shin;Yeon-Chang Lee;Sang-Wook Kim
    • Annual Conference of KIPS
    • /
    • 2024.05a
    • /
    • pp.678-679
    • /
    • 2024
  • 그래프 신경망(Graph Neural Network, GNN)은 실세계 그래프 데이터에 대한 다양한 다운스트림 작업들에서 우수한 성능을 보여 왔다. 그러나, 최근 연구는 GNN 의 예측 결과가 데이터 내 특정 집단에 대한 차별을 내포할 수 있음을 지적했다. 이러한 문제를 해결하기 위해, 공정성을 고려할 수 있는 GNN 방법들이 설계되어 오고 있으나, 아직 실세계 그래프 데이터가 공정성 관점에서 어떠한 특성을 가지고 있는지에 대한 분석은 충분히 이루어지지 않았다. 따라서, 본 논문에서는 다양한 공정성 평가 지표를 활용하여 실세계 그래프 데이터의 공정성을 비교 분석한다. 실험 결과, 실세계 그래프 데이터들은 도메인 혹은 평가 지표에 따라 다른 특성을 가진다는 것을 확인하였다.

Design and Implementation of technical term dictionary system written in nML (nML을 이용한 기술용어 사전 시스템 구축)

  • 강현구;이광근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.70-72
    • /
    • 2001
  • ML은 엄밀한 수학적 모델에 기반 하여 구현된 프로그래밍 언어로서 고차함수, 복합형 함수와 엄격한 타입시스템을 지원하는 언어이다. nML은 한국과학기술원 프로그램 분석 시스템 연구단에서 연구중인 프로그램 분석 기술을 최대한 반영하여 구현하고 있는 ML의 한국형 사투리이다. 본 논문에서는 nML을 이용하여 일반적이고 자주 사용되는 프로그래밍 국면을 다양하게 반영한 응용프로그램을 구축하여 보았다. 구현하고자 하는 시스템은 중앙 집중형 데이터 서버를 가지는 기술용어 사전 시스템으로서 KDIC이라 명하였다. 본 시스템의 목적은 특정 분야에서 영어 용어들에 대한 전문인의 한글 용어로의 번역 사례를 모은 데이터 베이스를 구축하고, 이러한 번역 사례가 자연스럽게 이용되고자 함에 있다.

A Case Study for Development of Ideal Technology Market Knowledge Information System (이상적인 기술시장 지식정보시스템 개발에 관한 연구)

  • Sung, Kyung-Mo;Park, Hyun-Woo
    • Journal of Information Management
    • /
    • v.35 no.4
    • /
    • pp.17-33
    • /
    • 2004
  • The movement toward knowledge-based economy has been accelerated, which is based on creation, diffusion and utilization of knowledge and information. In this change, Technomarket knowledge information plays a vital role in establishing R&D strategies, deciding on new investments, introducing new technology, finding new market, making up future business plans, etc. In this study, we intend to build a system for techno-market knowledge information, which enables users to analyze and acquire useful data by themselves and provides techno-market knowledge information immediately on technologies and items to experts. In conclusion, through this system we are able to cope actively with the rapid environmental changes and the increasing uncertainties and contribute to a national technology competence.

Technology and Trend of Parallel Processor (병렬 프로세서 기술 및 동향)

  • Chung, M.K.;Park, S.M.;Eum, N.W.
    • Electronics and Telecommunications Trends
    • /
    • v.24 no.6
    • /
    • pp.86-93
    • /
    • 2009
  • 프로세서는 더 이상 동작 주파수를 높이는 방법이 아닌 다수의 프로세서를 집적하는 멀티프로세서로 기술 발전이 이루어지고 있다. 최근 2, 4, 8개의 프로세서 코어를 넘어 64, 128개 이상의 프로세서를 집적한 대규모 데이터 처리 및 과학 연산용 고성능 프로세서들이 개발되고 있다. 본 문서는 이러한 병렬 프로세싱의 개념 및 병렬 프로세서의 기술을 정리하고 최근 동향과 함께 당면한 문제점들을 기술한다.

Development of empirical formula for imbalanced transverse dispersion coefficient data set using SMOTE (SMOTE를 이용한 편중된 횡 분산계수 데이터에 대한 추정식 개발)

  • Lee, Sunmi;Yoon, Taewon;Park, Inhwan
    • Journal of Korea Water Resources Association
    • /
    • v.54 no.12
    • /
    • pp.1305-1316
    • /
    • 2021
  • In this study, a new empirical formula for 2D transverse dispersion coefficient was developed using the results of previous tracer test studies, and the performance of the formula was evaluated. Since many tracer test studies have been conducted under the conditions where the width-to-depth ratio is less than 50, the existing empirical formulas developed using these imbalanced tracer test results have limitations in applying to rivers with a width-to-depth ratio greater than 50. Therefore, in order to develop an empirical formula for transverse dispersion coefficient using the imbalanced tracer test data, the Synthetic Minority Oversampling TEchnique (SMOTE) was used to oversample new data representing the properties of the existing tracer test data. The hydraulic data and the transverse dispersion coefficients in conditions of width-to-depth ratio greater than 50 were oversampled using the SMOTE. The reliability of the oversampled data was evaluated using the ROC (Receiver Operating Characteristic) curve. The empirical formula of transverse dispersion coefficient was developed including the oversampled data, and the performance of the results were compared with the empirical formulas suggested in previous studies using R2. From the comparison results, the value of R2 was 0.81 for the range of W/H < 50 and 0.92 for 50 < W/H, which were improved accuracy compared to the previous studies.

Data sharing service over KREONET utilizing object storage service (오브젝트 스토리지 서비스를 활용한 국가과학기술연구망에서의 데이터 공유 서비스 제공 방안)

  • Hong, Wontaek;Kwon, Yoonjoo;Chung, Jinwook
    • Annual Conference of KIPS
    • /
    • 2016.04a
    • /
    • pp.107-109
    • /
    • 2016
  • 최근 클라우드 컴퓨팅 기술의 발전은 기존에 어려웠던 응용연구 분야의 실험 환경 구축을 용이하게 함으로써 새로운 협업연구 패러다임을 가져오고 있다. 본 논문에서는 고성능 연구망 기반의 협업연구 환경을 구축하기 위해 필요한 데이터 공유 및 전송에 관한 서비스 제공 방안을 제안한다. 이러한 서비스 모델은 연구망의 특성을 반영하고, 접근 패턴이 다른 사용자들을 동시에 수용할 수 있도록 구성된다. 이를 토대로, 최근 오픈소스 소프트웨어로 활발히 이용되는 서비스 구성 요소들을 분류 및 선택하여 실험 테스트베드를 구성하고, 활용 시나리오별 데이터 전송 실험을 수행함으로써 제안 서비스의 활용 가능성을 확인하였다.

A Study on the Cultural and Technical Influence Factor Using Unstructured Data Analysis (비정형 데이터 분석을 이용한 수원 화성의 문화·기술적 영향요인 연구)

  • Park, Eun Soo;Kim, Ji Eun
    • Korea Science and Art Forum
    • /
    • v.20
    • /
    • pp.227-241
    • /
    • 2015
  • As time is rapidly changing, the culture to represent an era is getting more subdivided and complex. Due to cultural diversity, the influence, cause, characteristics which could be understood in individual field centered by space in the past cannot be understood now only by the viewpoint of one field, and it has become difficult to predict and correspond to the change of the future. With the development of information and knowledge delivery system, various cultural contents to form a space are being created and lapsed, but there are a lot of parts which cannot be explained or understood by only one point of view. To inspect these situation, this study is aimed to draw the cultural and technical causes that became the influence with Suwon Hwaseong, a traditional space with historical superiority, analyze the key factors that became the main factor to form the space, and consider the importance of the related factors. Suwon Hwaseong is a new town formed by the order of King Jeongjo. Suwon Hwaseong at that time was a space with the will and effort of many people who dreamed a new era, and it has a meaning of varoius time ans space as historical facts and cultural values as well as the progress and development of scientific technology. The unstructured data technique which is applied as the method of analysis in this study can be said to be a new value judgement and viewpoint in interpreting the space. Therefore, this study is a new trial to provide a frame for multilaterally interpreting the various traditional space and culture of Korea from the past to the present.