• Title/Summary/Keyword: 과학기술 데이터

Search Result 2,575, Processing Time 0.035 seconds

A study on data augmentation methods for sound data classification (소리 데이터 분류에 대한 데이터 증대 방법 연구)

  • Chang, Il-Sik;Park, Goo-man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.1308-1310
    • /
    • 2022
  • 소리 데이터 분류는 단순 소리를 통한 분류, 감정 인식등 다양한 연구가 진행중이다. 심층 신경망에서 데이터의 부족과 과적합 문제를 개선하는 방법으로 데이터 증강은 중요하다. 본 논문에서는 3가지의 소리데이터(UrbanSound8K, RAVDESS, IRMAS)를 사용하였으며, 소리데이터는 멜 스펙트로그램을 통한 변환과정을 거쳐 네트워크 망에 입력된다. 입력된 신호는 다양한 네크워크 신경망(Bidirection LSTM, Bidirection LSTM Attention, Multi-Head Attention, CNN)을 통해 학습되어지며, 각각의 네트워크 신경망에서 데이터 증강 전후의 분류 정확도를 확인 하였다. 다양한 데이터셋과 다양한 네트워크 망에서의 데이터 증강 방법의 결과 비교를 통한 통찰을 얻을수 있을 것이다.

  • PDF

EmoNSMC: Constructing Korean Emotion Tagging Dataset Using Distant Supervision (EmoNSMC: Distant Supervision 을 이용한 한국어 감정 태깅 데이터셋 구축)

  • Lee, Young-Jun;Choi, Ho-Jin
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.519-521
    • /
    • 2019
  • 최근 소셜 메신저를 통해 많은 사람들이 의사소통을 주고받음에 따라, 텍스트에서 감정을 파악하는 것이 중요하다. 따라서, 감정이 태깅된 데이터가 필요하다. 하지만, 기존 연구는 감정이 태깅된 데이터의 양이 많지가 않다. 이는 텍스트에서 감정을 파악하는데 성능 저하를 야기할 수 있다. 이를 해결하기 위해, 본 논문에서는 단어 매칭 방법과 형태소 매칭 방법을 이용하여 많은 양의 한국어 감정 태깅 데이터셋인 EmoNSMC 를 구축하였다. 구축한 데이터셋은 네이버 영화 감상 리뷰 데이터 (NSMC)에 디스턴트 수퍼비전 방법 (distant supervision) 방법을 적용하여 weak labeling을 진행하였고, 이 과정에서 한국어 감정 어휘 사전 (KTEA) 을 이용하였다. 구축된 데이터셋의 감정 분포 결과, 형태소 매칭 방법을 통해 구축한 데이터셋이 좀 더 감정 분포가 균등한 것을 확인할 수 있었다. 해당 데이터셋은 공개되어 있다.

  • PDF

Big Data Conceptualization and Policy Design on Data Sovereignty (빅데이터의 개념적 논의와 데이터 주권에 대한 정책설계)

  • Moon, Hyejung
    • Annual Conference of KIPS
    • /
    • 2013.05a
    • /
    • pp.911-914
    • /
    • 2013
  • 빅데이터가 이전의 대용량정보와 비교하여 어떠한 개념적인 의미를 지니는지 정책설계과정에 따라 이론적으로 논의하고, 이 시대 이슈가 되는 데이터 주권에 대하여 저작권과 CCL을 사례로 ICT정책의 설계방안을 제시한다. 사례분석의 결과 빅데이터 시대 데이터 주권에 대한 정책은 법, 시장, 기술, 규범 측면에서 균형 있게 설계되어야 하며 기술구조를 기초로 사회문제에 대한 규제구조를 설계하고 정책을 집행해야 한다.

과학ㆍ기술ㆍ사회 - 끝없는 도청ㆍ감청의 파장

  • Hwang, Sun-Hyeon
    • The Science & Technology
    • /
    • v.32 no.11 s.366
    • /
    • pp.16-17
    • /
    • 1999
  • 도청ㆍ감청이 사회문제화 되어 국정감사 시즌이 되면 해마다 약방의 감초처럼 제기되고 있다. 이동통신업체들은 아날로그 휴대폰과는 달리 CDMA 휴대폰은 데이터가 전화기마다 서로 다르게 암호화되어 전송되기 때문에 엿들을 수 없다고 한다. 하지만 정보통신기술은 초고속으로 발전을 거듭하고 있어 디지털 휴대전화의 감청기술도 머지않아 등장할 것이다. 어쨌든 감청이 국민의 프라이버시를 침해하는 도구가 되어서는 안되겠다.

  • PDF

Image Recomposition System Using Segmentation and Style-transfer (세그먼테이션과 스타일 변환을 활용한 영상 재구성 시스템)

  • Bang, Yeonjun;Lee, Yeejin;Park, Juhyeong;Kang, Byeongkeun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.19-22
    • /
    • 2021
  • 기존 영상 콘텐츠에 새로운 물체를 삽입하는 등의 영상 재구성 기술은 새로운 게임, 가상현실, 증강현실 콘텐츠를 생성하거나 인공신경망 학습을 위한 데이터 증대를 위해 사용될 수 있다. 하지만, 기존 기술은 컴퓨터 그래픽스, 사람에 의한 수동적인 영상 편집에 의존하고 있어 금전적/시간적 비용이 높다. 이에 본 연구에서는 인공지능 신경망을 활용하여 낮은 비용으로 영상을 재구성하는 기술을 소개하고자 한다. 제안하는 방법은 기존 콘텐츠와 삽입하고자 하는 객체를 포함하는 영상이 주어졌을 때, 객체 세그먼테이션 네트워크를 활용하여 입력 영상에서 객체를 분리하고, 스타일 변환 네트워크를 활용하여 입력 영상을 스타일 변환한 후, 사용자 입력과 두 네트워크의 결과를 활용하여 기존 콘텐츠에 새로운 객체를 삽입하는 것이다. 실험에서는 기존 콘텐츠는 온라인 영상을 활용하였으며 삽입 객체를 포함한 영상은 ImageNet 영상 분류 데이터 세트를 활용하였다. 실험을 통해 제안한 방법을 활용하면 기존 콘텐츠와 잘 어우러지게끔 객체를 삽입할 수 있음을 보인다.

  • PDF

연구개발 사전기획 강화를 위한 NTIS 데이터 적용 연구: 플라즈마 기술 활성화 전략 수립 사례를 중심으로

  • Hwang, Seong-Ha;Kim, Yu-Bin;Jang, Han-Su;Choe, Won-Jae;Do, Hyeon-Su
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2015.11a
    • /
    • pp.798-805
    • /
    • 2015
  • 본 연구는 국가과학기술지식정보서비스(NTIS) 데이터베이스에 등록된 국내 국가연구개발(R&D)사업 중에 플라즈마 기술 관련 Raw-data를 분석하여 플라즈마 기술 분야에 대한 정부 부처별, 연구수행주체별, 연구개발단계별 등 국내 산학연 전반에 투입된 연구개발(R&D) 예산을 조사 및 분석하였다. 특히, 2012~2014년을 기준으로 플라즈마 기술 관련 연구수행주체(정부부처, 국공립연구소, 출연(연), 대학, 대기업, 중소기업, 중견기업) 각각에 대해 연구 관심 분야 및 핵심기술을 알 수 있는 척도인 연구개발단계(기초, 응용, 개발)와 과학기술표준분류체계 등을 포함한 상호 연계성을 식별 가능한 네트워크로 가시화하였다. 이에 본 논문은 NTIS 데이터 기반 다양한 관점의 시사점을 플라즈마 기술 활성화 전략 수립 사례에 적용함으로써 사전기획 강화를 위한 데이터 분석 방법을 제안한다.

  • PDF

OCR-based Cosmetics Ingredients Labeling Analysis System (OCR 기반 화장품 성분표 분석 시스템)

  • Beom-jin Kang;Chan-gi Yook;Jin-yeong Lee;Hye-been Oh;Yeejin Lee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.11a
    • /
    • pp.167-170
    • /
    • 2022
  • 본 논문에서는 화장품의 효율적 구매를 위한 화장품 성분표를 분석하고 정보를 전달하는 기능의 시스템을 제안한다. 이 시스템에서는 화장품 성분표에 최적화시킨 OCR (Optical Character Recognition) 모델을 사용해 화장품 성분표를 촬영한 영상에서 인식한 문자 데이터를 추출한다. 이 문자 데이터를 통해 얻은 화장품 성분이 사용자 피부 유형에 적합한지 구축된 데이터베이스와의 비교를 통해 소비자에게 최종 전달된다. 200개의 화장품 성분표 영상을 사용해 제안하는 화장품 성분표 분석 모델의 성능을 평가한 결과 80.348%의 정확도를 보였다.

  • PDF

Study on Practical Design of Datalink in Interoperable UAV Systems (무인기 상호운용시스템에서 실용적인 데이터링크 설계방안 연구)

  • Kyu-Hwan Lee;Myeonggeun Oh;Jihoon Kim
    • Journal of the Korea Institute of Military Science and Technology
    • /
    • v.27 no.1
    • /
    • pp.51-59
    • /
    • 2024
  • Uumanned aerial vehicle(UAV) systems have been used in various fields including industry and military. According to increasing the number of UAVs, the attention on interoperable UAV systems is increasing. In this paper, we propose the practical design of datalink in interoperable UAV systems. For practical design, we firstly review the operational scenarios in the interoperable UAV system. We then propose the system model of the datalink in interoperable UAV system. Consequently, the technical components such as the design of the network, the link management, the support of the multicast transmission, the support for autonomous mission and flight safety, and the datalink security are derived and reviewed for the practical design.

Legislation Cases, Management Policies and Countermeasures on Scientific Data -Focusing Australia, the United States and China- (과학데이터에 관한 입법례와 관리정책 그리고 대응방안 -호주, 미국, 중국을 중심으로-)

  • Yoon, Chong-Min;Kim, Kyubin
    • Journal of Korea Technology Innovation Society
    • /
    • v.16 no.1
    • /
    • pp.63-100
    • /
    • 2013
  • Research data means data in the form of facts, observations, images, computer program results, recordings, measurements or experiences on which an argument, theory, test or hypothesis, or another research output is based. Data may be numerical, descriptive, visual or tactile. Scientific research is changing because of the paradigm shift. It is all being affected by the data deluge, and a data-intensive science paradigm is emerging. Hence, paradigm shift in scientific research led to increase of value and importance of scientific data. Essential to the creative research and development for scientific data can be reused efficiently is the sharing and utilization of establishing management system. Establishing of management system for sharing and utilization of scientific data should be done at the national level, but compared with Europe, Australia, the United States, China, the management system of Korea doesn't have not linkage or efficiency or internal stability. Australia, the United States, China continues to expand a Mid- and Long-Term policy making, legislation, its investment in infrastructure, so as to promote the utilization of data, such as collection, management and maintenance of scientific data through the relevant agencies at the national level. This study consider legislation cases and management policies of the above countries to the end to that establish management system for the efficient and fair sharing and utilization of scientific data and the legal system, and that provide scientific data legislation and policies related to the future of our country.

  • PDF

Iterative learning system design for relation extraction and knowledge base population (관계 추출 및 지식베이스 확장을 위한 반복 학습 시스템 설계)

  • Jeong, Yong-Bin;Nam, Sang-Ha;Kim, Ji-Seong;Lee, Min-Ho;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.185-189
    • /
    • 2019
  • 관계추출기의 학습을 위해서는 많은 학습 데이터가 필요한데, 사람이 모으게 되면 많은 비용이 필요하여 원격 지도 학습을 이용한 데이터 수집이 많은 연구에서 사용되고 있다. 원격 지도 학습은 지식베이스를 기반으로 학습 데이터를 자동으로 만들어 내는 방식이기에 비용이 거의 들지 않지만, 지식베이스의 질과 양에 영향을 받는다. 본 연구는 원격 지도 학습을 기본으로 관계추출기의 성능을 향상 시키고, 지식베이스를 확장하는 방안으로 반복학습을 제안한다. 실험을 적은 비용으로 빠르게 진행하기 위해 반복학습을 자동화 하는 시스템을 설계하여 실험을 하였고, 이 시스템으로 관계추출기의 성능이 향상 될 수 있는 가능성을 보였으며, 반복학습을 통한 지식베이스의 확장 방안을 제시한다.

  • PDF