• Title/Summary/Keyword: 데이터부족문제

Search Result 539, Processing Time 0.031 seconds

Development of Stock Recommendation Model Using Personal MyData (마이데이터를 활용한 주식 추천모델 개발)

  • Kim, Ye-Jin;Lim, Seong-Ha;Seong, Seung-Yeon;Kim, Hyo-Jae;Ryu, Sang-Uk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.943-945
    • /
    • 2022
  • 2030 세대의 주식시장 참여율은 갈수록 늘어나는 데에 반해 증권업의 높은 진입 장벽과 부족한 정보로 손실을 보는 경우가 적지 않다. 이러한 상황에서 정보의 주체인 개인이 본인 데이터에 대한 권리를 가지고, 본인이 원하는 방식으로 데이터를 관리하는 패러다임인 '마이데이터' 서비스가 최근 떠오르고 있다. 본 논문에서는 위의 문제를 해결하기 위하여 마이데이터를 토대로 특정 주식 종목과 유사한 종목들을 먼저 선별한 후 순수익이 높게 예측되는 종목을 최종 추천하는 모델을 제안한다.

Korean Probabilistic Syntactic Model using Head Co-occurrence (중심어 간의 공기정보를 이용한 한국어 확률 구문분석 모델)

  • Lee, Kong-Joo;Kim, Jae-Hoon
    • The KIPS Transactions:PartB
    • /
    • v.9B no.6
    • /
    • pp.809-816
    • /
    • 2002
  • Since a natural language has inherently structural ambiguities, one of the difficulties of parsing is resolving the structural ambiguities. Recently, a probabilistic approach to tackle this disambiguation problem has received considerable attention because it has some attractions such as automatic learning, wide-coverage, and robustness. In this paper, we focus on Korean probabilistic parsing model using head co-occurrence. We are apt to meet the data sparseness problem when we're using head co-occurrence because it is lexical. Therefore, how to handle this problem is more important than others. To lighten the problem, we have used the restricted and simplified phrase-structure grammar and back-off model as smoothing. The proposed model has showed that the accuracy is about 84%.

A Method for Surveying Cadastral Non-coincidency Using Digital Cadastral Maps and Digital Topographic Maps (수치지적도와 수치지형도를 이용한 지적불부합지 조사 방법)

  • 홍성언;이동헌;박수홍
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.307-313
    • /
    • 2004
  • 정부에서는 사회 경제적으로 많은 문제를 발생시키고 있는 지적불부합지 문제를 해결하고자 지적재조사 사업을 계획하였으나 수 조원에 달할것으로 예상되는 막대한 사업비와 국민적인 이해부족으로 인하여 중단이 되었다. 이렇게 지적재조사 사업이 전면 중단된 상황에서 지적불부합을 효율적으로 해결하기 위해서는 현지 측량 방식에 기반하여 불부합지를 조사하고 정리하기보다는 현재 구축되어 있는 지적도 전산화 데이터와 GIS 관련 데이터 등을 최대한 활용하여 조사할 수 있는 새로운 방법론의 모색이 필요하다. 본 연구에서는 기 구축되어 있는 수치지적도와 수치지형도를 이용하여 지적불부합을 측정할 수 있는 방법론과 절차를 개발하였다. 그리고 모든 과정을 상용 GIS 소프트웨어를 이용하여 구현하였다. 방법론의 실험을 위해 실제 사례지역을 선정하여 적용하여본 결과 불부합을 정량적으로 조사하고 해석할 수 있는 가능성을 제시할 수 있었다.

  • PDF

A Development of A Movie Contents Retrieval System based on Web Service (웹 서비스 기반의 영화 컨텐츠 검색 시스템 개발)

  • Kwak Kil-Sin;Joo Kyung-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.571-574
    • /
    • 2004
  • 디지털화 된 멀티미디어 데이터가 증가함에 따라 데이터의 효과적인 분류 및 검색 작업이 더욱 중요해 지고 있으며, 네트워크와 하드웨어의 발전으로 영상 정보를 검색함에 있어 기존의 웹상의 클라이언트/서버 기반 검색만으로는 부족하게 되었다. 이에 따라 영상 정보를 웹상에서 뿐만 아니라 모바일 같은 이기종간의 검색이 필요하다. 그러나 이기종 간의 플랫폼에서 동일한 정보를 얻기 위해서는 상호운용성에 문제가 있다. 웹 서비스(Web Service)는 분산 애플리케이션에 대한 언어-중립적(language-neutral)과 벤더-중립적(vendor-neutral)[5]을 제시하고 있어 기존의 서로 다른 플랫폼간의 정보 이전 문제를 해결할 수 있다. 따라서 본 논문에서는 영화 컨텐츠 검색 시스템을 웹 서비스화 하였다.

  • PDF

A Study on the Performance Improvement of X-ray Foreign Matter Classification Neural Networks Using Multi-scale CAM (Multi-scale CAM을 이용한 X-ray 이물질 분류 신경망 성능 향상에 대한 연구)

  • Lee, Sung Ju;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.307-310
    • /
    • 2021
  • X-ray 영상 검사·검출 문제에 기존 딥러닝 모델을 사용하려는 시도들이 존재해왔고, 합성곱 신경망의 강력한 표현력 덕분에 대체로 준수한 성능이 보장되었다. 그러나 문제의 특성에 따라 기대한 만큼의 분류 및 검출 성능이 나오지 않는 경우가 존재한다. 이는 1) 검출 대상의 스케일이 다양하거나, 2) X-ray 영상은 흑백 영상으로 미세한 특징을 학습하기 어렵거나, 3) 지도학습을 하기에는 학습 데이터의 양이 부족하기 때문인 것이 주요 원인들이다. 본 논문에서는 다양한 스케일의 특징맵을 추출하여 종합적으로 학습하는 신경망을 통해, '생선살 X-ray 영상' 데이터셋에서 '생선 가시' 이물질 class가 모델 내에서 어떻게 학습되는지를 살펴본다. 그리고 X-ray 영상의 경우, 이물질 class를 크기별로 새롭게 labeling하여 성능 개선이 일어날 수 있음을 보인다. 또한 Multi-scale CAM을 통해 class에 따른 활성화 정도를 시각화하여 모델을 직관적으로 분석할 수 있음을 보일 것이다.

  • PDF

An Efficient SI Management for Extracting Service information in Data Broadcasting (데이터 방송 환경에서 서비스 정보 추출을 위한 효율적인 SI Manager 구현)

  • Hyeon-Seok Choi;Jae-Min Jeon;Doo-Ho Kim;JungSun Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.832-834
    • /
    • 2008
  • 데이터 방송에 사용되는 주요한 정보로는 SI(Service Information)가 있다. SI는 수신기와 사용자에게 유용한 정보를 제공하는 여러 개의 테이블들로 구성되어 있으며, 각각이 트랜스포트 스트림를 통하여 수신기로 전송된다. 수신기에서 SI 테이블을 처리하기 위한 작업은 모니터링과 파싱의 2가지로 나누어지며, 실시간 처리를 위하여 파싱 작업은 각각의 쓰레드를 생성하여 처리한다. 하지만 SI는 빈번하게 전송되고, 그 크기가 작기 때문에 쓰레드의 생성과 소멸이 반복해서 발생하게 된다. 이러한 문제는 대부분의 수신기가 자원이 부족한 임베디드 환경임을 고려하였을 때 효율적이지 못하다. 본 논문에서는 이러한 문제를 해결하기 위한 효율적인 SI Manager의 구조를 제안한다.

An Automatic Data Collection System for Human Pose using Edge Devices and Camera-Based Sensor Fusion (엣지 디바이스와 카메라 센서 퓨전을 활용한 사람 자세 데이터 자동 수집 시스템)

  • Young-Geun Kim;Seung-Hyeon Kim;Jung-Kon Kim;Won-Jung Kim
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.19 no.1
    • /
    • pp.189-196
    • /
    • 2024
  • Frequent false positives alarm from the Intelligent Selective Control System have raised significant concerns. These persistent issues have led to declines in operational efficiency and market credibility among agents. Developing a new model or replacing the existing one to mitigate false positives alarm entails substantial opportunity costs; hence, improving the quality of the training dataset is pragmatic. However, smaller organizations face challenges with inadequate capabilities in dataset collection and refinement. This paper proposes an automatic human pose data collection system centered around a human pose estimation model, utilizing camera-based sensor fusion techniques and edge devices. The system facilitates the direct collection and real-time processing of field data at the network periphery, distributing the computational load that typically centralizes. Additionally, by directly labeling field data, it aids in constructing new training datasets.

Exploring the Job Competencies of Data Scientists Using Online Job Posting (온라인 채용정보를 이용한 데이터 과학자 요구 역량 탐색)

  • Jin, Xiangdan;Baek, Seung Ik
    • The Journal of Society for e-Business Studies
    • /
    • v.27 no.2
    • /
    • pp.1-20
    • /
    • 2022
  • As the global business environment is rapidly changing due to the 4th industrial revolution, new jobs that did not exist before are emerging. Among them, the job that companies are most interested in is 'Data Scientist'. As information and communication technologies take up most of our lives, data on not only online activities but also offline activities are stored in computers every hour to generate big data. Companies put a lot of effort into discovering new opportunities from such big data. The new job that emerged along with the efforts of these companies is data scientist. The demand for data scientist, a promising job that leads the big data era, is constantly increasing, but its supply is not still enough. Although data analysis technologies and tools that anyone can easily use are introduced, companies still have great difficulty in finding proper experts. One of the main reasons that makes the data scientist's shortage problem serious is the lack of understanding of the data scientist's job. Therefore, in this study, we explore the job competencies of a data scientist by qualitatively analyzing the actual job posting information of the company. This study finds that data scientists need not only the technical and system skills required of software engineers and system analysts in the past, but also business-related and interpersonal skills required of business consultants and project managers. The results of this study are expected to provide basic guidelines to people who are interested in the data scientist profession and to companies that want to hire data scientists.

Study of Real-time Monitoring System Applicable to Heterogeneous Cloud Service Brokerage (이종 Cloud Service Brokerage에 적용 가능한 실시간 모니터링 시스템 연구)

  • Kim, Baul;Jo, Cheolyong;O, Donghwi;Kim, Myungjin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.637-640
    • /
    • 2017
  • 최근 클라우드 기술이 확산되면서 여러 기업이 자신만의 클라우드를 다양하게 제공하고 있으며 세계 각지에 흩어져 있는 다양한 클라우드 공급자들과 여러 프라이빗 클라우드를 연결하여 하나의 서비스를 제공하는 클라우드 서비스 브로커리지(Cloud Services Brokerage) 기술이 등장하게 되었다. 하지만 현재의 CSB 기술은 가상 자원 관리, 가상 머신 라이프 사이클 관리에 초점이 맞추어져 있으며 CSB에서 제공되는 모니터링 요소는 사용자의 복잡한 요구를 만족하기에는 부족한 실정이다. 또한 추가 모니터링 도구를 사용하는 경우도 CSB의 데이터와의 일관성을 만족하지 않는 문제가 있다. 따라서 본 논문에서는 이종 CSB와 연동이 가능한 실시간 모니터링 시스템을 제안한다. 본 논문에서 제안하는 모니터링 기술은 Scalr 및 CompatibleOne을 사용하여 주기적으로 메타데이터 동기화를 진행하며 데이터 일관성을 충족시키고 다양한 모니터링 데이터를 실시간으로 수집하여 사용자에게 제공한다.

Improving Relation Extraction Performance using Relevance Verification (적합성 검증을 통한 관계 추출 성능 향상)

  • Won, Yousung;Kim, Jiseong;Nam, Sangha;Hahm, YoungGyun;Choi, Key-sun
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.90-95
    • /
    • 2015
  • 기계적 학습을 위해서는 일반적으로 많은 양의 수동 주석데이터(Manually Labeled Data)가 요구된다. 원격지도(Distant Supervision)는 현실적으로 부족한 주석데이터(Labeled Data)를 대신해 자동적으로 주석데이터를 수집하여 학습하는 접근 방식으로 관계 추출(Relation Extracion) 문제에 널리 활용되고 있다. 이때 필연적으로 많은 노이즈(Noise)가 발생되는데, 적합성 검증(Relevance Verification)을 통해 수집된 학습데이터를 정제함으로써 노이즈로 인한 변동성을 줄이고 결과적으로 향상된 성능을 보여주는 관계 추출 방법을 제시한다.

  • PDF