• Title/Summary/Keyword: 데이터부족문제

Search Result 539, Processing Time 0.029 seconds

Implementation of an Item Pool System with XML (XML 기반 학습 평가 시스템의 구현)

  • 김일민
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2003.11a
    • /
    • pp.441-445
    • /
    • 2003
  • 사이버 교육은 시간과 공간의 제약을 벗어나 각종 멀티미디어 자원을 이용함으로써 기존 교육 방식을 보조하거나 대체하게 되었다. 온라인 학습자들을 평가하고 교육과정을 개선할 수 있는 평가 시스템에 대한 연구는 다양한 교육 컨텐츠에 비하여 부족한 편이다. 본 논문에서는 JSP 와 JDBC 기술을 이용하여 문제 은행 시스템을 설계하였다. 기존의 학습 평가 시스템과는 달리, 데이터 표현을 위하여 XML 언어를 사용하였으며, 객관식 문제의 난이도 조절을 위한 피드백 및 단답형 주관식 문제에 대한 채점방식에 대한 고려를 평가 시스템 설계에 포함하였다. 문제은행은 문항의 형태, 내용, 난이도 등을 포함한 문항의 특성과 관련된 정보들을 체계적으로 저장하여, 보다 정확한 학습 평가 시스템이 되도록 설계하였다.

  • PDF

Improving Accuracy of Noise Review Filtering for Places with Insufficient Training Data

  • Hyeon Gyu Kim
    • Journal of the Korea Society of Computer and Information
    • /
    • v.28 no.7
    • /
    • pp.19-27
    • /
    • 2023
  • In the process of collecting social reviews, a number of noise reviews irrelevant to a given search keyword can be included in the search results. To filter out such reviews, machine learning can be used. However, if the number of reviews is insufficient for a target place to be analyzed, filtering accuracy can be degraded due to the lack of training data. To resolve this issue, we propose a supervised learning method to improve accuracy of the noise review filtering for the places with insufficient reviews. In the proposed method, training is not performed by an individual place, but by a group including several places with similar characteristics. The classifier obtained through the training can be used for the noise review filtering of an arbitrary place belonging to the group, so the problem of insufficient training data can be resolved. To verify the proposed method, a noise review filtering model was implemented using LSTM and BERT, and filtering accuracy was checked through experiments using real data collected online. The experimental results show that the accuracy of the proposed method was 92.4% on the average, and it provided 87.5% accuracy when targeting places with less than 100 reviews.

Development of a user-friendly coastal terrain change numerical model based on an interactive platform (인터랙티브 플랫폼 기반 사용자 친화적 연안 지형변화 수치모형 개발)

  • Junsu Noh;Sangyoung Son
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.129-129
    • /
    • 2023
  • 연안 환경은 기후 및 도시개발과 같은 자연·인공적 요인에 따라 끊임없이 변화한다. 근래에는 연안 도시 인구증가, 기후변화 등의 영향으로 인해 그 변화가 가속화되고 있으며, 특히 연안 침식 및 이에 따른 해안선 변화에 대한 심각성이 대두되고 있다. 연안 침식은 해류와 해안 유사의 마찰로 발생하는 유사이송 현상으로 야기되며, 해안 환경을 변화를 초래하며 인간사회에 경제적인 피해를 주기도 한다. 연안침식이 사회적인 문제로 부상했음에도 여전히 이에 대한 대중적 문제의식은 부족한 실정이다. 이는 대중매체를 통한 시각적인 노출이 가능한 다른 재해에 비해 재해의 물리적 과정에 대한 시각적인 관측이 어렵다는 배경이 있다고 판단된다. 더불어, 재해의 간접체험이 가능한 플랫폼이 부족하다는 점도 원인으로 여겨진다. 기술이 발달함에 따라 시뮬레이션을 통한 재해의 간접체험이 가능한 플랫폼이 개발되어왔으며, 이는 직접 경험하기 어려운 재해에 대해 위험성 인지 및 경각심 고취에 활용되어왔다. 본 연구에서는 수치해석 플랫폼인 Celeris Advent(Tavakkol and Lynett, 2017)를 기반으로 실시간 유사이송 해석이 가능한 인터랙티브 수치모형을 개발하여 문제를 개선하고자 하였다. GUI(Graphical User Interface)를 통해 조작이 가능한 Celeris Advent는 수치해석 결과를 실시간으로 가시화하며, 이에 대한 사용자 상호작용이 가능하다. 이를 기반으로 유사의 흐름에 대해 모의가 가능하도록 모형을 구성하여 실시간 사용자 입력 및 유사이송 물리현상 관측이 가능하도록 모형을 개발하였다. 수치모형 지배방정식은 2차원 천수방정식과 유사이송방정식을 양방향 결합하여 구성하였다. 개발된 모형의 정확성 평가를 위해 1차원 및 2차원 수리실험 데이터를 활용하여 수치실험을 수행하였으며, 전반적인 결과는 실험데이터와 잘 일치하였다.

  • PDF

병렬 VOD 서버의 확장을 위한스트라이핑 정책

  • 최숙영;최현호;한주희;유관종
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 1999.12a
    • /
    • pp.445-451
    • /
    • 1999
  • 본 논문에서는 확장 가능한 병렬 VOD서버 모델을 제시하고, 이 병렬 VOD 서버에서 기존의 디스크 공간이 부족하여 새로운 병렬 서버를 추가할 경우, 데이터 분배 문제를 고려한다. 새로운 서버에 미디어 파일을 추가할 경우, 특정 서버에 부하가 몰리는 것을 방지하기 위해 기존의 서버에 저장되어 있는 일부 데이터들을 이동 시켜서 각 서버의 사용가능한 디스크 공간을 조정한 뒤, 각 디스크 부하를 최소화 하도록 고려하여 데이터를 저장하는 스트라이핑 방법을 제시한다.

  • PDF

Efficient Data Preprocessing Scheme for Audio Deep Learning in Solar-Powered IoT Edge Computing Environment (태양 에너지 수집형 IoT 엣지 컴퓨팅 환경에서 효율적인 오디오 딥러닝을 위한 데이터 전처리 기법)

  • Yeon-Tae Yoo;Chang-Han Lee;Seok-Mun Heo;Na-Kyung You;Ki-Hoon Kim;Chan-Seo Lee;Dong-Kun Noh
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.81-83
    • /
    • 2023
  • 태양 에너지 수집형 IoT 기기는 주기적으로 재충전되는 태양 에너지의 특성상, 에너지 소모를 최소화하기보다는 수집된 에너지를 최대한 유용하게 사용하는 것이 중요하다. 한편, 데이터 기밀성과 프라이버시, 응답속도, 비용 등의 이유로 클라우드가 아닌 데이터 소스 근처에서 머신러닝을 수행하는 엣지 AI에 대한 연구도 활발한데, 그 중 하나는 여러 IoT 장치들이 수집한 오디오 데이터를 활용하여, 다양한 AI 응용들을 IoT 엣지 컴퓨팅 환경에서 제공하는 것이다. 그러나, 이와 관련된 많은 연구에서, IoT 기기들은 에너지의 제약으로 인하여, 엣지 서버(IoT 서버)로의 센싱 데이터 전송만을 수행하고, 데이터 전처리를 포함한 모든 AI 과정은 엣지 서버에서 수행한다. 이 경우, 엣지 서버의 과부하 문제 뿐 아니라, 학습 및 추론에 불필요한 데이터까지도 서버에 그대로 전송되므로 네트워크 과부하 문제도 야기한다. 또한, 이를 해결하고자, 데이터 전처리 과정을 각 IoT 기기에 모두 맡긴다면, 기기의 에너지 부족으로 정전시간이 증가하는 또 다른 문제가 발생한다. 본 논문에서는 각 IoT 기기의 에너지 상태에 따라 데이터 전처리 여부를 결정함으로써, 기기들의 정전시간 증가 문제를 완화시키면서 서버 집중형 엣지 AI 환경의 문제들(엣지 서버 및 네트워크 과부하)을 완화시키고자 한다. 제안기법에서 IoT 장치는 기기가 기본적으로 동작하는 데 필요한 에너지 외의 여분의 에너지 양을 예측하고, 이 여분의 에너지가 있는 경우에만 이를 사용하여 기기에서 전처리 과정, 즉 수집 대상 소리 판별과 잡음 제거 과정을 거친 후 서버에 전송함으로써, IoT기기의 정전시간에 영향을 주지 않으면서, 에너지 적응적으로 데이터 전처리 위치(IoT기기 또는 엣지 서버)를 결정하여 수행한다.

Analysis of Conditional Access System(CAS) for Terrestrial Digital Multimedia Broadcasting(T-DMB) (지상파 이동 멀티미디어 방송용 제한 수신 시스템 분석)

  • Jung, Geun-Il;Choi, Seong-Jong
    • Proceedings of the KIEE Conference
    • /
    • 2006.04a
    • /
    • pp.72-74
    • /
    • 2006
  • 본 논문에서는 현재 무료로 본 방송이 진행 중인 T-DMB 제한 수신을 위한 시스템 분석에 대해 기술하였다. T-DMB 방송사업자들은 별도의 수신료를 징수하지 않고 광고 수입에 의존하게 되는데, 막대한 제작 비용이 소모되는 데이터 서비스를 위한 콘텐츠들을 무료로 서비스하게 된다면 수익 구조상 데이터 서비스에 매우 소극적이 될 것이다. 이런 이유로 일부 데이터 서비스들에 대한 유료화 필요성이 대두되면서 제한 수신 시스템의 도입이 추진되고 있다. 현재 제한 수신 시스템을 T-DMB에 적용하기 위한 방법으로 서브 채널 제한 수신, 데이터 그룹 제한 수신, MOT 제한 수신 등의 세 가지 모드가 있다. 분석 결과, T-DMB에 제한 수신 시스템을 적용할 시에, 많은 가입자 수에 따른 대역폭 부족의 문제, AV와 함께 전송되는 BIFS만 따로 스크램블링 할 수 없다는 문제, 복수의 제한 수신 사업자들의 헤드 엔드 장비간 공통 인터페이스 작성, 다양한 수신 단말기들이 공통 인터페이스 작성 둥의 문제점들에 대해서 기술하였다.

  • PDF

Design of Contents Curation System Based on Incremental Learning Technology for Big Data Mining (빅데이터 마이닝을 위한 점진적 학습 기반 콘텐츠 큐레이션 시스템 설계)

  • Min, Byung-Won
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2017.05a
    • /
    • pp.421-422
    • /
    • 2017
  • 콘텐츠 큐레이션 서비스를 위해서 대용량 데이터를 학습하는 과정에서 발생하는 메모리부족 문제, 학습소요시간 문제 등을 해결하기 위한 "대용량 문서학습을 위한 동적학습 파이프라인 생성기술 중 빅데이터 마이닝을 위한 점진적 학습 모델" 기술이 필요하며, 본 논문에서 제안한 콘텐츠 큐레이션 서비스는 온라인상의 수많은 콘텐츠들 중 개인의 주관이나 관점에 따라 관련 콘텐츠들을 수집, 정리하고 편집하여 이용자와 관련이 있거나 좋아할 만한 콘텐츠를 제공하는 서비스이다. 큐레이션 서비스에서는 개인비서, 금융 분야의 투자, 자율주행, 저널리즘, 효율적인 업무 지시/감독, 제조업의 자동화 공정, 교육, 콘텐츠 유통, 학술정보 등에서 컴퓨터가 방대한 양의 데이터로 부터 학습하여 사람의 일을 대신 처리하거나 의사결정에 도움을 줌으로써 업무의 효율을 높여주는 서비스 산업에 활용이 가능하다.

  • PDF

A Study on the Data Collection and Convergence of Career Advisor System Using AI (AI를 활용한 대학생 진로 조언 시스템 모델 및 데이터 수집과 융합에 대한 연구)

  • Kim, Jong-yul;Ro, Kwang-hyun
    • Journal of Digital Convergence
    • /
    • v.17 no.2
    • /
    • pp.177-185
    • /
    • 2019
  • The purpose of this study is to investigate the causes of career problems, which are the biggest problems of Korean university students, and to solve them by using case studies of domestic and global universities, I would like to suggest a career advisor system model for college students. It is most important to collect advice and learning data to solve the career problems of college students by utilizing information technology such as data analysis and AI. Research has not been actively pursued because the university has very limited internal data to advise on career problems. In this paper, we study the data types and methods of college students' career advice, and propose a career advisor counseling system for college students.

Genetic Algorithm-Based Feature Selection Scheme for Short-Term Load Forecasting (단기 전력수요 예측을 위한 유전 알고리즘 기반의 특징 선택 기법)

  • Park, Sungwoo;Moon, Jihoon;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.813-816
    • /
    • 2019
  • 최근 에너지 부족 문제 및 환경 문제의 해결수단으로 스마트 그리드가 많은 주목을 받고 있다. 스마트 그리드 기술은 에너지를 효율적으로 사용하는 데 도움을 주며, 이를 위해서는 더욱 정확한 전력수요 예측이 필요하다. 다양한 기계학습 기법 기반의 전력수요 예측 모델은 좋은 예측 성능을 보이지만 입력 변수의 개수가 증가할수록 처리해야 하는 데이터의 양이 기하급수적으로 증가한다는 단점이 존재한다. 또한, 불필요한 데이터를 입력 변수로 선정할 경우에는 모델의 정확도가 저하될 수도 있다. 이러한 문제를 해결하기 위해 다양한 특징 선택 기법들이 제안되었지만, 기존의 특징 선택 기법은 모델의 성능을 고려하지 않았기 때문에 실제 적용 시 오히려 모델의 성능이 저하될 수도 있다. 이에 본 논문은 유전 알고리즘을 기반으로 한 특징 선택 기법을 제안한다. 유전 알고리즘을 통해 각 모델에 맞는 최적의 입력 변수를 선택함으로써 빠른 학습 속도와 높은 정확도를 기대할 수 있다.

The Study of the Method that to Choice Efficient Nested Loops Join Order and the Index Design (효율적인 Nested Loops Join을 위한 조인순서 선정 및 인덱스 구성에 관한 연구)

  • Liu, Chen;Yeo, Jeong-mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.877-880
    • /
    • 2013
  • 정보시스템의 기반이 되는 관계형 데이터베이스에서는 데이터의 양에 따라 성능 차이가 발생한다. 데이터베이스에 관한 여러 가지 기능에 대한 이해가 부족하여 많은 성능 저하 문제를 유발하는데, 그중에 조인 성능문제가 큰 비중을 차지하고 있다. 아주 드문 경우가 아니라면 대부분의 데이터 처리는 하나 이상의 테이블이 필요하기 때문이다. 조인을 정확하게 사용하면 성능 개선에 큰 이점을 가져 올 수 있다. 본 연구는 관계형 데이터베이스 기반의 가장 기본적인 조인방식인 Nested Loops Join 방식을 효율적으로 수행하기 위한 조인순서 선정 및 인덱스 구성에 관한 연구를 하였다. 연구 결과를 평가하기 위해서 SQL Trace을 추출한 후 성능을 비교함으로써 선정된 조인순서가 효율적인 것을 입증하였다. 또한 기존의 응답시간을 기준으로 성능평가방법보다 액세스한 데이터 블록 수를 기준으로 한 성능 평가방법이 더 근본적으로 조인 성능을 개선할 수 있음을 증명하였다. 차후에는 더 복잡한 조인 형태 및 다른 조인방식의 성능개선 방법에 관한 연구를 진행할 것이다.