• Title/Summary/Keyword: 데이터경제

Search Result 2,271, Processing Time 0.03 seconds

Ubiquitous Data Mining Using Hybrid Support Vector Machine (변형된 Support Vector Machine을 이용한 유비쿼터스 데이터 마이닝)

  • Jun Sung-Hae
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.15 no.3
    • /
    • pp.312-317
    • /
    • 2005
  • Ubiquitous computing has had an effect to politics, economics, society, culture, education and so forth. For effective management of huge Ubiquitous networks environment, various computers which are connected to networks has to decide automatic optimum with intelligence. Currently in many areas, data mining has been used effectively to construct intelligent systems. We proposed a hybrid support vector machine for Ubiquitous data mining which realized intelligent Ubiquitous computing environment. Many data were collected by sensor networks in Ubiquitous computing environment. There are many noises in these data. The aim of proposed method was to eliminate noises from stream data according to sensor networks. In experiment, we verified the performance of our proposed method by simulation data for Ubiquitous sensor networks.

Question Generation of Machine Reading Comprehension for Data Augmentation and Domain Adaptation (추가 데이터 및 도메인 적응을 위한 기계독해 질의 생성)

  • Lee, Hyeon-gu;Jang, Youngjin;Kim, Jintae;Wang, JiHyun;Shin, Donghoon;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.415-418
    • /
    • 2019
  • 기계독해 모델에 새로운 도메인을 적용하기 위해서는 도메인에 맞는 데이터가 필요하다. 그러나 추가 데이터 구축은 많은 비용이 발생한다. 사람이 직접 구축한 데이터 없이 적용하기 위해서는 자동 추가 데이터 확보, 도메인 적응의 문제를 해결해야한다. 추가 데이터 확보의 경우 번역, 질의 생성의 방법으로 연구가 진행되었다. 그러나 도메인 적응을 위해서는 새로운 정답 유형에 대한 질의가 필요하며 이를 위해서는 정답 후보 추출, 추출된 정답 후보로 질의를 생성해야한다. 본 논문에서는 이러한 문제를 해결하기 위해 듀얼 포인터 네트워크 기반 정답 후보 추출 모델로 정답 후보를 추출하고, 포인터 제너레이터 기반 질의 생성 모델로 새로운 데이터를 생성하는 방법을 제안한다. 실험 결과 추가 데이터 확보의 경우 KorQuAD, 경제, 금융 도메인의 데이터에서 모두 성능 향상을 보였으며, 도메인 적응 실험에서도 새로운 도메인의 문맥만을 이용해 데이터를 생성했을 때 기존 도메인과 다른 도메인에서 모두 기계독해 성능 향상을 보였다.

  • PDF

A Model of Speech Database in Korean in consideration of its segmental phonology (국어 분절음 특성에 맞는 음성 데이터 베이스의 모형)

  • 김종미
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.297-302
    • /
    • 1994
  • 본 논문에서는 국어 분절음 특성에 맞는 음성 데이터베이스의 모형을 제시하고자 한다. 음성 데이터 베이스는 1) 각 음의 고유음가정보, 2) 인접음 정보, 3) 빈도수에 따른 확률정보를 포함해야 한다. 이 요건을 충족시키기 위해 본 모형은 1) 음운 단위별로 Labeling 하여, 고유음과 인접음 정보를 편집하고, 2) 음운 규칙과 제약정보에 의해 Phoneme Balanced Words를 작성하여, 허용되는 인접음을 취하고, 허용되지 않는 인접음을 탈락시키며 3) 시스템 평가시, 빈도수가 shb은 음과 음소열의 우선적인 인식 및 합성을 우월하게 평가한다는 고정서, 4) 데이터 집적시, 데이터의 음운기능의 중복과 편중을 피함으로서 데이터량을 간소화할 수 있다는 경제성을 들 수 있다.

  • PDF

Locating Logistics Hub with Parcel Delivery Data (실제 택배 데이터 기반으로 최적의 물류 허브 위치 도출)

  • Song, Ha Yoon;Han, In Soo
    • Annual Conference of KIPS
    • /
    • 2019.05a
    • /
    • pp.270-272
    • /
    • 2019
  • 택배 배달 서비스는 전국적 물류의 중요 부분이다. 노선이 잘못되면 시간과 비용 면에서 경제적 불이익이 발생할 수 있다. 이러한 위험을 최소화하기 위해 물류 회사나 IoT 기기 등에서 실제 배송 데이터 10만 개를 수집하여 최소 거리와 최소 시간의 관점에서 최적의 허브 후보 위치를 분석하였다. 택배의 공통 경로 데이터는 실제 택배의 경로 데이터에 Longest Common Route Sequence 알고리즘을 사용하여 계산하였다. 계산한 택배의 공통 경로 데이터를 기반으로, 최적의 허브 후보 위치를 설정하고, 이로부터 최적의 거리와 시간을 계산할 수 있다.

Prediction Of Traffic Accident Casualties Using Machine Learning: For Seoul Public Data (머신러닝을 이용한 교통사고 사상자 수 예측:서울시 공공데이터를 대상으로)

  • Nam, Myung-woo;Park, Doo-Seo;Jang, Young-Jun;Lee, Hong-Chul
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.27-30
    • /
    • 2021
  • 경제 성장과 함께 자동차의 수요가 늘어남에 따라 교통사고 발생 빈도는 꾸준히 증가하고 있다. 이에, 본 연구에서는 교통사고를 야기하는 도로 및 기상환경과 같은 조건을 활용하여 기계학습 모델을 통해 서울시 교통사고 사상자 수를 예측하는 모형을 찾고자 한다. 활용한 데이터는 도로교통 공단에서 제공하는 교통사고 사상자 수 정보를 포함하는 데이터로 2015년부터 2018년도까지 데이터를 학습에 사용하였고 2019년도 데이터를 테스트 평가에 사용하였다. 실증연구를 통해 트리 기반의 모델 별 성능을 비교하였으며 본 연구에 대한 결과는 사고 발생 시 우선순위에 의한 구조활동이 가능하게 함과 도로상황 및 기상을 고려한 안전운전 가이드 지식으로 활용될 수 있다.

  • PDF

Bulky waste object recognition model design through GAN-based data augmentation (GAN 기반 데이터 증강을 통한 폐기물 객체 인식 모델 설계)

  • Kim, Hyungju;Park, Chan;Park, Jeonghyeon;Kim, Jinah;Moon, Nammee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.1336-1338
    • /
    • 2022
  • 폐기물 관리는 전 세계적으로 환경, 사회, 경제 문제를 일으키고 있다. 이러한 문제를 예방하고자 폐기물을 효율적으로 관리하기 위해, 인공지능을 통한 연구를 제안하고 있다. 따라서 본 논문에서는 GAN 기반 데이터 증강을 통한 폐기물 객체 인식모델을 제안한다. Open Images Dataset V6와 AI Hub의 공공 데이터 셋을 융합하여 폐기물 품목에 해당하는 이미지들을 정제하고 라벨링한다. 이때, 실제 배출환경에서 발생할 수 있는 장애물로 인한 일부분만 노출된 폐기물, 부분 파손, 눕혀져 배출, 다양한 색상 등의 인식저해요소를 모델 학습에 반영할 수 있도록 일반적인 데이터 증강과 GAN을 통한 데이터 증강을 병합 사용한다. 이후 YOLOv4 기반 폐기물 이미지 인식 모델 학습을 진행하고, 학습된 이미지 인식 모델에 대한 검증 및 평가를 mAP, F1-Score로 진행한다. 이를 통해 향후 스마트폰 애플리케이션과 융합하여 효율적인 폐기물 관리 체계를 구축할 수 있을 것이다.

  • PDF

The Study for Damage Effect Factors of Heavy Snowfall Disasters : Focused on Heavy Snowfall Disasters during the Period of 2005 to 2014 (대설 재난의 피해액 결정요인에 관한 연구: 2005~2014년 대설재난을 중심으로)

  • Kim, Geunyoung;Joo, Hyuntae;Kim, HeeJae
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.19 no.2
    • /
    • pp.125-136
    • /
    • 2018
  • Heavy snowfall disasters are the third most serious natural disasters, after typhoon and heavy rainfall disasters, in terms of economic disaster damage in South Korea. The average annual economic damage of heavy snowfall disasters was approximately eighty-eight billion won during the period of 2005-2014. In spite of significant economic damage, there have been few economic studies regarding heavy snowfall disasters in South Korea. The objective of this research is to identify the association between economic damage of heavy snowfall disasters and damage effect factors of snowfall amounts, snowfall days, population densities, and non-urban area ratios using a regression analysis model. Economic damage data sets of heavy snowfall disasters during the period of 2005-2014 were obtained from the Natural Disaster Yearbook published by the Ministry of Public Safety and Security. Weather-related data sets, such as snowfall amounts and snowfall days were collected from the Korea Meteorological Administration. Demographic and urban data sets, including population densities and non-urban area ratios, were provided by the Local Government Yearbook. Outcomes of this study can assist with heavy snowfall disaster management policies of South Korea.

A Study on Travel Pattern Analysis and Political Application using Transportation Card Data: In Gyeonggi-Do Case (교통카드자료를 이용한 통행패턴분석과 정책활용방안 연구 -경기도를 중심으로-)

  • Bin, Miyoung;Moon, Juback;Joh, Chang-Hyeon
    • Journal of the Economic Geographical Society of Korea
    • /
    • v.15 no.4
    • /
    • pp.615-627
    • /
    • 2012
  • This study analyzed the travel pattern with respect to use of public transportation by using transportation card data and presented the measures that can be used in a traffic policy. Transportation card data targeted Gyeonggi-Do area and as a utilization plan, a scenario that when a traffic policy decision maker improves bus stop facilities, the person selects a target site by using several variables that can be obtained from transportation card data was set and analyzed. The analysis result showed that K means cluster analysis which is decision making methodology and CHAID(Chi-squared automatic interaction detection) were used and it can be used usefully in policies in significance level of p <0.01. Also, based on these results, this study presented policy implications to be improved to actually use transportation card data in policies.

  • PDF

Display System Design for Signifying the Received Signals of the Mobile Phone (휴대폰 착신 알림을 위한 모바일 디스플레이 시스템 설계)

  • Park, Jong-An;Chun, Jong-Hun;Kang, Sung-Kwan
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.11 no.6
    • /
    • pp.289-294
    • /
    • 2011
  • In this paper, we developed a phone call display system or "alimi" for displaying the received phone data at limited space that can not carry a mobile phone and and its validity was confirmed. It consists of a data communication application transmitting the phone data via bluetooth, a RF data repeater to extend the range of data communication, and a display system part for displaying the received phone data to the phone user. It has economy in terms of system installation because the implementation of the proposed system is simple and low cost installation is possible. As ordinary mobile phones users using the system can easily utilize it by downloading the application on the app. store, it has economy and convenience checking whether a call is received.

Research on the New Consumer Market Trend by Social Big data Analysis -Focusing on the 'alone consumption' association- (소셜 빅데이터 분석에 의한 신 소비시장 트렌드 연구 - '나홀로 소비' 연관어를 중심으로 -)

  • Choo, Jin-Ki
    • Journal of Digital Convergence
    • /
    • v.18 no.2
    • /
    • pp.367-376
    • /
    • 2020
  • According to recent statistics on new consumer market trends, 'alone consumption' is at the center. This study focuses on the social big data that attracts the public's opinions in that it is important for a certain social trend to comprehensively understand the various fields such as society, locality, culture, marketing, economics, and psychology that form the background for it. Therefore, we set up the linkage of 'solo consumption' and conducted research on new consumer market trends using Opinion Analisys. As a result of this trend analysis, representative keywords such as 'honbab', 'honsul' and 'honyoeng' were derived and analyzed the trend of new consumer market using this data. Alone consumption is an inevitable new consumption trend caused by demographic change after the global economic crisis. The importance as a trend reflecting this will be further strengthened. Trend analysis by social big data will help scientific and systematic business distribution strategies and planning to help make new and valuable decisions and decisions about new consumer markets.