• 제목/요약/키워드: Data-driven Model

검색결과 656건 처리시간 0.027초

스타트업 성장단계 구분에 대한 탐색적 연구 (A Study on the Startup Growth Stage in Korea)

  • 김선우;김강민
    • 벤처창업연구
    • /
    • 제15권2호
    • /
    • pp.127-135
    • /
    • 2020
  • 이 논문은 데이터 기반의 정량적 기준 즉, 성장단계, 투자시기, 투자유치금액 등에 의해 개별 스타트업을 성장단계별로 구분하고, 단계별 기업군의 특성을 파악하였다. 이는 정확한 통계를 기반으로 스타트업의 성장과정에 대한 정부의 체계적 지원의 근거를 제공하기 위함이다. 분석대상은 TIPS(Tech Incubator Program for Startup) 지원 창업기업으로, 상대적으로 신뢰도가 높은 스타트업을 한정적으로 활용하였다. 분석 결과, 스타트업은 창업 후 1.5년 내에 최소기능제품(Minimum Viable Product) 완성을 위한 종자돈(Seed money)을 확보하고, 1년 내에 제품-시장 적합도(Product-Market Fit)를 검증하여 Series A 투자를 유치하였다(창업 후 2.5년 내에 Series A 투자 유치). 이후 상용화에 성공하면 1.5년 내에 안정적인 성장을 위한 Series B 투자를 유치하였다(창업 후 4년 내에 Series B 투자 유치). 2019년 부터 정부는 흩어진 창업사업화 지원을 통합하여 예비, 초기, 도약으로 구분하여 지원하고 있다. 예비단계는 예비창업자, 초기는 창업 후 3년 이내 기업, 도약은 3년~7년 이내 기업이다. 연구 결과, 단계별 창업사업화를 지원하는 정부 프로그램의 예비·초기·도약 단계의 구분 즉, 창업 3년 이내 구분은 현재까지 유의미하다고 할 수 있다. 향후 연구방향으로 3가지를 제시한다. 첫째, 스타트업 성장단계 판별 및 모니터링을 위한 지표를 개발한다. 둘째, 연차별 변화를 지속적으로 업데이트하여 개별 기업의 성장단계 변화를 추적한다. 셋째, 성공 스타트업에 대한 심층 사례분석을 모델에 적용해 봄으로써, 기술기반 스타트업의 성공적인 성장법칙을 발견한다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

유전자 알고리즘을 이용한 다분류 SVM의 최적화: 기업신용등급 예측에의 응용 (Optimization of Multiclass Support Vector Machine using Genetic Algorithm: Application to the Prediction of Corporate Credit Rating)

  • 안현철
    • 경영정보학연구
    • /
    • 제16권3호
    • /
    • pp.161-177
    • /
    • 2014
  • 기업신용등급은 금융시장의 신뢰를 구축하고 거래를 활성화하는데 있어 매우 중요한 요소로서, 오래 전부터 학계에서는 보다 정확한 기업신용등급 예측을 가능케 하는 다양한 모형들을 연구해 왔다. 구체적으로 다중판별분석(Multiple Discriminant Analysis, MDA)이나 다항 로지스틱 회귀분석(multinomial logistic regression analysis, MLOGIT)과 같은 통계기법을 비롯해, 인공신경망(Artificial Neural Networks, ANN), 사례기반추론(Case-based Reasoning, CBR), 그리고 다분류 문제해결을 위해 확장된 다분류 Support Vector Machines(Multiclass SVM)에 이르기까지 다양한 기법들이 학자들에 의해 적용되었는데, 최근의 연구결과들에 따르면 이 중에서도 다분류 SVM이 가장 우수한 예측성과를 보이고 있는 것으로 보고되고 있다. 본 연구에서는 이러한 다분류 SVM의 성능을 한 단계 더 개선하기 위한 대안으로 유전자 알고리즘(GA, Genetic Algorithm)을 활용한 최적화 모형을 제안한다. 구체적으로 본 연구의 제안모형은 유전자 알고리즘을 활용해 다분류 SVM에 적용되어야 할 최적의 커널 함수 파라미터값들과 최적의 입력변수 집합(feature subset)을 탐색하도록 설계되었다. 실제 데이터셋을 활용해 제안모형을 적용해 본 결과, MDA나 MLOGIT, CBR, ANN과 같은 기존 인공지능/데이터마이닝 기법들은 물론 지금까지 가장 우수한 예측성과를 보이는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안모형이 더 우수한 예측성과를 보임을 확인할 수 있었다.

농업기상재해 조기경보시스템의 풍속 예측 기법 개선 연구 (Minimizing Estimation Errors of a Wind Velocity Forecasting Technique That Functions as an Early Warning System in the Agricultural Sector)

  • 김수옥;박주현;황규홍
    • 한국농림기상학회지
    • /
    • 제24권2호
    • /
    • pp.63-77
    • /
    • 2022
  • 농업기상재해 조기경보시스템에서 모의되는 농장 규모 풍속 예측자료의 추정오차를 개선하기 위해, 농촌진흥청 농업기상관측망의 2020년 1~12월 풍속 관측자료와 해당 지점에 대한 조기경보시스템 모의 풍속을 이용하여, 87지점 일 8시간대(00, 03, 06 … 21시) 각각 풍속 추정오차를 종속변수로, 추정풍속을 독립변수로 하는 일차 회귀식(Y=aX+b)을 도출하였다. 상관계수가 0.5를 초과하였을 때는 회귀식을 풍속 보정식으로 활용하고, 상관계수가 0.5 이하일 때는 회귀식 대신 해당 지점 및 시간대의 ME를 보정값으로 대체하였다. 풍속 모형을 전국적으로 적용할 수 있도록 87지점×8개 시간의 회귀계수 a와 b, 상관계수 R과 ME 값으로 거리역산가중법으로 공간내삽하여 250m 격자해상도의 분포도를 제작하였다. 모형의 검증을 위하여 회귀계수 a와 b, 상관계수 R과 ME 공간내삽 분포도로 부터 농산촌 지역 13개 기상관측지점의 격자값을 추출하고, 13곳의 2019년 1~12월의 조기경보시스템 모의 풍속(00, 03, 06 … 21시)를 보정한 다음, 기존 추정 풍속과 함께 추정오차를 비교하였다. 검증 지점 풍속의 평균 ME는 0.68m/s에서 보정 후 0.45m/s로 감소하였으며, 평균 RMSE는 1.30m/s에서 1.05m/s로 감소하였다. 조기경보시스템의 풍속은 전 시간대에서 모두 과대 추정되고 있는데, 보정 기법을 적용한 후에는 15시 경을 제외하고 모두 과대추정 경향이 감소하여 ME가 약 33%, RMSE는 19.2% 더 개선되었다. 농업기상재해 조기경보시스템에서 농작물의 풍해 위험 판단은 일 8회의 풍속 평균값으로부터 도출된 일 최대순간풍속을 기반으로 하는데, 풍속의 과대모의 현상을 개선하여 강풍 위험 경보의 오보를 감소시킬 것으로 기대된다.

기업의 SNS 노출과 주식 수익률간의 관계 분석 (The Analysis on the Relationship between Firms' Exposures to SNS and Stock Prices in Korea)

  • 김태환;정우진;이상용
    • Asia pacific journal of information systems
    • /
    • 제24권2호
    • /
    • pp.233-253
    • /
    • 2014
  • Can the stock market really be predicted? Stock market prediction has attracted much attention from many fields including business, economics, statistics, and mathematics. Early research on stock market prediction was based on random walk theory (RWT) and the efficient market hypothesis (EMH). According to the EMH, stock market are largely driven by new information rather than present and past prices. Since it is unpredictable, stock market will follow a random walk. Even though these theories, Schumaker [2010] asserted that people keep trying to predict the stock market by using artificial intelligence, statistical estimates, and mathematical models. Mathematical approaches include Percolation Methods, Log-Periodic Oscillations and Wavelet Transforms to model future prices. Examples of artificial intelligence approaches that deals with optimization and machine learning are Genetic Algorithms, Support Vector Machines (SVM) and Neural Networks. Statistical approaches typically predicts the future by using past stock market data. Recently, financial engineers have started to predict the stock prices movement pattern by using the SNS data. SNS is the place where peoples opinions and ideas are freely flow and affect others' beliefs on certain things. Through word-of-mouth in SNS, people share product usage experiences, subjective feelings, and commonly accompanying sentiment or mood with others. An increasing number of empirical analyses of sentiment and mood are based on textual collections of public user generated data on the web. The Opinion mining is one domain of the data mining fields extracting public opinions exposed in SNS by utilizing data mining. There have been many studies on the issues of opinion mining from Web sources such as product reviews, forum posts and blogs. In relation to this literatures, we are trying to understand the effects of SNS exposures of firms on stock prices in Korea. Similarly to Bollen et al. [2011], we empirically analyze the impact of SNS exposures on stock return rates. We use Social Metrics by Daum Soft, an SNS big data analysis company in Korea. Social Metrics provides trends and public opinions in Twitter and blogs by using natural language process and analysis tools. It collects the sentences circulated in the Twitter in real time, and breaks down these sentences into the word units and then extracts keywords. In this study, we classify firms' exposures in SNS into two groups: positive and negative. To test the correlation and causation relationship between SNS exposures and stock price returns, we first collect 252 firms' stock prices and KRX100 index in the Korea Stock Exchange (KRX) from May 25, 2012 to September 1, 2012. We also gather the public attitudes (positive, negative) about these firms from Social Metrics over the same period of time. We conduct regression analysis between stock prices and the number of SNS exposures. Having checked the correlation between the two variables, we perform Granger causality test to see the causation direction between the two variables. The research result is that the number of total SNS exposures is positively related with stock market returns. The number of positive mentions of has also positive relationship with stock market returns. Contrarily, the number of negative mentions has negative relationship with stock market returns, but this relationship is statistically not significant. This means that the impact of positive mentions is statistically bigger than the impact of negative mentions. We also investigate whether the impacts are moderated by industry type and firm's size. We find that the SNS exposures impacts are bigger for IT firms than for non-IT firms, and bigger for small sized firms than for large sized firms. The results of Granger causality test shows change of stock price return is caused by SNS exposures, while the causation of the other way round is not significant. Therefore the correlation relationship between SNS exposures and stock prices has uni-direction causality. The more a firm is exposed in SNS, the more is the stock price likely to increase, while stock price changes may not cause more SNS mentions.

수변녹지 조성을 위한 토지매수 우선순위 산정 방안 연구 (A Study on Land Acquisition Priority for Establishing Riparian Buffer Zones in Korea)

  • 홍진표;이재원;최옥현;손주동;조동길;안동만
    • 한국환경복원기술학회지
    • /
    • 제17권4호
    • /
    • pp.29-41
    • /
    • 2014
  • The Korean government has purchased land properties alongside any significant water bodies before setting up the buffers to secure water qualities. Since the annual budgets are limited, however, there has always been the issue of which land parcels ought to be given the priority. Therefore, this study aims to develop efficient mechanism for land acquisition priorities in stream corridors that would ultimately be vegetated for riparian buffer zones. The criteria of land acquisition priority were driven through literary review along with experts' advice. The relative weights of their value and priorities for each criterion were computed using the Analytical Hierarchy Process(AHP) method. Major findings of the study are as follows: 1. The decision-making structural model for land acquisition priority focuses mainly on the reduction of non-point source pollutants(NSPs). This fact is highly associated with natural and physical conditions and land use types of surrounding areas. The criteria were classified into two categories-NSPs runoff areas and potential NSPs runoff areas. 2. Land acquisition priority weights derived for NSPs runoff areas and potential NSPs runoff areas were 0.862 and 0.138, respectively. This implicates that much higher priority should be given to the land parcels with NSPs runoff areas. 3. Weights and priorities of sub-criteria suggested from this study include: proximity to the streams(0.460), land cover(0.189), soil permeability(0.117), topographical slope(0.096), proximity to the roads(0.058), land-use types(0.036), visibility to the streams(0.032), and the land price(0.012). This order of importance suggests, as one can expect, that it is better to purchase land parcels that are adjacent to the streams. 4. A standard scoring system including the criteria and weights for land acquisition priority was developed which would likely to allow expedited decision making and easy quantification for priority evaluation due to the utilization of measurable spatial data. Further studies focusing on both point and non-point pollutants and GIS-based spatial analysis and mapping of land acquisition priority are needed.

충청권 소재 제조업체들의 현금 유동성 수준에 대한 재무적 분석 (Financial Factors Influencing Corporate Cash Reserves of Firms in Chungcheong Province in the Korean Capital Markets)

  • 김한준
    • 한국산학기술학회논문지
    • /
    • 제18권1호
    • /
    • pp.679-687
    • /
    • 2017
  • 본 논문의 주제는 국내 자본시장에서 충청권에 본사가 위치한 기업들, 그 중, KOSDAQ 상장 회사들에 대한, 현금유동성 수준에 대한 재무적 결정요인 분석에 대한 실증연구이다. 본 연구를 수행하게 된 주요 동기로는 국제금융위기 이후, 동 표본회사들을 활용한 국내,외 연구들이 현재까지 미약한 수준이라고 판단되며, 현재 충청권 지역이 행정의 중심지로서의 확대와 인구통계학적 견지에서 점증적으로 수도권 등으로 부터의 동 지역으로의 인구 증가도 예상이 될 수 있다는 점 등이 요인들이다. 이러한 가정 하에서, 동 지역 자본시장 기반의 지속적인 학술 연구가 더욱 필요한 시점이라고 판단된다. 본문에서는 3가지의 가설들이 상대적 강건성을 보유한다고 판단되는 계량경제적 모형들 (즉, 정태적 패널자료모형, 토빗모형, 그리고 로지스틱모형 등)을 이용하여 검정이 되었다. 정태적 패널자료모형을 적용한 첫 번째 가설검정 결과와 관련, 동 모형에 입력된 총 9개의 설명변수들 중, 5개의 번수들 (즉, 매출채권회수기간, 유동비율, 부채비울, 매출액순이익률, 그리고 매출액)이 동 표본기업들의 현금유동성 수준에 통계적 유의성을 주는 변수들로 판명되었다. 추가적으로, 로지스틱모형을 활용한 가설검정과 관련하여, 총 설명변수들 중, 오직 2개의 변수들 (즉, 부채비율과 외국인지분율)만이 충청권 내의 2개의 행정지역인 충청북도와 충청남도 (대전시, 세종특별자치시 포함)에 각각 본사를 둔 기업들의 현금유동성 수준에 통계적 차별성을 주는 유의 변수들로 판명되었다. 본 연구결과의 학문적 그리고 실무적 관점에서의 기여점과 관련하여, 본 연구에서 유의성있는 변수들로 판명된 재무적 결정요인들을 향후 활용하여, 기업의 이윤 극대화를 위한 '최적 현금유동성 수준'에 대한 점진적 접근 가능성에 대한 추가 분석도 가능할 것으로 판단된다.

Evaluation of carbon flux in vegetative bay based on ecosystem production and CO2 exchange driven by coastal autotrophs

  • Kim, Ju-Hyoung;Kang, Eun Ju;Kim, Keunyong;Jeong, Hae Jin;Lee, Kitack;Edwards, Matthew S.;Park, Myung Gil;Lee, Byeong-Gweon;Kim, Kwang Young
    • ALGAE
    • /
    • 제30권2호
    • /
    • pp.121-137
    • /
    • 2015
  • Studies on carbon flux in the oceans have been highlighted in recent years due to increasing awareness about climate change, but the coastal ecosystem remains one of the unexplored fields in this regard. In this study, the dynamics of carbon flux in a vegetative coastal ecosystem were examined by an evaluation of net and gross ecosystem production (NEP and GEP) and $CO_2$ exchange rates (net ecosystem exchange, NEE). To estimate NEP and GEP, community production and respiration were measured along different habitat types (eelgrass and macroalgal beds, shallow and deep sedimentary, and deep rocky shore) at Gwangyang Bay, Korea from 20 June to 20 July 2007. Vegetative areas showed significantly higher ecosystem production than the other habitat types. Specifically, eelgrass beds had the highest daily GEP ($6.97{\pm}0.02g\;C\;m^{-2}\;d^{-1}$), with a large amount of biomass and high productivity of eelgrass, whereas the outer macroalgal vegetation had the lowest GEP ($0.97{\pm}0.04g\;C\;m^{-2}\;d^{-1}$). In addition, macroalgal vegetation showed the highest daily NEP ($3.31{\pm}0.45g\;C\;m^{-2}\;d^{-1}$) due to its highest P : R ratio (2.33). Furthermore, the eelgrass beds acted as a $CO_2$ sink through the air-seawater interface according to NEE data, with a carbon sink rate of $0.63mg\;C\;m^{-2}\;d^{-1}$. Overall, ecosystem production was found to be extremely high in the vegetated systems (eelgrass and macroalgal beds), which occupy a relatively small area compared to the unvegetated systems according to our conceptual diagram of a carbon-flux box model. These results indicate that the vegetative ecosystems showed significantly high capturing efficiency of inorganic carbon through coastal primary production.

이공계 대학생의 대학생활 경험과 취업의 질 : 성별차이를 중심으로 (Does College Experience Effect Job Quality Of Science And Engineering Graduates? -Focusing On Gender Gap)

  • 신하영;문보은
    • 공학교육연구
    • /
    • 제20권5호
    • /
    • pp.59-73
    • /
    • 2017
  • This study aims to examine whether a gender works to make the difference on the university experiences of natural sciences and engineering major students; and the income and quality gap between the graduates. In this study, university experiences means job market and job searching related experiences such as job fair attending, The main research questions are as follows; fist, what are the significant university experiences related job preparation and application, and is there a gender gap on those experiences? Second, how is the job market performance of the national sciences and engineering graduates for their income level and quality job, and is there a gender gap on the job market performance of the sample? Third, which variables among the university experiences for job searching and application impacts the job quality and income level of the natural sciences and engineering graduates? To find out the research results, this study conducts a panel data analysis with GOMS (Graduates Occupational Mobility Survey) throughout survey year of 2006 to 2015, towards 568,264 as weighted value number. As analysis methods, this study carries out a descriptive analysis, ANOVA, discriminant analysis, linear regression and T-test. Therefore, here are the brief outputs of the study; first, for natural sciences and engineering students, the off-campus experiences such as job fair, job recruit festival and internship programs are more favored; second, female students are more likely to attend personal and self-driven job preparation programs; third, on job market performance, the graduates' income level and company scale rate are higher in the male but job stability is higher in the female; fourth, as a result of the linear regression, gender factor decides the income level in considerable degree; additionally, gender factor shows the difference of the job satisfaction and self-effectiveness on one's job as a qualitative variables. For obtaining strictness, university program factors are controlled through model fitness process. As above, this study finds out the main factors of university life of natural sciences and engineering graduates which are related their job searching and preparation experiences and figures out stronger factors in job market; and examines the statistically significance of the gender in this casual-effect relationship between job preparation and job quality of the graduates.

Incidence, Prevalence, and Mortality Rate of Gastrointestinal Cancer in Isfahan, Iran: Application of the MIAMOD Method

  • Moradpour, Farhad;Gholami, Ali;Salehi, Mohammad;Mansori, Kamiar;Maracy, Mohammad Reza;Javanmardi, Setareh;Rajabi, Abdolhalim;Moradi, Yousef;Khodadost, Mahmod
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권sup3호
    • /
    • pp.11-15
    • /
    • 2016
  • Gastrointestinal cancers remain the most prevalent cancers in many developing countries such as Iran. The aim of this study was to estimate incidence, prevalence and mortality, as well as time trends for gastrointestinal cancers in Isfahan province of Iran for the period 2001 to 2010 and to project these estimates to the year 2020. Estimates were driven by applying the MIAMOD method (a backward calculation approach using mortality and relative survival rates). Mortality data were obtained from the Ministry of Health and the relative survival rate for all gastrointestinal cancers combined was derived from the Eurocare 3 study. Results indicated that there were clear upward trends in age adjusted incidence (males 22.9 to 74.2 and females 14.9 to 44.2), prevalence (males 52.6 to 177.7 and females 38.3 to 111.03), and mortality (males 14.6 to 47.2 and females 9.6 to 28.2) rates per 100,000 for the period of 2001 to 2010 and this upward state would persist for the projected period. For the entire period, the male to female ratio increased slightly for all parameters (incidence rate increased from 1.5 to 1.7, prevalence from 1.4 to 1.6, and mortality from 1.5 to 1.7). In males, totals of 2,179 incident cases, 5,097 prevalent cases and 1,398 mortality cases were predicated to occur during the study period. For females the predicted figures were 1,379, 3,190 and 891, respectively. It was concluded that the upward trend of incidence alongside increase in survival rates would induce a high burden on the health care infrastructure in the province of Isfahan in the future.