• 제목/요약/키워드: trend algorithm

검색결과 435건 처리시간 0.022초

정형 비정형 빅데이터의 융합분석을 위한 소비 트랜드 플랫폼 개발 (Consumer Trend Platform Development for Combination Analysis of Structured and Unstructured Big Data)

  • 김성현;장석호;이상원
    • 디지털융복합연구
    • /
    • 제15권6호
    • /
    • pp.133-143
    • /
    • 2017
  • 데이터는 금융업에서 가장 중요한 자산으로 평균 71%의 금융기관이 데이터 분석으로 경쟁우위를 창출하고 있다. 특히, 금융업 중 카드 업종에서는 전체 고객의 소비행위 패턴 및 선호 트랜드 분석에 의한 가맹점 정보, 경기 변동 상황, 상권정보 제공 서비스 개발에 빅데이터가 폭 넓게 활용되고 있지만 데이터의 융복합을 통한 새로운 가치 창출은 미흡한 편이다. 본 연구는 소셜 데이터와 BC 카드 매출데이터의 융합 분석한 신용카드 회사의 '소비 트랜드 분석 및 예측' 사례를 다룬다. BC카드는 소셜 데이터를 활용한 트랜드 프로파일링 작업과 카드 및 소셜 데이터를 연계하는 알고리즘 개발 및 분석 내용 시각화 시스템을 개발하였다. 성과 검증을 위해 '식스포켓' 관련 트랜드를 분석하고 마케팅을 시행해 본 결과 40~100%이상의 마케팅 승수 증대 효과를 거두었다. 본 연구는 그동안 개별적으로 이루어져 오던 정형, 비정형데이터 분석을 융합하여 분석하는 방법론과 사례를 창출한 의의가 있으며 이는 앞으로 카드 업종 뿐만 아니라 타 업종에도 변화하는 트랜드에 유용하게 대응할 수 있는 시사점을 제공할 것이다.

로그 및 지수파우어 강도함수를 이용한 NHPP 소프트웨어 무한고장 신뢰도 모형에 관한 비교연구 (The Comparative Study of NHPP Software Reliability Model Based on Log and Exponential Power Intensity Function)

  • 양태진
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권6호
    • /
    • pp.445-452
    • /
    • 2015
  • 소프트웨어 개발 과정에서 소프트웨어 신뢰성은 매우 중요한 이슈이다. 소프트웨어 고장분석을 위한 무한고장 비동질적인 포아송과정에서 결함당 고장발생률이 상수이거나, 단조 증가 또는 단조 감소하는 패턴을 가질 수 있다. 본 논문에서는 소프트웨어 신뢰성에 대한 적용 효율을 나타내는 로그 및 지수파우어 강도함수(로그 선형, 로그 파우어와 지수 파우어)로 신뢰성 모형을 제안한다. 효율적인 모형을 위해 평균제곱에러(MSE), 결정계수($R^2$)에 근거한 모델선택, 최우추정법, 이분법에 사용된 파라미터를 평가하기 위한 알고리즘이 적용되였다. 제안하는 로그 및 지수파우어 강도함수를 위해 실제 데이터을 사용한 고장분석이 적용되였다. 고장데이터 분석은 로그 및 지수파우어 강도함수와 비교하였다. 데이터 신뢰성을 보장하기 위하여 라플라스 추세검정(Laplace trend test)을 사용하였다. 본 연구에 제안된 로그선형과 로그파우어 및 지수파우어 신뢰성모형도 신뢰성 측면에서 효율적이기 때문에 (결정계수가 70% 이상) 이 분야에서 기존 모형의 하나의 대안으로 사용할 수 있음을 확인 할 수 있었다. 이 연구를 통하여 소프트웨어 개발자들은 다양한 강도함수를 고려함으로서 소프트웨어 고장형태에 대한 사전지식을 파악하는데 도움을 줄 수 있으리라 사료 된다.

한국자료분석학회지에 대한 토픽분석 (A Topic Analysis of Abstracts in Journal of Korean Data Analysis Society)

  • 강창완;김규곤;최승배
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2907-2915
    • /
    • 2018
  • 1998년에 창립한 한국자료분석 학회지는 자료분석에 기반한 다양한 전공분야를 위해 현재까지 응용학회지로서 역할을 해오고 있다. 본 연구에서는 이러한 한국자료분석 학회지의 본연의 목적을 잘 수행해오고 있는지 최근 10년간 학회지 요약문을 통해 분석하였다. 분석은 한국연구재단에서 제공한 온라인 저널 홈페이지를 통해 2006년부터 2016년까지의 영문 요약문 2680개를 웹크롤링하여 토픽모델을 적용하였다. 분석결과로 18개의 토픽이 선정되었으며 이에 대한 토픽을 해석한 결과 자료분석학회지는 간호학, 경영학(마케팅), 경제학 등 여러 분야를 다루고 있으며 분석방법으로 회귀분석, 가설검정, 데이터마이닝(연관성분석), 요인분석 등이 많이 이용되고 있음을 볼 수 있었다. 그리고 단어들의 연관성(association rule)분석을 통하여 통계적으로 유의한 연관성 규칙 10개를 제시하였다. 여기서 연관성규칙의 통계적 유의성검정은 피셔의 정확검정(Fisher's exact test)을 사용하였다. 또한 연구주제(토픽)의 변화를 살펴본 결과 전반기에는 조사연구가, 후반기에는 대조 연구가 많아졌음을 볼 수 있고 또한 회귀분석과 요인분석은 전, 후반기 구분 없이 자료분석에서 공통적으로 많이 사용하는 통계적 방법임을 알 수 있었다.

토픽모델링을 이용한 도시 분야 연구동향 분석 (An Analysis of the Research Trends for Urban Study using Topic Modeling)

  • 장선영;정승현
    • 한국산학기술학회논문지
    • /
    • 제22권3호
    • /
    • pp.661-670
    • /
    • 2021
  • 연구동향은 시기별 연구주제에 대한 중요도 판단과 부족한 연구 분야를 파악하고 신규 분야를 발굴하는데 유용하게 활용될 수 있다. 본 연구에서는 인구집중과 도시화로 인해 다양한 문제가 발생하고 있는 도시공간을 대상으로 한 논문들을 대상으로 시기별 연구동향을 분석하였다. 이를 위해 2002년부터 2019년 사이에 게재된 한국학술지인용색인(KCI)에 등재된 논문의 초록을 대상으로 데이터마이닝 기법 중 하나인 토픽모델링 분석을 수행하였다. 토픽모델링은 전체 내용에서 일정한 패턴을 발견해낼 수 있는 알고리즘 기반의 텍스트마이닝 기법으로 방대한 문헌에서 주제를 찾아내고 군집하는데 용이하다. 본 연구에서는 키워드 빈도, 연도별 경향, 토픽 도출, 토픽별 군집, 토픽유형별 경향에 대한 분석을 실시하였다. 그 결과 먼저 도시재생 분야연구가 지속적으로 증가되고 있고 앞으로도 세부 주제가 확대될 수 있는 분야로 분석되었다. 그리고 도시재생 주제는 이제 정규 연구분야로 자리 잡고 있는 것으로 파악되었다. 반면, 개발/성장과 에너지/환경과 같은 주제는 정체기에 들어간 것으로 분석되었다. 본 연구는 국내 전체 도시분야 연구를 대상으로 데이터마이닝 기법인 토픽모델링을 이용하여 키워드 간 연관성과 경향을 함께 분석하였다는 데 의의가 있다.

신문 빅데이터와 키워드 분석을 이용한 홈트레이닝 트렌드 분석 (Home training trend analysis using newspaper big data and keyword analysis)

  • 지동철;김상호
    • 한국융합학회논문지
    • /
    • 제12권6호
    • /
    • pp.233-239
    • /
    • 2021
  • 최근 코로나19(COVID-19)라는 신종 바이러스로 인해 사람들은 외출을 자제하고 집안에 있는 시간이 길어졌다. 그로 인해 활동량이 급감하고 체중이 증가하여 건강에 대한 관심이 더욱 높아졌고, 이를 해결하기 위한 방법으로 홈트레이닝이 대안이 될 수 있다. 이에 홈트레이닝의 트렌드를 알아보기 위해 뉴스분석시스템인 빅카인즈(BIG KINDS)에서 제공하는 뉴스를 활용하여 2019년 12월 1일부터 2020년 11월 30일까지의 기사를 수집하였다. 빈도분석, 가중도에 따른 관계도 분석, 연관어 분석을 실시하였고, 빅카인즈에서 개발한 알고리즘을 활용한 프로그램으로 분석을 실시하였다. 결론적으로 첫째, 홈트레이닝은 인공지능의 기술과 등장이 홈트레이닝을 주도하는 것으로 나타났다. 둘째, 홈트레이닝은 이동통신사의 관련한 컨텐츠와 영상서비스 위주로 이루어지고 있음을 추측할 수 있다. 셋째, 운동 종목으로는 필라테스의 선호도가 높고, 이와 관련된 운동용품의 수요가 증가함에 따라 상표출원도 영향이 있음을 알 수 있었다. 다음연구에서는 연구방법론을 보완하고 다양한 분석을 통해 향후 시행될 여러 빅데이터 연구의 기초자료로 활용될 것을 기대한다.

NFT(Non-Fungible Token) Patent Trend Analysis using Topic Modeling

  • Sin-Nyum Choi;Woong Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.41-48
    • /
    • 2023
  • 본 논문은 여러 산업 분야에서 범용적으로 활용될 수 있는 NFT(Non-Fungible Token)에 대해 토픽 모델링 기법을 활용하여 최근의 NFT 산업 동향에 대한 분석 결과를 제시한다. 본 연구에서는 산업 동향을 파악하기 위해 특허 데이터를 활용하였으며, NFT 표준안이 처음으로 발표되었던 2017년부터 2023년 10월까지 특허정보검색서비스 키프리스에 등록된 NFT 관련 국내·외 특허 각각 371건, 454건의 특허 데이터를 수집하였다. 다음으로 전처리 작업에서 불용어, 표제어를 제거 후 명사 단어만을 추출하였고, 분석 방법으론 빈도수에 따른 상위 50개의 단어를 나열하고, 단어마다 계산된 TF-IDF 값을 같이 확인하여 산업 동향의 핵심 키워드를 도출하였다. 다음으로, LDA 알고리즘을 활용해 국내·외 별로 특허 데이터에서 잠재된 4개의 주요 주제를 도출하였다. 도출한 주제별로 내용을 분석하고, 실제 NFT 산업사례를 근거로 들어 NFT 산업 동향 분석내용을 제시하였다. 선행연구에서는 논문 데이터를 통해 학술적 관점에서 동향을 제시하였다면 본 연구는 현장 실무에 기반을 둔 데이터를 활용하여 실용적인 동향 내용을 제공했다는 점에서 의의가 있으며, NFT 산업계 관련자들이 시장 현황 파악 및 새로운 아이템 창출을 위한 참고용으로 활용될 것으로 기대한다.

실시간 감시를 위한 학습기반 수행 예측모델의 검증 (Verifying Execution Prediction Model based on Learning Algorithm for Real-time Monitoring)

  • 정윤석;김태완;장천현
    • 정보처리학회논문지A
    • /
    • 제11A권4호
    • /
    • pp.243-250
    • /
    • 2004
  • 실시간 시스템은 시스템이 적시성을 보장하는지 파악하기 위해 실시간 감시기법을 이용한다. 일반적으로 실시간 감시는 실시간 시스템의 현재 동작상태를 파악하는데 중점을 두는 기법이다. 그러나 실시간 시스템의 안정적인 수행을 지원하기 위해서는, 현재 상태를 파악하는 것뿐 아니라, 실시간 시스템 및 시스템상에서 동작하는 실시간 프로세스들의 수행도 예측할 수 있어야 한다. 그러나 기존 예측모델을 실시간 감시기법에 적용하기에는 몇 가지 한계가 있다. 첫째, 예측기능은 실시간 프로세스가 종료한 시점에서 정적인 분석을 통해 수행된다. 둘째, 예측을 위해 사전 기초 통계분석이 필요하다. 셋째, 예측을 위한 이전확률 및 클러스터 정보가 현재 시점을 정확하게 반영하지 못한다. 본 논문에서는 이러한 문제점들을 해결하고 실시간 감시기법에 적용할 수 있는 학습 기반의 수행 예측모델을 제안한다. 이 모델은 학습기법을 통해 불필요한 전처리과정을 없애고, 현시점의 데이터를 이용해, 보다 정확한 실시간 프로세스의 수행 예측이 가능하도록 한다. 또한 이 모델은 실시간 프로세스 수행 시간의 증가율 분석을 통해 다단계 예측을 지원하며, 무엇보다 실시간 프로세스가 실행되는 동안 예측이 가능한 동적 예측을 지원하도록 설계하였다. 실험 결과를 통해 훈련집합의 크기가 10 이상이면 80% 이상의 판단 정확도를 보이며, 다단계 예측의 경우, 훈련집합의 크기 이상의 수행 횟수를 넘으면 다단계 예측의 예측 차는 최소화되는 것으로 나타났다. 본 논문에서 제안한 예측모델은 가장 단순한 학습 알고리즘을 적용했다는 점과, CPU, 메모리, 입출력 데이터를 다루는 다차원 자원공간 모델을 고려하지 못한 한계가 있어 향후에 관련 연구가 요구된다. 본 논문에서 제안하는 학습기반 수행 예측모델은 실시간 감시 및 제어를 필요로 하는 분야 및 응용 분야에 적용할 수 있다.

과거 TLE정보를 활용한 새로운 TLE정보 생성기법 (New TLE generation method based on the past TLEs)

  • 조동현;한상혁;김해동
    • 한국항공우주학회지
    • /
    • 제45권10호
    • /
    • pp.881-891
    • /
    • 2017
  • 본 논문에서는 인공위성의 궤도예측을 위해 사용되는 미국 합동우주관제센터(JSpOC, Joint Space Operation Center)의 TLE(Two Line Element) 정보에 대한 SGP4(Simplified General Perturbations 4) 모델의 장기 궤도예측 오차를 줄이기 위해 과거의 TLE 정보들을 이용한 보상기법을 적용하여 새로운 TLE 정보를 생성하는 방법에 대해 기술하고 있다. 이를 위해 과거 특정 시점에서의 TLE 정보를 바탕으로 현재까지 궤도전파를 한 데이터와 동일기간 동안 미국 합동우주관제센터에서 공개된 모든 TLE를 이용해서 궤도전파를 수행한 데이터를 비교하여 계산한 궤도잔차를 이용하였다. 이러한 궤도잔차 성분은 SGP4 궤도전파 모델에 의한 궤도오차 증가 경향을 보여주고 있기 때문에 궤도오차 보정을 위해 해당 궤도잔차 성분들을 적절한 함수로 표현하였다. 이후, 현재 시점에서 공개된 TLE 정보를 이용한 SGP4 궤도전파 데이터에 해당 잔차함수를 적용함으로써 장기 궤도전파에 따른 SGP4 모델의 궤도오차를 줄일 수 있었으며, 이를 바탕으로 새로운 TLE 정보를 생성하였다. 본 논문에서 일주일의 궤도전파에 대한 시뮬레이션을 통해 기존의 TLE를 이용한 궤도전파 오차가 4km 정도인 반면 새로운 TLE 생성기법에 의한 궤도전파 오차가 약 2km 수준으로 줄어드는 것을 확인할 수 있었다.

캄보디아 음악 산업 재건을 위한 감정 분석 엔진 연구 (Sentiment Analysis Engine for Cambodian Music Industry Re-building)

  • 삭소니타 코으른;김윤선
    • 한국시뮬레이션학회논문지
    • /
    • 제26권4호
    • /
    • pp.23-34
    • /
    • 2017
  • 캄보디아의 대중음악은 크메르 루즈 정권 기간 동안 예술가의 90 %가 사망 한 이래로 완전히 잊혀졌다. 1979 년부터 전쟁에서 회복 한 후 1990 년 음악은 다시 성장하기 시작했다. 그러나 캄보디아 대중 음악의 역 동성과 흐름은 다면적 사회 경제적, 정치적, 창조적 세력에 의해 관찰 되고 있지만, 표절과 불법 복제로 수년간 대중음악산업에서 널리 퍼져 많은 문제가 되어왔다. 최근에는 크메르(캄보디아언어) 전통 음악을 팬과 아티스트 모두에게 보존해야 할 필요성에 대한 의식이 높아져 캄보디아 젊은 인구의 새로운 트렌드가 되었으나, 음악 품질은 여전히 한계상태에 봉착해 있고, 전통 대중 음악의 전문성을 높이기 위해서는 대중의 드백과 영감이 필요하다. 이 연구는 캄보디아에서 가장 많은 대중음악 관련 사이트인 페이스 북 페이지의 게시물과 코멘트에서 수집 된 문장들을 감정분석을 사용하여 음악 순위 차트(웹 사이트)를 구현하였다. 크메르어에서 영어로 번역하고 감정 분석을 수행하고 순위를 생성하는 알고리즘 개발하였다. 그 결과로 제안 된 시스템에서 번역 및 감정분석의 정확도가 80 %임을 보여주었다. 순위에서 높이 평가된 노래는 크메르(캄보디아언어)로 된 전통대중음악으로 이 논문의 취지와 부합이 되었다. 캄보디아 전통대중음악을 다시 부활하기 위해서 제안 된 시스템과 순위 알고리즘을 사용하여 음악제작의 경쟁 우위를 높이고 제작자가 특정 활동 및 이벤트에 맞는 새 노래를 작곡하는 데 도움이 될것으로 사료된다.

다크넷 트래픽의 목적지 포트를 활용한 블랙 IP 탐지에 관한 연구 (A Study on Detecting Black IPs for Using Destination Ports of Darknet Traffic)

  • 박진학;권태웅;이윤수;최상수;송중석
    • 정보보호학회논문지
    • /
    • 제27권4호
    • /
    • pp.821-830
    • /
    • 2017
  • 인터넷은 우리나라의 경제 사회를 움직이는 중요한 인프라 자원이며 일상생활의 편리성 효율성을 제공하고 있다. 하지만, 인터넷 인프라 자원의 취약점을 이용하여 사용자를 위협하는 경우가 발생한다. 최근에 지속적으로 지능적이고 고도화된 새로운 공격 패턴이나 악성 코드들이 늘어나고 있는 추세이다. 현재 신 변종 공격을 막기 위한 연구로 다크넷이라는 기술이 주목받고 있다. 다크넷은 미사용 중인 IP 주소들의 집합을 의미하며, 실제 시스템이 존재하지 않는 다크넷으로 유입된 패킷들은 신규 악성코드에 감염된 시스템이나 해커에 의한 공격행위로 간주 될 수 있다. 따라서 본 연구는 다크넷에 수집된 트래픽의 포트 정보를 기반한 통계 데이터를 추출하고 알려지거나 알려지지 않은 블랙 IP를 찾기 위한 알고리즘을 제시하였다. 국내 미사용 중인 IP 주소 8,192개(C클래스 32개) 다크넷 IP에서 3개월간(2016. 6 ~ 2016. 8) 총 827,254,121건의 패킷을 수집하였다. 수집된 데이터를 제시한 알고리즘 적용 결과, 블랙 IP는 6월 19건, 7월 21건, 8월 17건이 탐지되었다. 본 연구의 분석을 통해 얻어진 결과는 기존 알려진 공격들의 블랙 IP 탐지 빈도를 알 수 있고 잠재적인 위협을 유발할 수 있는 새로운 블랙 IP를 찾아낼 수 있다.