• 제목/요약/키워드: data mining processes

검색결과 140건 처리시간 0.026초

시간흐름을 고려한 특징 추출과 군집 분석을 이용한 헬스 리스크 관리 (Health Risk Management using Feature Extraction and Cluster Analysis considering Time Flow)

  • 강지수;정경용;정호일
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.99-104
    • /
    • 2021
  • 본 논문에서는 시간 흐름을 고려한 특징추출과 군집분석을 이용한 헬스 리스크 관리를 제안한다. 제안하는 방법은 세단계로 진행한다. 첫 번째는 전처리 및 특징추출 단계이다. 이는 웨어러블 디바이스를 이용하여 라이프로그를 수집하여 불완전데이터, 에러, 잡음, 모순된 데이터를 제거하며 결측 값을 처리한다. 그 다음 특징추출을 위해 주성분 분석을 통해 중요 변수를 선택하고, 상관계수와 공분산을 통해 데이터 간의 관계와 유사한 데이터들의 분류를 진행한다. 또한 라이프로그에서 추출한 특징을 분석하기 위해 시간의 흐름을 고려하여 K-means 알고리즘을 통해 동적 군집을 진행한다. 새로운 데이터는 오차 제곱합의 증가분을 기반으로 유사성 거리 측정 방법을 통해 군집을 진행하고, 시간의 흐름을 고려하여 군집에 대한 정보를 추출한다. 따라서 특징 군집을 통해 헬스 의사결정 시스템을 이용하여 신체적 특성, 생활습관, 질병여부, 헬스케어 이벤트 발생위험, 예상 정도 등의 요소를 통해 리스크를 관리할 수 있다. 성능평가는 Precision, Recall, F-measure을 사용하여 제안하는 방법과 퍼지방법, 커널기반 방법을 비교한다. 평가결과 제안하는 방법이 우수하게 평가된다. 따라서 제안하는 방법을 통해 유병자와의 유사도를 이용하여 정확한 사용자의 잠재적 건강 위험을 예측 및 적절한 관리가 가능하다.

Development of big data based Skin Care Information System SCIS for skin condition diagnosis and management

  • Kim, Hyung-Hoon;Cho, Jeong-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.137-147
    • /
    • 2022
  • 피부상태의 진단과 관리는 뷰티산업종사자와 화장품산업종사자에게 그 역할을 수행함에 있어서 매우 기초적이며 중요한 기능이다. 정확한 피부상태 진단과 관리를 위해서는 고객의 피부상태와 요구사항을 잘 파악하는 것이 필요하다. 본 논문에서는 피부상태 진단 및 관리를 위해 소셜미디어의 빅데이터를 사용하여 피부상태 진단 및 관리를 지원하는 빅데이터기반 피부관리정보시스템 SCIS를 개발하였다. 개발된 시스템을 사용하여 텍스트 정보 중심의 피부상태 진단과 관리를 위한 핵심 정보를 분석하고 추출할 수 있다. 본 논문에서 개발된 피부관리정보시스템 SCIS는 빅데이터 수집단계, 텍스트전처리단계, 이미지전처리단계, 텍스트단어분석단계로 구성되어 있다. SCIS는 피부진단 및 관리에 필요한 빅데이터를 수집하고, 텍스트 정보를 대상으로 핵심단어의 단순빈도분석, 상대빈도분석, 동시출현분석, 상관성분석을 통해 핵심단어 및 주제를 추출하였다. 또한 추출된 핵심단어 및 정보를 분석하고 산포도, NetworkX, t-SNE 및 클러스터링 등의 다양한 시각화 처리를 함으로써 피부상태 진단 및 관리에 있어 이를 효율적으로 사용할 수 있도록 하였다.

기술가치 평가를 위한 기술사업화 기간 및 비용 추정체계 개발 (Development of Systematic Process for Estimating Commercialization Duration and Cost of R&D Performance)

  • 전승표;최대헌;박현우;서봉군;박도형
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.139-160
    • /
    • 2017
  • 기술사업화는 기업의 연구개발 과정 및 결과물을 시장에 효과적으로 연계하여 경제 가치를 창출하는 것을 의미한다. 거시적인 관점에서 보면 기술사업화는 국가수준의 R&D 효과성을 강화할 수 있으며, 관련된 산업의 발전을 촉진할 수 있다. 또한, 미시적인 관점에서 보면 기업이나 개인들은 기술사업화를 통해서 경쟁우위를 확보하고, 유지할 수 있다. 특정 기술이 사업화까지 이르기 위해서는 기술 기획, 기술의 연구와 개발, 상용화 즉 시장 진출까지의 크게 세 단계를 거치는 게 일반적이며, 이런 일련의 과정은 많은 시간과 비용을 수반한다. 따라서 연구개발 착수에서 상용화까지 소요되는 기술사업화 기간과 비용은 기업 입장에서는 시장 진출 전략을 결정하는 데 중요한 의사결정 정보가 되며, 기술 투자자에게는 기술가치를 합리적으로 평가하는데 더욱 중요한 정보가 된다. 이렇게 중요한 기술사업화 소요 기간과 비용을 과학적으로 추정하는 것은 매우 중요하지만 현재까지 이런 두 가지 정보에 대한 연구는 매우 부족한 실정이며, 널리 알려진 방법론도 부재한 상황이다. 본 연구의 목적은 기술사업화 기간과 비용을 추정하는 체계를 설계하고 이를 실제 기업데이터를 활용하여 개발하는 것이다. 구체적으로 특정 기술의 기술 자체의 요인, 기술개발 주체의 역량, 외부 환경 요인의 세 관점에서 어떤 요인들이 기술사업화 기간 및 비용에 영향을 주는지 도출하고, 해당 요인들의 수준에 따라 기술사업화 기간 및 비용을 제시하는 모형을 개발하고자 한다. 본 연구의 결과는 기술을 개발하는 주체와 기술을 투자하는 주체 모두에게 유용하게 활용될 것으로 기대된다.

A comparison of the characteristic properties between soybean (Glycine max [L.] Merrill) seeds with different seed coat colors

  • Oh, Sung-Dug;Yeo, Yunsoo;Lee, So-Young;Suh, Sang Jae;Moon, Jung Kyung;Park, Soo-Kwon;Park, Soo-Yun
    • 농업과학연구
    • /
    • 제46권4호
    • /
    • pp.971-980
    • /
    • 2019
  • We profiled the health-promoting bioactive components in nine types of soybean seeds with different seed coat colors (yellow, green, brown, and black) and investigated the effects of different extraction solvents (methanol, ethanol, and water) on their antioxidant activities. The carotenoid and anthocyanin compositions varied greatly by seed color, and the phenolic acids, total phenol, and total flavonoid contents differed by genotype. The carotenoid content was relatively higher in soybean seeds with green and black seed coats than in those with a yellow seed coat while lutein was the most plentiful. The anthocyanin content was considerably higher in the soybean seed with the black seed coat. The results of the DPPH assay showed strong antioxidative activities in the methanol- and water-extracts compared to the ethanol-extract, irrespective of the seed coat colors. Moreover, the soybean seeds with the black seed coat exhibited the highest antioxidant activity among the samples, regardless of the extraction solvent used. Eighteen bioactive compounds were subjected to data-mining processes including principal component analysis and hierarchical clustering analysis. Multivariate analyses showed that brown and black seeds were distinct from the yellow and green seeds in terms of the levels of carotenoids and anthocyanins, respectively. These results help our understanding of the compositional differences in the bioactive components among soybean seeds of various colors, providing valuable information for future breeding programs that seek to enhance the levels of compounds with health benefits.

Key success factors for implementing modular integrated construction projects - A literature mining approach

  • Wuni, Ibrahim Yahaya;Shen, Geoffrey Qiping
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.343-352
    • /
    • 2020
  • Modular integrated construction (MiC) is an innovative construction method where components of a building are manufactured in an offsite factory, trucked to the job site in sections, set in place with cranes, and assembled together to form a whole building. Where circumstances merit, favorable conditions exist and implemented effectively; MiC improves project performance. However, several key factors need to converge during implementation to realize the full benefits of MiC. Thus, a thorough understanding of the factors which are critical to the success of MiC projects is imperative. Drawing on a systematic review of 47 empirical studies, this research identified 25 key success factors (KSFs) for MiC projects. Of these, the five topmost cited KSFs for MiC projects include effective working collaboration and communication among project participants; standardization, optimization, automation and benchmarking of best practices; effective supply chain management; early design freeze and completion; and efficient procurement method and contracting. The study further proposed a conceptual model of the KSFs, highlighting the interdependences of people, processes, and technology-related KSFs for the effective accomplishment of MiC projects. The set of KSFs is practically relevant as they constitute a checklist of items for management to address and deal with during the planning and execution of MiC projects. They also provide a useful basis for future empirical studies tailored towards measuring the performance and success of MiC projects. MiC project participants and stakeholders will find this research useful in reducing failure risks and achieving more desired performance outcomes. One potential impact of the study is that it may inform, guide, and improve the successful implementation of MiC projects in the construction industry. However, the rigor of the analysis and relative importance ranking of the KSFs were limited due to the absence of data.

  • PDF

텍스트 마이닝 기법을 활용한 고전 추리 소설 작가 간 문체적 차이와 문체 구조에 대한 연구 (A study on detective story authors' style differentiation and style structure based on Text Mining)

  • 문석형;강주영
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.89-115
    • /
    • 2019
  • 본 연구는 고전 추리 소설 작가로 유명한 아서 코난 도일과 애거서 크리스티의 문체적 차이점을 데이터 분석을 통해 제시하고, 나아가 텍스트 마이닝에 입각한 문체 연구의 해석적 방법론을 제시하고자 시행되었다. 추리 소설의 핵심 요소인 사건과 인물에 더해 작가의 문법적인 집필 방식을 문체로 정의하고 분석을 시도하였다. 작가 별로 각 2권, 총 4권의 책을 선정하였으며 문장 단위로 텍스트를 나누어 데이터를 확보하였다. 각 문장에 따른 감성 점수를 부여한 뒤 페이지 진행에 따른 감성을 시각화하였으며, 페이지에 따라 토픽 모델링을 적용하여 소설 속 사건 진행 흐름을 파악할 수 있었다. 동시 발생 매트릭스(co-occurrence matrix)를 구성하고 네트워크 분석(Network Analysis)을 시행함으로써 사건이 진행되는 과정에서 인물들 간 관계의 변화를 확인할 수 있었다. 또한 전체 문장을 총 6가지 문체를 기준으로 문법적인 체계를 나누어 작가 간, 그리고 작품 간 집필 방식의 차이점을 확인하였다. 이러한 일련의 연구 과정은 문체에 대한 이해를 바탕으로 글 전체의 맥락을 파악할 수 있도록 도움을 줄 수 있으며, 나아가 기존에 개별적으로 진행되었던 문체 연구를 통합시킴으로써 문체 구조에 대한 이해를 도울 수 있다. 그리고 이러한 선행된 이해를 통해 온라인 텍스트를 비롯한 비정형 데이터 속 문체의 존재를 발견하고 구체화하는 작업에 기여할 수 있다. 뉴미디어를 포함한 온라인 텍스트를 심도 있게 분석하고자 하는 시도가 증가하고 있는 상황에서 해당 연구들과 연계를 통해 보다 의미 있는 온라인 텍스트 분석에 기여할 것으로 기대된다.

주경로 분석과 연관어 네트워크 분석을 통한 '구전(WoM)' 관련 연구동향 분석 (Analysis of Research Trends of 'Word of Mouth (WoM)' through Main Path and Word Co-occurrence Network)

  • 신현보;김혜진
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.179-200
    • /
    • 2019
  • 구전(Word-of-Mouth) 활동은 오래 전부터 기업의 마케팅 과정에서 중요성을 인식하고 특히 마케팅 분야에서 많은 주목을 받아왔다. 최근에는 인터넷의 발달에 따라 온라인 뉴스, 온라인 커뮤니티 등에서 사람들이 지식과 정보를 주고 받는 방식이 다양해지면서 구전은 후기, 평점, 좋아요 등으로 입소문의 양상이 다각화되고 있다. 이러한 현상에 따라 구전에 관한 다양한 연구들이 선행되어왔으나, 이들을 종합적으로 분석한 메타 분석 연구는 부재하다. 본 연구는 학술 빅데이터를 활용해 구전 관련 연구동향을 알아내기 위해서 텍스트 마이닝 기법을 적용하여 주요 연구들을 추출하고 시기별로 연구들의 주요 쟁점을 파악하는 기법을 제안하였다. 이를 위해서 1941년부터 2018년까지 인용 데이터베이스인 Scopus에서 'Word-of-Mouth'라는 키워드로 검색되는 총 4389건의 문헌을 수집하였고, 영어 형태소 분석과 불용어 제거 등 전처리 과정을 통해 데이터를 정제하였다. 본 연구는 학문 분야의 발전 궤적을 추적하는 데 활용되는 주경로 분석기법을 적용해 구전과 관련된 핵심 연구들을 추출하여 연구동향을 거시적 관점에서 제시하였고, 단어동시출현 정보를 추출하여 키워드 간 네트워크를 구축하여 시기별로 구전과 관련된 연관어들이 어떻게 변화되었는지 살펴봄으로써 연구동향을 미시적 관점에서 제시하였다. 수집된 문헌 데이터를 기반으로 인용 네트워크를 구축하고 SPC 가중치를 적용하여 키루트 주경로를 추출한 결과 30개의 문헌으로 구성된 주경로가 추출되었고, 연관어 네트워크 분석을 통해서는 시기별로 온라인 시대, 관광 산업 등 다양한 산업군 등 산업 변화가 반영돼 시대적 변화와 더불어 발전하고 있는 학술적 영역의 변화를 확인할 수 있었다.

인공지능 알고리즘은 사람을 차별하는가? (Does Artificial Intelligence Algorithm Discriminate Certain Groups of Humans?)

  • 오요한;홍성욱
    • 과학기술학연구
    • /
    • 제18권3호
    • /
    • pp.153-216
    • /
    • 2018
  • 빅데이터에 근거하여 자동적인 의사결정을 내리는 알고리즘이 사회의 각종 영역에서 점차 널리 사용되고 있는 저변에는 알고리즘의 의사결정이 사회의 자원을 보다 효율적으로 분배하리라는 기대 뿐만 아니라 그 결정이 선입견, 편향, 자의적 판단 등이 개입될 수 있는 인간의 의사결정보다 더 공정한 결과를 낳으리라는 희망 또한 자리잡고 있다. 하지만 알고리즘 의사결정이 그 결정에 의해 영향 받는 이들을 공정하게 다루지 않는다는 주장이 여러 사례와 함께 거듭 제기되면서, 의사결정이 어떻게 절차화되었는지, 또한 특정한 의사결정을 공정하다고 판단하는 데에 어떤 요인이 고려되는지에 대한 근본적인 질문들이 새롭게 제기되고 있다. 본 논문은 사법, 치안, 국가 안보의 세 가지 알고리즘 활용 영역에서 차별의 문제가 제기되는 상황을 구체적으로 분석한 연구들을 검토함으로써, 인공지능 알고리즘이 과연 특정 집단의 인간을 차별하는지, 그리고 공정한 의사결정을 분별하는 기준은 무엇인지 살펴보고자 한다. 본격적인 검토에 앞서 데이터 마이닝 각 단계에서 의도적으로 그리고 비의도적으로 편향적인 결과가 산출될 수 있는 원인에는 무엇이 있는지를 살필 것이다. 결론에서는 이러한 이론적이고 실질적인 검토가 현대 한국 사회에 시사하는 바가 무엇인지 간추려 제시할 것이다.

딥러닝 기반 달 표면 모사 환경 실시간 객체 인식 및 매칭 시스템 개발 (Development of System for Real-Time Object Recognition and Matching using Deep Learning at Simulated Lunar Surface Environment)

  • 나종호;공준호;이수득;신휴성
    • 터널과지하공간
    • /
    • 제33권4호
    • /
    • pp.281-298
    • /
    • 2023
  • 달 현지 탐사를 위해 무인 이동체에 대한 연구가 지속적으로 이루어져 있으며 달 지상 관심 지역의 정확한 위치 및 맵핑을 위한 실시간 정보화 작업이 요구되고 있다. 딥러닝 영상 처리 분석 기술을 실제 로버에 적용하기 위해 소프트웨어의 통합과 최적화에 대한 연구가 필요하며 본 연구에서는 가상의 달 기지 건설현장의 영상을 실시간 분석하여 핵심 객체의 공간 정보를 자동으로 수치화하는 방안에 대한 기초 연구가 진행되었다. 본 연구를 통해 이미 구축된 영역 분할 기반 객체 인식 알고리즘을 경계 상자 기반 객체 인식알고리즘으로 변경하여 객체 인식 정확도 및 추론 속도를 개선하는 작업이 이루어졌으며, 대용량 데이터 기반 객체 매칭 학습을 위해 Batch Hard Triplet Mining 기법을 도입하고, 학습 및 추론에 대한 최적화 연구가 수행되었다. 또한 개선된 객체 인식 및 동일 객체 매칭 소프트웨어를 통합하고, 입력 이미지 내 동일 객체 자동 매칭을 시각화하는 소프트웨어를 개발하였으며, 위성 모사 촬영 영상 내 객체를 학습 데이터로, 이동체 촬영 영상 내 객체를 추론 데이터로 사용하여 동일 객체 매칭의 학습 및 추론이 이루어졌다. 본 연구의 결과는 이동체의 연속 촬영 영상을 기반 3차원 공간 정보를 구현 및 관심 공간 내 객체 위치 설정에 활용할 수 있을 것으로 사료되며, 향후 달 기지 건설 현장에서의 영상 기반 시공 모니터링 및 제어를 위한 자동 현장 및 주요 대상물 공간 정보 구축 시스템과의 연계에 기여할 것으로 기대된다.

고객별 구매빈도에 동적으로 적응하는 개인화 시스템 : 음료수 구매 예측에의 적용 (The Adaptive Personalization Method According to Users Purchasing Index : Application to Beverage Purchasing Predictions)

  • 박윤주
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.95-108
    • /
    • 2011
  • 인터넷 비즈니스의 활성화에 따라서 기업은 고객의 인물정보 및 거래정보를 활용하여 보다 맞춤화된 개인화 서비스를 제공하고 있다. 기존의 고객군별 예측기법은 유사한 고객들을 군집화하여 고객군별로 예측모델을 수립하는 것으로, 구매가 많고 충성도가 높은 핵심고객에게 요구되는 일대일 서비스를 제공하는 데는 한계가 있다. 반면 일대일 고객별 예측기법은 각 고객에게 고도로 맞춤화된 서비스를 제공하지만, 과거 구매이력이 많지 않은 고객 이나 신규 고객에게는 정확한 개인화 서비스를 제공하지 못한다. 본 연구는 고객의 구매빈도에 따라서 유사 고객들과의 군집화 수준을 동적으로 조정하는 새로운 지능형 개인화 시스템을 제안한다. 제안된 시스템은 과거 구매가 많은 고객들에 대해서는 일대일 예측모델을 수립하지만, 구매 빈도가 낮은 고객의 경우 다른 고객들과의 최적화된 군집화를 통해 예측모델을 수립한다. 본 기법을 Neilsen의 음료수 구매 데이터셋에 적용하여 고객의 일회 구매금액 및 구매품목을 예측한 결과, 기존 두 예측기법들에 비하여 적정한 계산비용(computational cost)으로 더욱 정확한 개안화 서비스를 제공할 수 있음을 확인하였다.