• 제목/요약/키워드: Big 5 모델

검색결과 197건 처리시간 0.025초

모형시험과 개별요소법을 이용한 단면 형상에 따른 공동 주변 취성파괴에 관한 연구 (A Study on the Stress Induced Brittle Failure around Openings with Cross-sectional Shape by Scaled Model Test and DEM Simulation)

  • 배성호;전석원;박의섭
    • 터널과지하공간
    • /
    • 제17권5호
    • /
    • pp.389-410
    • /
    • 2007
  • 불연속면의 빈도가 높지 않은 견고한 암반의 경우 굴착시 공동 주변 영역에서의 파괴나 변형 특성은 형성되어 있는 초기응력 조건과 강도 특성에 절대적인 영향을 받는다. 과도한 초기응력장은 굴착 공동 주변에 점진적이고 국부적인 취성파괴를 유발시킴으로서 시공의 안정성과 경제성을 확보하는데 장애요인으로 작용할 수 있다. 이 논문에서는 응력 수준과 터널형상에 따른 공동 주변의 취성파괴 거동 특성을 파악하기 위해 축소된 터널 시험체를 이용한 이축압축시험과 입자 결합모델을 이용한 개별요소법의 일종인 $PFC^{2D}$ 해석에 의한 연구를 수행하였다. 실내 이축압축시험을 통해 취성파괴의 발생 영역과 형태 면에서 실제 암반 공동 주변에서 발생된 파괴 특성과 유사한 파괴 거동을 모사할 수 있었다. 모형시험체에 대한 이축압축시험 결과 최소 주응력 방향의 공동 단면 곡선부에서는 균열이 표면에서 개시된 후 내부로 진행되어 국부적인 노치형 파괴영역이 형성되었다. 이에 비해 모서리와 직선부의 경우 공벽 표면과 내부에서 발생된 균열들의 상호 연결, 결합에 의해 대규모의 노치형 분리면이 유도되고 곡선부에 비해 큰 파괴영역이 형성되는 것으로 조사되었다.

광주시 상업지 지가의 형성요인에 관한 연구 (A Study on Determinants of Commercial Land Values in Gwangju City)

  • 이현욱
    • 한국지역지리학회지
    • /
    • 제2권2호
    • /
    • pp.159-171
    • /
    • 1996
  • 본 연구는 심각해지는 토지문제를 해결하기 위해 최근에 시행되고 있는 여러가지 토지제도들이 효과적으로 운용되도록 지가를 정확히 산정하고자 하는 움직임에 대한 기초 연구로서, 다른 토지이용에 비해 월등 높은 지가를 보이고 중은 범위에서도 그 변동폭이 큰 상업지를 택하여, 상업지지가의 지역적 차이가 왜 발생하는지 알아보고자 하였다. $1989{\sim}1996$ 동안의 상업지역의 확산은 시 외곽에 빠르게 조성되고 있는 고밀도 아파트 단지를 배후지로 하여 주요 간선도로변을 따라 활발하게 이루어지고 있는 반면, 도심부는 영세한 부지규모 및 노후화한 건물들로 말미암아 급변하고 있는 상업환경의 변화에 능동적으로 대응하지 못하므로서 지가하락 현상을 보이고 있다. 상업지지가와 관련이 있으리라고 예상되는 6개 변수를 이용하여 중다희귀분석을 적용한 결과 보행자 통행량과 도심으로부터의 거리 등 두 변수가 상업지지가 변화량의 65% 정도를 설명해 주었다. 설명되지 않은 35%의 해명을 위해 잔차분석을 행한 결과 도심부의 과소예측, 시 외곽의 과대 예측을 읽을 수 있었는데 이는 광주시의 단핵구조적 특성의 반영일 뿐만 아니라 이 모델이 갖고 있는 한계이다.

  • PDF

머신러닝 알고리즘을 이용한 온실 딸기 생산량 예측 (Prediction of Greenhouse Strawberry Production Using Machine Learning Algorithm)

  • 김나은;한희선;아룰모지엘렌체쟌;문병은;최영우;김현태
    • 생물환경조절학회지
    • /
    • 제31권1호
    • /
    • pp.1-7
    • /
    • 2022
  • 서부 경남 지역 중 딸기재배로 유명한 지역 40개 농가를 대상으로 한 조사에 따르면 국산품종 중에서 "설향"이 65.0%으로서 가장 선호하고 있는 것으로 나타났다. 그리고 현재의 농업은 4차 산업혁명으로 스마트팜(Smart Farm)의 기술이 더욱 발전하고 있는 실정이다. 그러나 각 생육단계가 어떤 상황일 때 딸기의 생산량이 최적에 달하는지 대한 기준이 없으며, 이러한 판단기준은 아직까지 스마트팜에 경험이 있는 농업인의 의사에 달려있다는 문제점이 있다. 따라서 본 연구에서는 딸기의 생육상황에 대한 생산량 예측을 통해 선진화된 스마트팜 시스템을 구축하고자 한다. 실험 장소는 경상남도 사천시의 딸기 농가에서 수행하였으며, 총 3곳을 대상으로 데이터 수집을 진행하였다. 실험 대상의 모든 온실 내에서 재배하는 딸기의 품종은 '설향'이다. 작물 데이터의 수집 항목은 작물의 엽수, 꽃수, 과실수, 초장, 잎의 길이, 엽록소 함량이며, 환경 데이터의 수집 항목은 온도, 습도, 조도이다. 기존의 농가 단위의 스마트팜의 문제점 보완 및 개선을 통하여 고품질의 작물 생장 상태를 유지하기 위해 K-fold 교차검증, Lasso 회귀분석, MAPE 검증을 통해 예측모델을 도출하였으며, MAPE 검증 결과 값으로 0.511(꽃 예측)과 0.488(과일 예측)의 값이 나타났다. 본 연구는 스마트팜 데이터 구축을 위해서는 AI를 통해 성장상태별 수확량을 예측하였으며, 이를 농가 및 농업 관련 기업에 활용해 농업 서비스가 편리할 것으로 판단된다.

개인정보 자기결정권 확대를 위한 데이터 신탁제도 도입 방안 연구 (A Study on the Introductioin of Data Trusts System to Expand the Rights of Privacy Self-Determination)

  • 장근재;이승용
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.29-43
    • /
    • 2022
  • 데이터 경제는 현대 사회에서 디지털 혁신과 함께 빠르게 성장하고 있다. 기업은 다양한 유형의 데이터를 수집·활용하여 새로운 수익을 창출하길 희망하고, 개인정보를 포함한 데이터의 가치는 더욱 높아지고 있다. 하지만 데이터 산업 정책에 대한 연구 중 정보 주체에 대한 논의는 부족한 상황이다. 개인정보는 보호 가치를 넘어서 높은 유용성을 가지고 있다. 이러한 관점에서 데이터 신탁제도는 개인정보의 안전한 활용을 위한 좋은 해결책이다. 데이터 신탁을 활용한 구글의 토론토 스마트시티 구축 사례, 일본의 정보은행 사례, 국내 최초의 데이터 배당을 시도한 경기도의 사례를 소개한다. 데이터 신탁 사례와 동향 파악을 통해 데이터 신탁 개념을 명확히 하고 제도 활성화에 필요한 기술적 요인을 추출하고 비즈니스 모델을 제안하고자 한다. 이를 시사점으로 하여 데이터 신탁제도를 통해 안전한 데이터의 활용과 새로운 서비스 시장 창출뿐만 아니라 새로운 데이터 경제를 구성하는데 크게 기여할 것으로 기대한다.

키 입력 시간차이를 이용한 새로운 접속인증 시스템 소개 (A New Access Certification System with Temporal Key Stroke Information)

  • 최원용;김성진;허강인;문규
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제5권4호
    • /
    • pp.45-53
    • /
    • 2015
  • 본 논문은 키 입력 시간차이를 이용한 새로운 접속인증 시스템을 소개한다. 새로운 인증 시스템은 기존의 문자열을 비교하여 인증하던 방식에 비추어 키 입력의 시간정보를 이용하여 문자정보 이외의 미리 설정된 시간정보도 동시에 비교함으로서 보안성을 간단히 극대화하는 신개념 인증 시스템이다. 키 입력 시간정보는 최대/최소의 조건이 있으며, 최대의 경우 시간 이내에 다음 키를 입력해야 하며, 최소의 경우 시간 이상을 기다렸다 다음 키를 입력해야 인증이 된다. 최대/최소 조건이 없는 경우는 기존의 인증 시스템과 차이 없이 동작된다. 프로토타입이 개발 되어 실험 되었으며 숫자로 이루어진 4자리 비밀번호의 경우 총 104 (1만 가지) 가지를 가지는데 비하여 본 기술은 10자리 이상의 보안효과를 갖게 된다. 본 기술의 효과로는 문자비밀번호를 그대로 두고 시간정보만을 변경함으로서 관리자와 사용자 모두에게 간단하게 접근인증 또는 개인 비밀번호의 보안성을 극대화 하는 효과가 있다. 시연 모델과 더불어 간단한 동작 원리를 선보였으며, 예상되는 기대효과에 대해서도 기술하였다.

텍스트마이닝을 활용한 종분포모형의 국내 연구 동향 파악 (Trends identification of species distribution modeling study in Korea using text-mining technique)

  • 김동주;권용성;한나연;이도훈
    • 환경생물
    • /
    • 제41권4호
    • /
    • pp.413-426
    • /
    • 2023
  • 종분포모형은 생물다양성 보전 및 기후변화 영향평가 등을 위해 활발히 이용되는 방법론이며, 국내에서도 다양한 연구가 진행되고 있으나, 관련 연구 현황과 최근의 동향을 파악하고 시사점을 논의하여 미래 연구에 유용한 정보를 제공하는 연구는 부족한 실정이다. 본 연구에서는 국내의 학술지에서 출판된 학술논문을 대상으로 종분포모형의 활용 동향과 흐름을 파악하여 향후 관련 연구에서 활용될 수 있는 기초적인 정보를 제공하고자 하였다. 우리는 국내의 관련 학술논문을 수집하여 문헌학적 방법과 텍스트마이닝을 통해 분석했고 이를 토대로 종분포모형 관련 연구현황과 최근의 동향을 파악하였다. 국내 종분포모형 관련 학술논문은 1998년부터 2023년까지 총 148편이 출판되었으며, 그중 115편(77.7%)은 2015년 이후 출판된 것으로 나타났다. 다양한 알고리즘 중 MaxEnt 모델이 가장 많이 활용되었으며(44.5%), 식물을 대상으로 한 연구와 생물종 분포 및 평가, 기후변화와 관련된 주제가 주요 주제로 다루어졌다. 텍스트마이닝 분석에서 가장 많이 출현한 핵심어는 "Climate change"로 다양한 연구 주제에서 기후변화로 인한 생물다양성 변화를 고려하였다. 향후 종분포모형의 활용에는 다양한 조건에 따른 최적의 모형 선택, 모형 간 연계, 정량적인 입력 변수의 개발 등을 고려할 필요가 있으며, 현지 조사 자료의 수집 체계 개선 등을 도모하면 생물 다양성 보전과 기후 대응 등 국가 정책 수요에 유용하게 활용될 수 있는 과학적 도구로써 기여가 가능할 것으로 판단된다.

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.

다이내믹 토픽 모델링의 의미적 시각화 방법론 (Semantic Visualization of Dynamic Topic Modeling)

  • 연진욱;부현경;김남규
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.131-154
    • /
    • 2022
  • 최근 방대한 양의 텍스트 데이터에 대한 분석을 통해 유용한 지식을 창출하는 시도가 꾸준히 증가하고 있으며, 특히 토픽 모델링(Topic Modeling)을 통해 다양한 분야의 여러 이슈를 발견하기 위한 연구가 활발히 이루어지고 있다. 초기의 토픽 모델링은 토픽의 발견 자체에 초점을 두었지만, 점차 시기의 변화에 따른 토픽의 변화를 고찰하는 방향으로 연구의 흐름이 진화하고 있다. 특히 토픽 자체의 내용, 즉 토픽을 구성하는 키워드의 변화를 수용한 다이내믹 토픽 모델링(Dynamic Topic Modeling)에 대한 관심이 높아지고 있지만, 다이내믹 토픽 모델링은 분석 결과의 직관적인 이해가 어렵고 키워드의 변화가 토픽의 의미에 미치는 영향을 나타내지 못한다는 한계를 갖는다. 본 논문에서는 이러한 한계를 극복하기 위해 다이내믹 토픽 모델링과 워드 임베딩(Word Embedding)을 활용하여 토픽의 변화 및 토픽 간 관계를 직관적으로 해석할 수 있는 방안을 제시한다. 구체적으로 본 연구에서는 다이내믹 토픽 모델링 결과로부터 각 시기별 토픽의 상위 키워드와 해당 키워드의 토픽 가중치를 도출하여 정규화하고, 사전 학습된 워드 임베딩 모델을 활용하여 각 토픽 키워드의 벡터를 추출한 후 각 토픽에 대해 키워드 벡터의 가중합을 산출하여 각 토픽의 의미를 벡터로 나타낸다. 또한 이렇게 도출된 각 토픽의 의미 벡터를 2차원 평면에 시각화하여 토픽의 변화 양상 및 토픽 간 관계를 표현하고 해석한다. 제안 방법론의 실무 적용 가능성을 평가하기 위해 DBpia에 2016년부터 2021년까지 공개된 논문 중 '인공지능' 관련 논문 1,847건에 대한 실험을 수행하였으며, 실험 결과 제안 방법론을 통해 다양한 토픽이 시간의 흐름에 따라 변화하는 양상을 직관적으로 파악할 수 있음을 확인하였다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.