• 제목/요약/키워드: 데이터 선별

검색결과 580건 처리시간 0.021초

통신 객체들 간의 친밀도 측정 (Proximity Measurement between Communication Objects)

  • 권정은;송지환;김명호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권4호
    • /
    • pp.275-279
    • /
    • 2009
  • 미국과 유럽 연합 등을 포함한 여러 나라에서 통신 서비스 제공자들에 게 통신 기록들을 일정 기간 보관하도록 의무화하고 있다. 저장된 통신 기록들은 범죄의 수사 및 감시, 기소 등의 목적으로 사용되지만, 그 크기가 매우 크다. 저장된 통신 기록으로부터 범죄자들과 용의자들의 관련성과 같은 정보를 효율적으로 추출하기 위해, 통신 기록의 대부분을 차지하는 불필요한 데이터를 제거해야 한다. 본 논문에서는 통신 기록들을 이용하여 통신 객체들 사이의 친밀도를 측정하는 방법을 제안한다. 주요 감시 대상자들이 주어졌을 때, 측정된 친밀도는 감시 대상자와의 친밀도 크기에 따른 데이터의 선별적인 분석 흑은 낮은 친밀도를 갖는 데이터의 제거 등에 사용될 수 있다. 실험 결과는 제안된 방법에 의해 계산된 친밀도 결과와 사람에 의해 계산된 결과가 서로 상관관계를 갖고 있음을 보여준다.

주의집중 및 복사 작용을 가진 Sequence-to-Sequence 순환신경망을 이용한 제목 생성 모델 (Title Generation Model for which Sequence-to-Sequence RNNs with Attention and Copying Mechanisms are used)

  • 이현구;김학수
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.674-679
    • /
    • 2017
  • 대용량의 텍스트 문서가 매일 만들어지는 빅데이터 환경에서 제목은 문서의 핵심 아이디어를 빠르게 집어내는데 매우 중요한 단서가 된다. 그러나 블로그 기사나 소셜 미디어 메시지와 같은 많은 종류의 문서들은 제목을 갖고 있지 않다. 본 논문에서는 주의집중 및 복사 작용을 가진 sequence-to-sequence 순환신경망을 사용한 제목 생성 모델을 제안한다. 제안 모델은 양방향 GRU(Gated Recurrent Unit) 네트워크에 기반 하여 입력 문장을 인코딩(encoding)하고, 입력 문장에서 자동 선별된 키워드와 함께 인코딩된 문장을 디코딩함으로써 제목 단어들을 생성한다. 93,631문서의 학습 데이터와 500문서의 평가 데이터를 가진 실험에서 주의집중 작용방법이 복사 작용방법보다 높은 어휘 일치율(ROUGE-1: 0.1935, ROUGE-2: 0.0364, ROUGE-L: 0.1555)을 보였고 사람이 정성평가한 지표는 복사 작용방법이 높은 성능을 보였다.

빅데이터와 인공지능을 활용한 직업설계 지원 플랫폼 모형에 관한 융합 연구 (Convergence Study on Model of Job Design Support Platform Using Big data and AI)

  • 노규성;이주연
    • 디지털융복합연구
    • /
    • 제14권7호
    • /
    • pp.167-174
    • /
    • 2016
  • 학교는 좋은 직장에 들어가기 위한 취업 준비의 장으로 전락하고, 학생들은 남들보다 많은 스팩(자격, 인증, 어학실력 등)을 쌓고 취업재수를 하는 기현상이 일상화되기에 이르렀다. 그러다 직업을 갖게 되면, 다행히 평생동안 한 직장을 다닌 경우도 있다. 그러나 많은 경우 적성과 맞지 않는 직장을 참고 다닌 사람도 있고, 참지 못하고 여러 직장을 떠도는 사람도 있다. 이와같이 직업에 불만족하는 원인 중의 하나는 직업과 적성이 맞지 않은 것이다. 물론 그간 많은 조직에서 적성검사를 실시하면서 진로설계 지도를 해왔다. 그러나 적절한 직업을 찾아주는 데에는 한계가 있었다. 이에 본 연구는 보다 합리적이고 과학적인 대안으로서 플랫폼 모형을 제시했다. 본 모형은 빅데이터와 인공지능을 활용하여 개인의 특성을 보다 잘 파악한 다음 다양한 직업 중 그 특성에 부합하는 직업을 선별적으로 제안하고 멘토의 컨설팅 및 현장 경험을 기반으로 적절한 직업대안을 선택하고 설계해나가도록 하는 9개 모듈(하위시스템)로 구성되어 있다.

Realtime Media Streaming Technique Based on Adaptive Weight in Hybrid CDN/P2P Architecture

  • Lee, Jun Pyo
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권3호
    • /
    • pp.1-7
    • /
    • 2021
  • 본 논문에서는 Hybrid CDN/P2P 구조를 기반으로 최적화된 미디어 데이터 탐색과 전송을 수행하며 사용자의 요청 가능성 예측을 통한 선별적 저장을 통해 사용자로의 끊김없는 데이터 전송과 불필요한 트래픽의 감소를 가능하게 한다. 또한 전송지연 및 패킷 손실의 가능성을 최소화하여 실시간으로 미디어를 활용할 수 있도록 하는 새로운 미디어 관리 기법을 제안한다. 이를 위해 각 미디어를 논리적인 세그먼트로 나누어 구성하고 각 세그먼트에 대한 가중치를 지속적으로 계산하며 계산된 가중치에 따라 세그먼트 데이터의 저장 여부를 결정하도록 한다. 또한 네트워크상에 산재되어 있는 컴퓨팅 노드들을 거리에 따라 지역적 그룹으로 지정하고 해당 그룹 내에서 저장 공간을 효율적으로 공유하고 활용하도록 한다. 제안하는 기법의 효율성을 검증하기 위해 수행된 실험을 통해 제안하는 방식이 기존의 방법들에 비해 비교적 좋은 성능 평가가 도출되는 것을 확인하였으며 이는 전송과정에서 발생되는 초기 지연시간 감소와 끊김 없는 전송 모두를 가능하게 할 수 있음을 알 수 있다.

경력단절여성을 위한 연령 및 학력별 취업률이 높은 교육직종 빅 데이터 시각화 분석 (Big Data Visualization Analysis of Education Occupations with High Employment Rates by Age and Educational Background for Career-Interrupted Women)

  • 이정원;이충호
    • 한국정보통신학회논문지
    • /
    • 제25권8호
    • /
    • pp.1019-1025
    • /
    • 2021
  • 경력단절여성들의 재취업을 위한 교육 훈련 등의 지원정책이 이루어지고 있으나, 효과적으로 취업과 연계되지 않고 있다. 또한, 고학력 경력단절여성의 경우에는 재취업을 위하여 이전 경력을 수정하거나 새로운 경력을 계획해야 하는 등 재진입이 어려운 상황이다. 기존 선행연구들에서는 취업기회가 높은 유망 직종 등 재취업을 위한 근본적인 문제를 해결하기 위한 연구가 부족하였다. 따라서 경력단절여성들을 위한 교육과정 개발 시 교육 대상자의 연령 및 학력별로 취업에 도움이 되는 교육직종을 선별할 필요성이 있다. 본 연구는 경력단절여성들의 직업훈련 교육 데이터를 활용하여 연령 및 학력별로 취업률이 높은 교육직종을 분석하였다.

빅데이터를 활용한 AI 기반 우선점검 대상현장 선정 모델 (AI-based Construction Site Prioritization for Safety Inspection Using Big Data)

  • 황윤호;지석호;이현승;정현준
    • 대한토목학회논문집
    • /
    • 제42권6호
    • /
    • pp.843-852
    • /
    • 2022
  • 지속적인 안전관리에도 불구하고 매년 건설업 근로자 사망율은 줄어들지 않는 추세다. 이에 따라 건설현장 사고를 예방하기 위한 다양한 연구가 진행 중이다. 본 논문에서는 건설공사 비용 50억원 미만의 건설현장 중 건설사고가 발생할 것으로 예상되는 현장을 우선적으로 선별하는 AI기반 우선점검대상 선정 모델을 개발하였다. 특히, 적용한 AI 알고리즘 중 분류분석에서 가장 뛰어난 성능(사고발생예측 AUC-ROC 90.48 %)을 보인 랜덤 포레스트를 모델 개발에 활용하였으며, 건설사고를 유발하는 주요한 요인으로는 공사비, 총공사일수, 공사실적평가액이 확인되었다. 본 연구를 통해 점검인력 효율화와 건설사고에 대한 선제적 대응의 결과로 8년간 약 917.7 % ROI(투자수익률)를 기대할 수 있다.

진보된 LOSA 방법론 개발에 관한 연구 (A Study on the Development of Advanced LOSA Method)

  • 최지헌
    • 한국항행학회논문지
    • /
    • 제27권4호
    • /
    • pp.351-355
    • /
    • 2023
  • 본 연구는 전통적인 LOSA방법론의 한계를 보완하여 진보된 형태(Advanced LOSA)의 필요성에서 시작된다. 진보된 형태의 LOSA는 기존의 AUDIT 적용의 단점을 해결하고 현재의 항공 안전 요구에 보다 효과적으로 대응하는 것을 말한다. Advanced LOSA 개발 연구를 하는 동기는 최근 발전된 항공운항 체계와 항공데이터의 분석이 과거보다 용이하여 활용가치가 증대되었기 때문이다. 과거의 LOSA는 주로 조종실 공간에서 조종행위를 수행하는 조종사들에게 초점을 맞추고 있다. 그러나 Advanced LOSA는 항공사의 전 분야로 확장하여 통합적으로 관리할 수 있다. 둘째, Advanced LOSA는 데이터 수집 및 분석 기술을 통합하여 미래 예측이 가능하다. 이를 통해 항공사는 예측된 위해 요인을 사전에 제거하여 항공안전을 유지하는 확고한 SMS 체계를 확립할 수 있다. 셋째, Advanced LOSA는 데이터 분석을 기반으로 세부 요인을 선별할 수 있으며 구체적인 해결 방법을 모색할 수 있다.

동시인용 분석 기반 국내 문헌정보학 분야의 지적구조에 관한 연구 (A Study on the Intellectual Structure of Domestic Library and Information Science Based on Co-Citation)

  • 이민희;곽승진
    • 한국문헌정보학회지
    • /
    • 제57권4호
    • /
    • pp.311-331
    • /
    • 2023
  • 본 연구는 2018년부터 2022년까지 5년간 국내 문헌정보학 분야의 주요 학술지 4종의 논문을 분석하여 지식 커뮤니케이션 특징을 탐구하고 중요한 연구 주제와 핵심 저자들을 분석하였다. 연구 방법으로 한국학술지인용색인(KCI)에서 국내 문헌정보학 분야의 핵심 학술지 4종의 5년간 발표된 논문을 수집하여 선별하여 논문의 저자 데이터와 참고문헌의 데이터를 추출하였다. Netminer를 사용하여 문헌동시인용 분석과 저자동시인용 분석을 실행하여 네트워크를 시각화하였다. 분석 결과, 저자 간의 동시인용 쌍을 도출할 수 있었으며, 연구자 간의 동시인용빈도 분석을 통해 학문 분야의 지적구조 분석에서 복수 저자를 분석 대상에 포함하는 것이 중요함을 확인하였다. 또한 키워드 분석을 통해 논문 주제 간의 상관성을 확인하였으며, 문헌정보학 관련 연구가 '도서관, 디지털, 이용자, 서비스, 데이터' 주제를 중심으로 이루어지고 있음을 알 수 있었다.

브라운필드 재생을 위한 협력적 계획 모델 연구 (Collaborative Planning Model for Brownfield Regeneration)

  • 김유진;패트릭 밀러
    • 한국조경학회지
    • /
    • 제43권3호
    • /
    • pp.92-100
    • /
    • 2015
  • 대부분의 일반적인 계획 과정과 달리, 브라운필드 계획은 잠재된 오염문제로 인한 기술적, 법률적 전문지식을 필요로 한다. 성공적으로 통합적인 의사결정에 관여하기 위해서는 조정된 협력적 계획 모델이 중요하다. 본 연구는 기존의 협력적 계획 접근방식이 브라운 필드 재생에 있어 상반된 분야의 전문가들 및 지역 주민들이 함께 일하며 적절하게 균형 잡힌 협력을 이루어 내기 위한 어려움들을 극복하는 데에 어떻게 효과적으로 적용될 수 있는지 알아보는 것을 목표로 한다. 의사소통적 계획이론 관련 문헌분석을 통해 적절한 지표들을 찾아내어, 네 단계의 브라운 필드 계획과정(대상지 선별, 평가, 정화, 디자인)에 적용시켜 본 후, 중요한 부분들을 짚어내었다. 본 연구의 결과, 크게 세 가지 점에 초점을 맞춘, 브라운 필드 재생에 적합한 협력적 계획 모델의 필요성이 인식되었다(1. 사회, 문화, 디자인 분야와 과학, 기술 분야의 전문가 간의 균형 잡힌 대화의 촉진, 2. 일반주민들과의 잠재적 오염 위험과 관련한 커뮤니케이션을 위한 적절한 방법개발, 3. 전문가 주도의 객관적 데이터와 주민 의견 중심의 주관적 데이터의 통합을 위한 의사결정지원 시스템의 마련).

관성센서를 이용한 버그균형검사 점수 분류 연구 (Berg Balance Scale Score Classification Study Using Inertial Sensor)

  • 홍상표;김연욱;조우형;좌경림;정한영;김규성;이상민
    • 재활복지공학회논문지
    • /
    • 제11권1호
    • /
    • pp.53-62
    • /
    • 2017
  • 본 논문에서는 균형평가도구 중 임상에서 가장 많이 사용되는 BBS(Berg Balance Scale)를 머신러닝 기법을 이용하여 점수 분류 정확도를 제시한다. 데이터취득은 Noraxon 시스템을 이용하여, 신체 8군데(왼쪽 오른쪽 발목, 왼쪽 오른쪽 엉덩이 위, 왼쪽 오른쪽 손목, 등(Back), 이마)에 관성센서를 부착하였다. 관성센서의 3축 가속도데이터를 기반으로 특징벡터 STFT(Short Time Fourier Transform), SAM(Signal Area Magnitude)를 추출하였다. 그 다음, BBS의 항목을 동작특성에 따라 정적인 동작(static movement)과 동적인 동작(dynamic movement)으로 나누었고, BBS의 각 항목에 대하여 점수에 영향이 있는 센서부착위치에 따라 특징벡터를 선별하였다. BBS의 항목마다 선별된 특징벡터는 GMM(Gaussian Mixture Model)을 이용하여 분류하였다. 실험대상자 40명에 대한 정확도 산출결과, 1번순으로 차례대로 55.5%, 72.2%, 87.5%, 50%, 35.1%, 62.5%, 43.3%, 58.6%, 60.7%, 33.3%, 44.8%, 89.2%, 51.8%, 85.1%의 분류 정확도를 확인하였다.